国内企业知识类AI的落地多数是基于RAG的

寂静回声 · 发表于 2024-9-24 10:08:30

正如之前分析的那样，把互联网大厂和大模型六小虎的通用大模型私有化部署，成本十多亿。连接公有云又不放心，所以基于RAG是最合适的选择。除了互联网大厂和大模型六小虎的通用大模型，其它行业的企业所谓的自研大模型，根本不能叫基于大模型的AI，而是基于RAG的AI，非要套个大模型的名。

训练大模型通常需要大量的计算资源，包括高性能GPU/TPU集群，这不仅成本高昂，而且对基础设施的要求也很高。
数据集的需求量也极大，需要收集、清洗和标注大量数据，这同样是一项耗时且昂贵的工作。
需要深厚的人工智能理论基础，包括但不限于深度学习、自然语言处理等领域的知识。
对于模型的优化、调参以及防止过拟合等方面有较高的要求，需要丰富的实践经验。
模型训练时间长，迭代速度慢，这意味着在发现并修复问题上的效率较低。

而基于RAG就简单多了，相对于纯粹的大模型，RAG不需要如此庞大的训练数据集，因为它可以利用现有的知识库或搜索引擎来增强其生成能力。
由于可以快速地通过调整检索策略或更新知识库来改善模型的表现，因此RAG的迭代速度相对较快。RAG通过检索具体的文档片段来生成答案，这使得生成的结果具有较高的可解释性。用户可以查看模型引用的具体信息源。

从入职开始，基于大模型生成的数字员工可以对小哥进行个性化的一对一辅导培训，让小哥可以更快上手。在日常寄递业务中，快递小哥如果有任何的问题，比如物品能不能寄、是否建议保价、要怎么包装、不同时效的产品多少钱等，可以通过基于大模型打造的小哥服务中心询问得到答复。遇到大模型无法回答的问题，也可以转人工处理，大大提升了快递小哥的工作效率。

顺丰30多年来积累的内部数据，比如顺丰内部各系统非敏感知识。
对比通用模型或是商业模型，丰语大模型在物流场景上实现了全面超越，并且模型参数量仅有7B，属于当下流行的“小模型”

今年七月份，胜利油田鲁明公司青南采油管理区依托“胜小利”大模型搭建了油田首个管理区级专属知识库——“青出于南”专属知识库。截至目前，知识库已经收集了该管理区超过3000份资料，学习文件达到1700多个，知识点多达5万条，基层员工可以通过电脑端或移动端的办公助手进行查询，实现知识共享。

政务百晓生以“好友对话”的形式，运用自然语言大模型和检索增强技术，精准解答用户问题，实现了政策解读和业务知识问答的即时高效。政务服务智能帮办助手则紧贴群众需求，为政务服务工作人员提供全方位智能辅助。

问答系统多数是基于RAG的，RAG通过检索模块从大型文档库中获取相关信息，这使得模型能够访问最新的、丰富的外部知识，而不仅仅是依赖于预训练时学到的知识。许多企业使用RAG框架构建客服机器人，这些机器人可以从公司的知识库中检索相关信息，为客户提供准确的帮助。
RAG框架可以灵活地结合不同的检索策略和生成模型，这为模型的定制和优化提供了更多可能性。
但是RAG也有许多不足之处：
检索模块通常需要访问大规模的外部知识库，这不仅增加了存储需求，还可能增加推理过程中的计算开销。特别是在实时应用中，检索和生成的联合操作导致延迟增加。
RAG框架的有效性很大程度上依赖于外部知识库的质量和覆盖范围。如果知识库不够全面或者更新不及时，模型的性能可能会受到影响。此外，构建和维护高质量的知识库也是一项挑战。从上面几个已知的应用案例来看，要么就是企业内部数据其知识库根本不需要快速更新；要么就是政策解读和业务知识问答，构建和维护也不麻烦。共同特点是短时间内不会有太大变化，都是些流程知识。

		自动登录	找回密码
密码			立即注册

国内企业知识类AI的落地多数是基于RAG的

本帖子中包含更多资源