链载Ai

标题: RAG创始人关于RAG Agent的10个思考(上) [打印本页]

作者: 链载Ai    时间: 昨天 18:18
标题: RAG创始人关于RAG Agent的10个思考(上)

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;">现在AI应用落地常用的方式是RAG(Retrieval-Augmented Generation),即检索增强生成。和Agent结合更是让RAG的应用场景更为广泛。很多企业包括我自己都在尝试使用它来提高AI在企业中落地的效果。最近RAG的创始人Douwe Kiela 在LinkedIn上分享了他对RAG Agent在企业中的10个教训,对我自己也很有启发。今天结合他的视频内容和我自己的实践体会来分享一下。

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;font-weight: 700;line-height: 1.1;color: rgb(64, 64, 64);margin: 30px 0px 10px;font-size: 30px;caret-color: rgb(64, 64, 64);">1.更好的 LLM 不是(唯一)答案:

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;">LLM 只是整个 AI 系统(特别是 RAG 系统,包括提取、检索、生成、联合优化)的一小部分(约 20%)。一个优秀的 RAG 系统配合普通的 LLM,效果可能优于一个顶尖 LLM 配合糟糕的 RAG 系统。关键是关注系统而非孤立的模型。

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;font-weight: 700;line-height: 1.1;color: rgb(64, 64, 64);margin: 30px 0px 10px;font-size: 24px;caret-color: rgb(64, 64, 64);">实践分享

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;">我曾经参与优化过一个基于RAG的知识库问答系统。当时的情况是,团队做了测试,使用GPT-4的效果会好于GPT-3.5的效果,但是回答内容的准确率仍然低于50%。后来做了一些调整,准确率提升到80%以上:

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;">在使用上述方法后,我们替换了GPT-3.5 Turbo,以及后续发布的成本更低的GPT-4o mini。虽然模型不是最新的最高级的版本,但是综合效果却是最好的。也就是Douwe Kiela所说的,RAG系统的整体效果比单一模型的效果更重要。

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;font-weight: 700;line-height: 1.1;color: rgb(64, 64, 64);margin: 30px 0px 10px;font-size: 30px;caret-color: rgb(64, 64, 64);">2.专业知识是你的燃料:

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;">企业内部积累的专业知识和机构知识(通常存在于文档和数据中)是驱动 AI 产生价值的核心燃料。必须设法解锁这些专业知识。

ingFang SC", "Hiragino Sans GB", STHeiti, "Microsoft YaHei", "Microsoft JhengHei", "Source Han Sans SC", "Noto Sans CJK SC", "Source Han Sans CN", "Noto Sans SC", "Source Han Sans TC", "Noto Sans CJK TC", "WenQuanYi Micro Hei", SimSun, sans-serif;font-weight: 700;line-height: 1.1;color: rgb(64, 64, 64);margin: 30px 0px 10px;font-size: 24px;caret-color: rgb(64, 64, 64);">实践分享

每个企业都有丰富的所在领域的领域知识,有一个项目是一个学校做一个AI私人教师,给每个学生提供个性化的学习方案。这个学校准备的RAG的数据,是他们自己的材料和特有的的教学方法,这也是他们和其他同行的主要区别,也是他们的行业壁垒。AI机器人基于这些数据的构建才会有能力解决这个领域的问题。而通用大模型是很难获得这么特殊的领域知识的。

3.企业规模是你的护城河:

企业的核心竞争力在于其独特的数据。真正的挑战在于大规模地利用这些数据,让 AI 能够处理大规模、甚至“嘈杂”的真实数据。成功做到这一点,就能构建竞争壁垒。

实践分享

我经历过的项目中,最开始确实有大量和复杂的数据清洗过程,为了给AI提供高质量的数据,提高RAG的召回率和质量。不过随着从试点到推广阶段,你会发现企业大量的数据都是带有“噪音”的。如果都要进行数据清洗,工作量和效率上都是不可能完成的任务。所以与其利用大量的时间做数据清洗,倒不如想办法让AI能够接受这些带有”噪音“的已存在的数据是更契合实际的。

4.试点与生产之间的鸿沟总是比预想的要大:

建立小规模试点相对容易(少量文档、用户、单一场景、低风险),但将其扩展到生产环境则面临巨大挑战(海量文档、大量用户、多场景、高安全风险、SLA 要求等)。

实践分享

还是企业内部知识库的AI项目,少量文档20~50个50K~100K大小文档的内容作为知识库的基础数据,召回率以及效率都很好。不过实际企业中的数据量和单文件大小都存在很大差异。铺开后先不考虑RAG的召回率和准确率。就说索引和召回的速度都成了问题。所以在试点阶段,需要考虑到后续的规模化的系统设计和应对方案,而不是只关注眼前的体量。但考虑多少需要基于实际项目来平衡。

5.速度比完美更重要:

不要追求一开始就完美。应尽早将(哪怕不完美的)系统交给真实用户使用,获取反馈并快速迭代。通过迭代“爬山”达到目标,而不是试图一次性设计出完美方案。

实践分享

这一点和第4点有冲突的感觉。如何把握快速且完美之间的平衡呢?还是分享一个实际项目中的情况:







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5