链载Ai

标题: RAG技术的三大范式和技术演进 [打印本页]

作者: 链载Ai    时间: 昨天 21:01
标题: RAG技术的三大范式和技术演进

前面的文章中,为大家介绍过大模型领域的核心技术:RAG(Retrieval-Augmented Generation),即检索增强生成

大模型的技术原理是不断预测下一个Token,且每一个已经生成的Token都会影响下一个Token的生成。简单来说,大模型就是一个概率预测机器,同样的Prompt会产生不同的答案,这就是所谓的信息幻觉问题。

换个容易理解的说法,针对同一个或同一组Prompt,大模型的结果不具备幂等性。

从2022年底ChatGPT横空出世以来,大模型的信息幻觉(生成错误信息)、知识过时、推理过程不透明等问题,一直困扰着业内各方技术人员,直至RAG技术出现,才算缓解了这个难题。

2023年12月18日,多位知名学者联合发表了一篇关于RAG技术的综述文章《Retrieval-Augmented Generation for Large Language Models: A Survey》,对RAG的三大范式演进(基础RAG、高级RAG、模块化RAG)和检索、生成与增强三大核心组件的关键技术进行了深入探讨。文中还提出了RAG的评估框架与未来研究方向,以及RAG与大模型微调、提示词工程的互补性和多模态能力扩展的潜力。

原文链接:https://arxiv.org/pdf/2312.10997

如果无法访问,可以点击这个链接:https://metaso.cn/s/LlcV6lu

下面是我翻译并总结的这篇文章的核心内容,仅供参考。



一、RAG的三大技术范式

1、基础RAG(Naive RAG)

2、高级RAG(Advanced RAG)

3、模块化RAG(Modular RAG)


二、RAG的核心技术组件

1、检索优化

2、生成增强

3、增强策略


三、评估方法与挑战

1、评估指标

2、主要挑战


四、未来研究方向


五、关键术语中英对照表







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5