链载Ai

标题: 从朴素 RAG 到 Agentic RAG的五阶段:静态线性流程升级为智能自主系统 [打印本页]

作者: 链载Ai    时间: 昨天 22:35
标题: 从朴素 RAG 到 Agentic RAG的五阶段:静态线性流程升级为智能自主系统

大型语言模型(LLM)的爆发式发展,让AI具备了类人文本生成与复杂语言理解能力,但知识静态化与幻觉生成两大痛点始终制约其落地——LLM的知识局限于训练数据截止时间,且常生成无事实依据的内容。检索增强生成(Retrieval-Augmented Generation, RAG)技术应运而生,通过“外部知识检索+LLM生成”的融合模式,为LLM装上可更新的外挂知识库,成为解决上述痛点的核心方案。

RAG的演进并非一蹴而就,而是伴随LLM能力升级与行业需求深化,逐步从简单的“检索-生成”流水线,发展为具备动态决策、多模态处理、智能协作能力的复杂系统。本文基于《GENTIC RETRIEVAL-AUGMENTED GENERATION: A SURVEY ON AgentIC RAG》论文将RAG的发展划分为朴素 RAG、高级 RAG、模块化 RAG、图 RAG、Agentic RAG五个阶段,清晰呈现了从静态线性流程到智能自主系统的技术跃迁(文末附论文下载)。

第一阶段:朴素 RAG(Naive RAG)

朴素 RAG重点关注基于关键词的检索和静态数据集。这些系统依赖于简单的基于关键词的检索技术(例如 TF-IDF 和 BM25),从静态数据集中获取文档,然后将检索到的文档用于增强语言模型的生成能力。

朴素 RAG 是 RAG 技术的最简实现形态,采用严格的线性三步流程,所有后续演进均以此为基础:

作为奠基性架构,朴素 RAG 的短板在于:

第二阶段:高级 RAG(Advanced RAG)

随着 RAG 在知识密集型任务中应用普及,朴素 RAG 的检索质量决定生成效果问题凸显。2021-2023 年间,微软、谷歌等机构通过碎片化技术创新,逐步形成高级 RAG 体系,核心目标是通过全流程优化提升检索精度与上下文质量。

高级 RAG 克服了朴素 RAG 的局限性,融合了语义理解和增强的检索技术。下图展示了高级 RAG 中语义增强的检索机制以及迭代式、上下文感知的流程。这些系统利用密集检索模型和神经排序算法来提高检索精度。高级 RAG 的主要功能包括:

高级 RAG 在朴素 RAG 基础上新增预检索处理(Pre-Retrieval) 与后检索处理(Post-Retrieval) 两大模块,关键创新包括:

高级 RAG 的核心进步是从被动检索到主动优化,但其仍存在局限:

第三阶段:模块化 RAG(Modular RAG)

高级 RAG 的优化技术叠加导致系统复杂度激增,传统线性架构难以维护与扩展。2024 年 Yunfan Gao 等人在《Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks》中首次系统化提出模块化架构,核心思路是将 RAG 拆解为可插拔、可复用的独立模块。

模块化 RAG 强调灵活性和定制化,将检索和生成流程分解为独立的、可重用的组件,从而实现特定领域的优化和任务适应性。下图展示了模块化架构,重点介绍了混合检索策略、可组合的流程以及外部工具集成。

模块化 RAG 的主要创新点包括:

模块化 RAG的核心优势与局限:

第四阶段:图 RAG(Graph RAG)

前三个阶段的 RAG 均以 “文本块” 为核心处理单元,难以捕捉实体间的复杂关联,在医疗诊断、法律推理等任务中表现不足。图 RAG 的诞生旨在通过整合知识图谱的结构化优势,强化 RAG 的多跳推理与关系理解能力。

Graph RAG 被定义为文本检索与图检索的深度融合架构,其特点在于:

然而,Graph RAG 也存在一些局限性:

第五阶段:Agentic RAG(智能体驱动 RAG)

论文将 Agentic RAG 定位为 “RAG 技术的终极演进形态”,其诞生源于前四阶段架构的共同瓶颈:缺乏自主感知、规划与优化能力。面对时序分析、跨领域研究等动态任务,静态架构无法应对不确定性。

Agentic RAG 的本质是将自主智能体嵌入 RAG 架构,每个智能体包含四大基础模块:

Agentic RAG的四大核心能力:

尽管 Agentic RAG 具备许多优势,但它仍然面临一些挑战:

表:RAG 演进的五个阶段

小结

RAG 的五阶段演进,本质是解决 LLM 知识局限的需求驱动下,技术从简单工具向智能系统的升级过程。Agentic RAG 也并非要替代前序阶段架构,而是通过智能体调度实现按需选用最优模块组合,例如简单查询调用朴素 RAG 流程,复杂推理使用图 RAG 或者 Agentic RAG,逐步实现更精准、更高效、更智能、更贴合行业需求的目标。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5