RAG的本质是什么?
RAG的本质就是通过检索的方式从外部资料中获取数据,然后再通过提示词的方式把这些数据输入到大模型,使得大模型能够根据这些外部数据来回答或总结问题。
但大模型并不会关心你外部数据从哪里来,以及怎么来;而数据的来源这些都是RAG需要考虑的问题。
传统的RAG技术是基于传统的数据检索技术,以及新兴的向量相似度检索技术来获取外部数据;但有了智能体之后,智能体能够通过工具自主决策调用外部接口来获取数据。
其优点是灵活度更高,以搜索引擎为例;在RAG中其实也可以使用搜索引擎,那就是在RAG后端直接把用户的问题当做参数,调用搜索引擎的接口获取结果。
但这种方式灵活度不够高,比如说如果有些数据是企业内部数据,只能通过查询数据库或者接口调用的方式获取数据;这时应该怎么办?
通过智能体能够很好的实现这个功能,原因就在于智能体能够自主选择调用那个工具;而RAG却不行,RAG即使使用工具也只能把工具写死到代码中,并且面对多个工具RAG就彻底的无能为力了。
所以说这就是智能体比RAG更加强大的地方,RAG能做的智能体也能做,RAG不能做的智能体还能做;只不过从成本角度考虑来说,RAG技术更简单,难度也更低。
那智能体能那些事情,而RAG不能做呢?
这个就是前面说的智能体对环境的影响是双向的,而RAG对环境的影响是单向的。
比如说,大模型可以通过理解用户意图,去京东或淘宝上下单买东西,这个就是智能体对外部环境的影响;而很明显,这一点对RAG技术来说,是完全无法做到的。
所以说,RAG技术和智能体技术存在交集,但智能体技术应用范围更广,能力更强。
而这种智能体也有一个专业的名字——Agentic RAG。