链载Ai

标题: 一文搞懂什么是RAG [打印本页]

作者: 链载Ai    时间: 昨天 21:18
标题: 一文搞懂什么是RAG

想象一下,你面前坐着一位超级“学霸”。他博览群书,记忆力惊人,口才极佳,无论你问什么,他都能侃侃而谈,出口成章。

但这位学霸有两个致命缺点:第一,他读的书都停留在2024年(或者更早),世界之后发生的新鲜事他一概不知;第二,有时候为了显得自己很懂,他会“脑补”一些听起来很合理,但完全是瞎编的内容。

这就是当前很多大语言模型(如ChatGPT、文心一言等)的尴尬现状——知识可能过时,还爱“一本正经地胡说八道”(专业术语叫“幻觉”)。

那么,有没有办法让这位学霸变得更靠谱呢?有!这就是RAG(检索增强生成)要做的事情。

RAG:给“学霸”配一个“超级图书管理员”

RAG 的核心思路非常简单粗暴,但极其有效:不是让学霸死记硬背所有的知识(这太难且不现实),而是给他配备一个强大的“图书管理员”和一个巨大的“实时更新的图书馆”。我们不妨来看看它的工作过程:

1)你提问:当你向系统提出一个问题(比如:“2024年巴黎奥运会新增了哪些比赛项目?”)。

2)图书管理员出动:这个“图书管理员”(即“检索器”)立刻冲进庞大的“图书馆”(即你的“知识库”,里面可以包含公司文档、产品手册、最新新闻、专业论文、法律法规等等)。它利用高效的搜索技术(通常是基于语义相似度),快速找出与你的问题最相关的几段资料。

3)学霸查阅资料并作答:这位“学霸”(即大语言模型这个“生成器”)拿到了图书管理员递过来的相关资料。它不再仅仅依靠自己脑子里可能过时或不完整的记忆,而是仔细阅读这些最新的、具体的资料,然后结合自己强大的理解和语言能力,组织出一个准确、有依据的答案回答你。

4)你得到答案:你不仅得到了答案,通常还能知道这个答案是参考了哪些资料(来源可追溯),大大增加了可信度。

RAG 的核心原理:信息检索 + 文本生成的强强联合

  1. 检索(Retrieval):






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5