链载Ai

标题: 图解RAG [打印本页]

作者: 链载Ai    时间: 昨天 11:35
标题: 图解RAG

RAG(Retrieval-Augmented Generation, 检索增强生成)是一种将信息检索与生成模型结合的方法,也是企业落地大模型应用最常见的方式。

什么是RAG

RAG接受用户输入,从一个大型文档集合中检索相关信息,然后将用户问题与检索信息发送到大模型,大模型生成最终答案。

RAG可以借助外部知识源,从而提升回答的准确性和信息丰富度,相当于为LLM配置了一个书架,虽然有些知识不知道,但可以参考相关书籍从而获取不错的答案。可以用来做文档问答系统、客服系统、企业内私有数据的问答系统。

工作原理

基础RAG分为三个阶段IndexingRetrievalGeneration:

  1. 将知识库拆分成固定大小的块
  2. 选择合适的Embedding模型将数据块向量化,存放在VectorDB(向量数据库)中







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5