返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

RAG知识库优化之Rerank应用

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 09:29 |阅读模式 打印 上一主题 下一主题

      前面几篇文章介绍了最基本的RAG实现,也了解了RAG的基本原理。最基本的RAG 流程为用户Query问题,RAG应用在向量库查询出Context,然后将Query与 Context喂到LLM,LLM生成满足Query的Response答案。
      从这里可以存在三元组: Query、Context 和 Response,如要想进一步提升RAG的性能还可在Context(上下文)上做文章,目前得到的Context很可能与Query(问题)之间的相关度不高,通过Rerank可以对Context进行评分排序,去掉分数较低相关度较低的数据从而避免其对上下文信息的污染。下图为基本的RAG流程图;

      在未引入Rerank时可以看到从向量库中得到的上下文中包含了大量的问题相关度较低的信息,造成不相干信息对上下文的干扰。下图为未进行重排时的上下文;

未进行重排时

Rerank模型

      Rerank模型使用了bge-reranker-base模型和embedding模型不同,Reranker模型使用问题和文档作为输入,直接输出相似度而不是embedding。本文通过向Reranker输入查询和段落来获得相关性分数。Reranker是基于交叉熵损失进行优化的相关性得分不受特定范围的限制,bge-reranker-base适用于中英文的双语场景。如果有更多语言需求可使用最新发布的BGE Re-Ranker v2.0模型。
      Rerank模型可以在不牺牲准确性的情况下加速LLM的查询并可能提高准确率,Rerank通过从上下文中删除分数较低(相关性较低)的数据,Rerank通过重新排序上下文得以实现。下图为引入Rerank后的RAG流程图。

      在引入Rerank后可以看到上下文信息与问题的相关度提高了不少,不相干信息对上下文的干扰基本解决。下图为进行重排后的上下文;

引入Rerank后

Rerank模型使用

embedding_model_name = 'maidalun1020/bce-embedding-base_v1'
embedding_encode_kwargs = {
'normalize_embeddings': True
}
embed_model = HuggingFaceEmbeddings(
model_name="./bge-base-zh-v1.5",
encode_kwargs=embedding_encode_kwargs
)

reranker_args = {
'model_name': '/mnt/d/software/dev/gpt/bge-reranker-base',
'top_n': 5
}
reranker = BgeRerank(model_name='/mnt/d/software/dev/gpt/bge-reranker-base',top_n=3)

# init documents
db = Chroma(persist_directory='chroma_DB',embedding_function=embed_model)
retriever =db.as_retriever(search_type="similarity",search_kwargs={"k": 10})

compression_retriever = ContextualCompressionRetriever(
base_compressor=reranker, base_retriever=retriever
)

qa_chain = RetrievalQA.from_chain_type(llm, retriever=compression_retriever
, chain_type_kwargs={"prompt": PROMPT})

      引入Rerank模型后的retrieval引擎能够去除上下文不相关的污染数据、提供更精准的上下文信息。重排后(Rerank)精准的上下文不仅可减少了token的使用量进而还可能提高LLM推理速度与准确率。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ