链载Ai

标题: RAG 工程实践优化点及方法总结 [打印本页]

作者: 链载Ai    时间: 昨天 12:03
标题: RAG 工程实践优化点及方法总结

一、优化索引结构

1.1 优化被检索的embedding

1.2 优化 query 的 chunk 大小

1.3 结合不同粒度信息进行混合检索

二、混合检索及 chunk 检索效果不佳时的优化策略

  1. 分析知识库中答案情况:当混合检索及基于不同大小 chunk 的检索效果不理想时,首先要确定知识库中是否存在答案。如果存在答案但未被检索出来,可能是答案在知识库中的分割方式存在问题。
  2. 利用小模型进行上下句预测:可以结合一些小模型(如 BERT)进行上下句预测,尝试将被错误分割开的答案重新组合或定位,提高答案的完整性和可检索性。
  3. 根据 query 和 doc 特点优化检索顺序:分析 query 和 doc 的特点,判断其相关性主要是基于字相关还是语义相关。一般建议先使用推荐系统经典的 ES(Elasticsearch)进行召回,获取较为广泛的相关文档,然后再使用模型进行精排,筛选出最相关的文档。

三、通过 rerank 提升 RAG 效果的方案

  1. rerank 的背景与目标
    在检索过程中,前 K 个结果虽然都具有相关性,但最相关的信息可能不在排名靠前的位置。rerank 的目的就是将最相关的信息重新定位到更合适的排名位置,提高模型处理的准确性和效率。
  2. 具体 rerank 思路与方法

四、总结

RAG 工程在实际应用中需要根据具体情况不断优化,同时,实际优化过程中应紧密结合具体 case,灵活运用上述方法,以达到最佳效果。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5