链载Ai

标题: DeepRAG:智能检索 MDP,精准秒杀事实幻觉,准确率飙升21.99%! [打印本页]

作者: 链载Ai    时间: 前天 17:22
标题: DeepRAG:智能检索 MDP,精准秒杀事实幻觉,准确率飙升21.99%!

LLMs 在推理过程中存在的事实幻觉问题,尤其是在时间性、准确性和参数知识的覆盖范围方面。此外,将推理与 RAG 结合仍然具有挑战性,主要由于任务分解不有效和冗余检索,这可能会引入噪声并降低响应质量。本文提出了DeepRAG,这是一个将检索增强型推理建模为马尔可夫决策过程(Markov Decision Process,MDP)的框架,能够实现策略性和适应性的检索。通过迭代地分解查询,DeepRAG动态地决定在每一步是检索外部知识还是依赖于参数化推理。实验表明,DeepRAG 在提高检索效率的同时,将回答的准确性提高了21.99%,证明了其在优化检索增强型推理方面的有效性。

点关注图片不迷路

DeepRAG 核心方法

DeepRAG,用于解决LLMs在推理过程中存在的事实幻觉问题,并提出了一种新的框架来增强检索增强生成中的推理能力。将检索增强推理建模为马尔可夫决策过程(MDP),通过迭代分解查询,动态决定在每一步是检索外部知识还是依赖参数化推理。

  1. 马尔可夫决策过程(MDP)建模:首先,将问题分解、原子决策和最终答案生成过程形式化为一个MDP,定义如下:(S, A, P, R),表示状态集合,表示动作集合,表示转移动态,表示奖励函数。状态表示原始问题的部分解,动作包括终止决策和原子决策。
DeepRAG 框架:包括三个步骤<img src=1)二叉树搜索,(2)模仿学习,(3)校准链。给定一个数据集,我们首先使用二叉树搜索来合成用于模仿学习的数据,使模型能够学习检索模式。随后,我们使用二叉树搜索来构建偏好数据,以进一步校准大型语言模型对其知识边界的认知。" class="rich_pages wxw-img" style="display: block;margin: 0px auto;max-width: 100%;border: 3px none rgba(0, 0, 0, 0.4);border-radius: 8px;object-fit: fill;box-shadow: rgb(153, 153, 153) 2px 4px 8px 0px;height: auto !important;" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=103207&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy9BODF4UnBiNTR4NzJpYVI2NWdDYU44RGMzYWdpY3NrWVZLTkVpY2paRjNRaWFqY3h4SHZEVWh0emY3ampTdUhEbWxlQmFiN3U3RThNYnlhT1JWckJGSHU3bkEvNjQwP3d4X2ZtdD1wbmcmYW1w;from=appmsg"/>
  1. 二叉树搜索:为了构建推理路径,实现了一个二叉树搜索方法,探索了基于参数知识或外部知识库的不同回答策略。每个子查询都生成两个回答策略:直接利用参数知识或检索外部文档。

  2. 模仿学习:通过二叉树搜索合成数据,提取最小检索成本的推理过程进行模仿学习。具体算法如下:






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5