StructRAG 框架概述
选择最佳结构类型至关重要,因为它直接影响后续模块的有效性。为了训练路由器,作者提出了一种基于具有偏好优化 (DPO) 算法的决策转换器的新方法,该方法遵循强化学习原则,不需要额外的奖励模型。router 的训练数据是通过 synthesizing-simulating-judging pipeline 生成的,该管道为各种任务和结构类型创建高质量的 synthetic preference 对。
分散知识结构器:一旦确定了最佳结构类型,分散知识结构器就会发挥作用。该模块负责提取散布在原始文档中的相关信息,并将其重建为所选格式的结构化知识。Structurizer 利用 LLM 强大的理解和生成功能来执行这项复杂的任务。
该利用器采用基于 LLM 的方法来促进问题分解、精确知识提取和最终答案推理。它首先根据结构化知识的整体描述,将原始问题分解为几个更简单的子问题。然后,它从结构化知识中提取每个子问题的精确知识。最后,utilizer 整合所有子问题及其相应的精确知识以生成最终答案。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |