【RAG】FoRAG：面向网络增强型长形式问答的事实性优化RAG - 链载Ai

一、解决问题

在基于网络的长形式问答（Web-enhanced Long-form Question Answering, LFQA）任务中，现有RAG在生成答案时存在的问题：

事实性不足：研究表明，现有系统生成的答案中只有大约一半的陈述能够完全得到检索到的参考资料的支持，这严重影响了这些系统的可信度。
清晰逻辑的缺失：与短答案的传统问答任务不同，LFQA任务中理想的答案往往需要多方面组织和整合信息，但现有的开源方法在生成答案时往往缺乏清晰的逻辑结构。

二、提纲增强RAG

提出提纲增强RAG，以改善长形式问题回答 LFQA 中生成答案的结构和质量。

2.1 Outline-Enhanced Generator

现有的开源方法在生成答案时，通常是直接将检索到的内容与原始查询拼接，然后使用特定的提示模板（prompt template）输入到生成模型中。这种方法生成的答案往往较短，缺乏清晰的逻辑结构。为了提高答案的组织性，提出了 "Outline-Enhanced Generator"，它包含以下两个阶段：

Outline Stage（提纲阶段）：
在此阶段，生成器首先使用提纲模板，根据用户查询和上下文生成答案的提纲。提纲模板引导大型语言模型（LLM）考虑哪种组织模式最适合当前问题，例如“因果关系”或“比较对比”。然后，LLM根据选定的组织模式输出提纲，为后续的扩展阶段做准备。
Expansion Stage（扩展阶段）：
基于前一阶段生成的提纲，LLM扩展每个要点，构建最终答案。模型被要求在包含查询、上下文和提纲的输入下，生成对问题的答案。

注：提纲增强阶段的生成器有SFT训练得到。

2.2 Outline-Enhanced Long-Form QA Dataset

为了支持 "Outline-Enhanced Generator" 的训练和评估，构建了两个大规模的提纲增强型LFQA数据集。这些数据集利用现有的WebCPM和WebGLM数据集的查询和相关段落，并通过GPT4模型应用提纲增强生成技术来收集提纲增强型答案。统计信息显示，使用提纲增强技术生成的答案比现有工作中的答案更长，其具有更强的逻辑结构。