链载Ai

标题: 支付宝 清华FoRAG:用创作的思路解决RAG生成逻辑问题! [打印本页]

作者: 链载Ai    时间: 昨天 10:31
标题: 支付宝 清华FoRAG:用创作的思路解决RAG生成逻辑问题!

RAG通过结合LLMs和检索器,利用搜索引擎增强了长篇问答(Long-form Question Answering)的质量。尽管存在多种开源方法和商业系统,如Bing Chat,但生成的长形答案中存在两个关键问题:事实性不足和逻辑清晰度不够。

为了解决这些问题,提出了一种新颖的大纲增强生成器(outline-enhanced generator),以实现多面性答案的清晰逻辑生成,并构建了两个相应的数据集。接着,提出了一种基于精心设计的事实性优化方法,该方法采用双细粒度的RLHF(Reinforcement Learning from Human Feedback)框架,包含不同粒度级别的自动评估和奖励建模。

展示了用于网络增强型长篇问答任务(LFQA)的LLM输入(左上),现有的生成器(左下),大纲增强生成器(中间)以及我们双细粒度的事实性优化方法()。在生成长答案之前,大纲增强生成器首先起草一个组织模式和大纲,以促进生成的清晰逻辑。双细粒度的RLHF通过在两个核心步骤中纳入细粒度设计来优化事实性,即事实性评估和奖励建模,在每个步骤上提出了多个粒度级别的方法。

大纲增强生成器

    ingFang SC", miui, "Hiragino Sans GB", "Microsoft Yahei", sans-serif;font-size: 14px;letter-spacing: 0.5px;text-align: start;text-wrap: wrap;background-color: rgb(49, 49, 58);" class="list-paddingleft-1">
  1. 大纲增强生成器(Outline-Enhanced Generator):提出了一种新的两阶段生成技术,首先生成一个组织模式和大纲,以提高生成答案的逻辑清晰度。在第一阶段,生成器使用大纲模板,根据用户查询和上下文草拟答案大纲。第二阶段基于生成的大纲扩展每个观点,构建最终答案。

  2. 两阶段生成过程:

新颖的事实性优化方法:

    ingFang SC", miui, "Hiragino Sans GB", "Microsoft Yahei", sans-serif;font-size: 14px;letter-spacing: 0.5px;text-align: start;text-wrap: wrap;background-color: rgb(49, 49, 58);" class="list-paddingleft-1">
  1. 直接应用RLHF的困难:直接将传统的基于人类反馈的强化学习(RLHF)应用于事实性优化所面临的两个主要困难:人工标注事实性标签的成本高昂,以及整体性奖励(holistic reward)提供的稀疏训练信号,这在长答案中尤为突出。

  2. 双细粒度RLHF框架:为了克服这些困难,提出了一个双细粒度的RLHF框架。该框架通过在事实性评估和奖励建模两个核心步骤中引入细粒度设计,提供了更密集的奖励信号。

  3. 细粒度评估:三种评估粒度:






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5