链载Ai

标题: Long2RAG:评估长上下文与长形式检索增强生成与关键点召回 [打印本页]

作者: 链载Ai    时间: 昨天 11:47
标题: Long2RAG:评估长上下文与长形式检索增强生成与关键点召回

检索增强生成(RAG)是解决大型语言模型(LLMs)固定知识限制的有效方法。然而,现有基准测试存在两个主要缺陷:缺乏反映检索文档特征的数据集和全面评估长形式响应的能力。为此,我们引入了Long2RAG基准和关键点召回(KPR)指标。Long2RAG包含280个问题,涵盖10个领域和8个类别每个问题关联5篇平均2444字的检索文档。KPR评估模型在生成响应时融入检索文档关键点的程度,提供更细致的评估。

Long2RAG核心方法

本文提出了Long2RAG基准和关键点召回率(KPR)指标,用于解决现有RAG系统评估方法的不足。具体来说:

  1. LONG2RAG基准
  1. 关键点召回率(KPR)指标

实验设计

  1. 数据收集






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5