Salesforce AI Research 推出新一代 RAG 模型：SFR-RAG

显示全部楼层

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 13px;margin-right: 8px;margin-bottom: 1.5em;margin-left: 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">在人工智能领域，生成式 AI 持续受到关注，特别是在检索增强生成（Retrieval Augmented Generation，简称 RAG）方面。Salesforce AI Research 最近发布了他们的最新研究成果——SFR-RAG，这是一个90亿参数的语言模型，专门针对现实世界中的 RAG 应用和相关任务进行了优化。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 1.1em;font-weight: bold;margin-top: 2em;margin-right: 8px;margin-bottom: 0.75em;padding-left: 8px;border-left: 3px solid rgb(250, 81, 81);color: rgb(63, 63, 63);">什么是 RAG？

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 13px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">RAG 是一种结合了检索和生成的技术，通常应用于问答系统。它通过检索数据源中的外部上下文信息，并生成基于这些上下文线索的答案。RAG 包含一个检索器，用于检索相关知识，以及一个大型语言模型（LLM），用于生成答案或识别上下文内容是否无关或矛盾。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 1.1em;font-weight: bold;margin-top: 2em;margin-right: 8px;margin-bottom: 0.75em;padding-left: 8px;border-left: 3px solid rgb(250, 81, 81);color: rgb(63, 63, 63);">SFR-RAG 的特点

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 13px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">SFR-RAG 强调在真实世界的 RAG 用例中的可靠性、精确性和忠实性。它在以下方面表现出色：

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 13px;padding-left: 1em;list-style: circle;color: rgb(63, 63, 63);">•精确的事实知识提取：能够准确提取事实信息。•区分相关与干扰上下文：在众多信息中识别出与问题相关的上下文。•适当引用来源：在提供答案时，能够引用适当的来源。•复杂的多步骤推理：能够处理多个上下文的复杂推理。•一致的格式遵循：遵循一致的格式输出。•避免在无法回答的问题上产生幻觉：在没有答案的情况下，避免生成不真实的内容。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 1.1em;font-weight: bold;margin-top: 2em;margin-right: 8px;margin-bottom: 0.75em;padding-left: 8px;border-left: 3px solid rgb(250, 81, 81);color: rgb(63, 63, 63);">ContextualBench 评估套件

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 13px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">为了评估 LLMs 在与 RAG 相关的上下文问答任务中的表现，Salesforce AI Research 发布了 ContextualBench，这是一个包含7个上下文基准测试的评估套件。SFR-RAG 在其中的3个基准测试中达到了最先进的水平，并且在参数数量上远远少于 Command-R+。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 1.1em;font-weight: bold;margin-top: 2em;margin-right: 8px;margin-bottom: 0.75em;padding-left: 8px;border-left: 3px solid rgb(250, 81, 81);color: rgb(63, 63, 63);">新的聊天模板

SFR-RAG 引入了一个新的聊天模板，增加了两个可选角色：Thought 和 Observation。这种设计解决了现有聊天模板中的一些问题，如安全性、隐私问题和应用可靠性。

•Thought：LLM 在这里可以自由地进行自我对话、执行操作或推理。•Observation：外部上下文信息存放在这里。

这种设计使得调整 LLM 更加简单，开发者可以根据用例的需要显示或隐藏用户的思想和检索到的文档，并可靠地提取内容。

SFR-RAG 的性能

SFR-RAG 在 ContextualBench 套件中的7个基准测试中的3个中达到了最先进的水平，并且在所有类别中都表现出对上下文信息的忠实性，即使在事实被改变或变得反直觉的情况下也是如此。

SFR-RAG的应用场景

•客户服务：作为聊天机器人，提供基于上下文的准确回答，提高客户满意度。•知识问答：在问答系统（如TriviaQA、HotpotQA）中，提供基于复杂上下文的详细回答。•内容创作：辅助撰写文章、报告或营销材料，确保内容的准确性和相关性。•教育辅导：作为教学辅助工具，提供个性化的学习建议和答案解析。•市场研究：分析市场数据和趋势，生成基于最新信息的报告。•法律咨询：提供基于法律文档和案例的咨询，帮助解读法律条文。•医疗咨询：辅助医生和患者理解复杂的医疗信息，提供基于最新研究的建议。