链载Ai

标题: 微软PIKE-RAG开源:解锁专业领域知识理解与推理,RAG新突破! [打印本页]

作者: 链载Ai    时间: 昨天 17:57
标题: 微软PIKE-RAG开源:解锁专业领域知识理解与推理,RAG新突破!
近一年来,虽然检索增强生成(Retrieval Augmented Generation, RAG)系统在通过外部检索扩展大语言模型(LLMs)能力方面取得了一定的进展。但它主要依赖于文本检索和LLMs的理解能力,缺乏对多源数据知识的提取、理解和利用,尤其在专业知识较强的领域(如工业应用中)表现出显著的不足。
为了解决这一问题,微软亚洲研究院提出了 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)方法,一种”专注于提取、理解和应用领域特定知识,同时构建连贯的思考逻辑,以逐步引导 LLMs 获得准确的响应“的方法,旨在解决以下问题:


01

PIKE-RAG 框架

如下图所示,PIKE-RAG是一个多功能且可扩展的 RAG 框架。该框架主要由多个基本模块组成,包括:文件解析、知识提取、知识存储、知识检索、知识组织、以知识为中心的推理,以及任务分解与协调。通过这种模块化的架构设计,PIKE-RAG 能够根据不同的系统能力需求,通过调整主模块内的子模块,灵活搭建不同的 RAG 方法,从而应对实际场景中的复杂需求。

02

L0 到 L4级分阶段系统构建策略

PIKE-RAG 采用了层次化、分阶段的系统构建与实现策略,确保系统能逐步提升对复杂问题的处理能力。如下图所示:

它把系统构建分为 L0 到 L4(即知识库构建(L0)、事实型问题模块(L1)、链式推理问题模块(L2)、预测型问题模块(L3)、创造型问题模块(L4)),每个阶段都有不同的目标和挑战。

目前,该系统不论是在公开的基准测试中,还是在一些专业领域都取得了较好成绩。关于PIKE-RAG的更多信息请参考如下开源项目与论文:


GitHub链接:https://github.com/microsoft/PIKE-RAG论文链接:https://arxiv.org/abs/2501.11551(opensinnewtab)







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5