链载Ai

标题: 详解MS的GraphRAG的实现流程 [打印本页]

作者: 链载Ai    时间: 1 小时前
标题: 详解MS的GraphRAG的实现流程

严格说MS 的graphRAG 是vector RAG和graph RAG的合体

也有叫hybird RAG的,之前贝莱德资本还写过一个论文,不过它写的有点水,方法也是比较浮于表面,愿意看到的大家可以读一下,我就不在这里讲了

HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction (arxiv.org)

那我们看看MS的graphRAG是咋做的

流程图比较长,我们分块看,从1到6一共6个步骤,其实6可以不做

首先

Phase1

Phase 1 的任务是将输入的文档转换为 TextUnits(文本单元)。这些 TextUnits 是用于图谱抽取技术的基本文本块,并且可以作为知识项的来源引用。


具体步骤:

  1. 文档分块(Chunking):

TextUnit 是整个流程中的基本处理单元,后续的所有实体和关系提取、知识图谱的生成,都依赖于这些 TextUnits 及其对应的嵌入信息。


Phase2


在第二阶段,系统会对每个 TextUnit 进行分析,提取出图谱的基本元素:实体(Entities)关系(Relationships)声明(Claims)。这一阶段的目标是从文本中生成与知识图谱相关的实体和关系,并将这些元素汇总为结构化的表示。

具体步骤:

  1. 实体和关系抽取(Entity & Relationship Extraction)






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5