链载Ai

标题: 这个洞察力如何改变了我正在做的事情? [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 这个洞察力如何改变了我正在做的事情?

前言

经常有人问GraphRAG中知识图谱KG如何定义,是否还需要像以前一样构建复杂的知识图谱,实际应用中的确需要平衡投入产出。看了WhyHOW.AI的这篇文章,可以作为参考。

正文

在LLM出现之前,知识图谱主要用于类似数据字典的方式——在不同的数据孤立中强制执行语义结构,并聚合数据集以揭示隐藏的关系或进行关系挖掘。知识图谱用于捕捉概念和关系,这些概念和关系很有意思,尤其是在针对大型非结构化数据存储进行跟踪时。

一个例子是收集大量生物制药学术论文,并将所有这些信息放入知识图谱中,以便能够理解不同论文之间的隐藏关系,尤其是那些需要在多个文档之间建立关系的关系(即,论文1说X = Y,论文2说Y = Z。知识图以揭示X = Z的结果)

随着LLM的先进发展,我们应将知识图谱视为锐化语义焦点的工具,而不仅仅是数据的聚合器。由于LLM带有自己对语义的理解,因此产生的小规模图谱不需要完全完整。这意味着在许多情况下,创建一个完美描述世界的版本并不是必要的。LLM能够将不同的结构化数据片段结合起来,并在其之上添加自己的理解。因此,只有在LLM出现故障的情况下或为了确保防止产生幻觉时,数据的结构化才变得重要。

对于RAG来说,结构化数据的能力和引入这种逻辑是一种注入上下文的形式,将来也对代理编排很有用。

基于这些进展,我们将图谱开发分为三种类型:大型知识图谱、小型知识图谱和混合(大型和小型的组合)知识图谱

大型知识图谱

小型知识图谱

小型大型混合知识图谱

这个洞察力如何改变了我正在做的事情?



这引出了一个问题:


图谱结构可以组织您的数据,但对于我的特定用例,最小可行的图谱是什么?例如,以下内容可以在图谱结构中捕获:


连接到向量块的概念节点示例

文档层次结构的一个示例 "小图谱"


捕捉您的数据的更高层次表示可能对您的用例足够,就像结构化数据的表示不一定需要用于与FAQ Q&A集合进行查询的方式一样,或者更精细的数据表示(例如底层概念的图形表示)可能需要用于更复杂的问题。


捕捉每个概念和关系是否需要解决手头问题的问题。在许多情况下,这可能是必要的,但当我们与设计合作伙伴深入讨论时,情况通常并非如此。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5