返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

Dify 外部知识库最佳实践:基于 InfraNodus 扩展 RAG 图谱能力

[复制链接]
链载Ai 显示全部楼层 发表于 3 小时前 |阅读模式 打印 上一主题 下一主题

dify 的外部知识库功能支持对接第三方知识系统,无需迁移数据即可使用专业的检索技术。本文将介绍如何把 InfraNodus(一个内置 GraphRAG 能力的文本网络分析工具)接入 Dify 工作流。


为什么选择 InfraNodus?


传统 RAG 依赖向量相似度搜索,处理具体问题时表现不错,但面对宽泛的问题往往力不从心。比如用户问“这个是用来做什么的?”,标准 RAG 很可能检索不到任何内容,或者返回一堆不相关的结果。


GraphRAG 的思路不同:它不仅考虑语义相似度,还会利用知识图谱中概念之间的结构关系进行检索。即使用户的问题比较笼统,系统仍然可以基于图谱结构返回相关主题聚类中的上下文信息。


将 InfraNodus 接入 Dify 有以下几个优势:



检索质量更高:GraphRAG 不仅返回语义匹配的内容,还会从知识图谱的主题聚类中提取结构相关的上下文



知识库可视化:InfraNodus 提供交互式图谱界面,可以直观查看主题分布、概念关联以及内容缺口(content gaps)



数据导入灵活:支持 PDF、网站、YouTube 视频、纯文本、自定义本体等多种来源



跨平台复用:同一个 InfraNodus 图谱可以同时服务于不同的 Dify 工作流、MCP server 或直接 API 调用,不会被锁定在单一平台


整体流程


四个步骤完成配置:

  1. 在 InfraNodus 中基于你的内容创建知识图谱

https://infranodus.com/


  1. 获取 InfraNodus API key

https://infranodus.com/api-access


  1. 在 Dify 知识库中配置外部知识库 API,指向 InfraNodus 端点:

https://infranodus.com/api/v1/dify


  1. 在 Dify 工作流中通过知识检索节点调用该外部知识库


GraphRAG 检索机制


当用户查询到达知识检索节点时,InfraNodus 的 GraphRAG 系统会执行以下流程:

  1. 定位图谱中与查询词相关的区域

  2. 提取相关概念之间的关系数据(GraphRAG 部分)

  3. 同时通过传统 RAG 进行相似度匹配作为补充

  4. 返回最相关主题聚类中的上下文语句

这种混合检索的优势在于:即使用户提问比较模糊,系统也能基于图谱结构给出有意义的上下文,而不是返回空结果。


此外,向图谱中添加新数据非常方便,可以通过文本编辑器直接添加,也可以使用导入功能批量导入文件、URL、Google 搜索结果等。


01


在 InfraNodus 中创建知识图谱

在接入 Dify 之前,需要先准备好一个 InfraNodus 图谱。


创建图谱

访问infranodus.com/apps,根据数据来源选择导入方式:

  • 文本编辑器:手动输入内容

  • 文件导入:上传 PDF 或其他文档

  • URL 抓取:爬取网页内容

  • YouTube 导入:提取视频字幕

  • AI 本体生成器:通过 prompt 自动生成结构化知(infranodus.com/import/ai-ontologies)

例如,使用本体生成器输入以下 prompt:

create an ontology for various body metrics that can be used for longevity

即可生成一个结构化的知识图谱,作为外部知识库的基础。当然,从 PDF 导入或网站抓取同样可行。


优化图谱质量

图谱创建完成后,建议检查一下连通性。InfraNodus 会高亮显示连接薄弱的主题聚类,也就是概念之间缺少关联的区域。可以通过以下方式优化:

  • 选中孤立的节点或主题

  • 使用内置 AI 模块生成桥接语句

  • 将这些语句添加到图谱中,增强结构完整性

图谱连通性越好,检索时相关概念就越容易被一起召回。

02


在 Dify 中配置外部知识库连接

图谱准备就绪后,开始配置 Dify 端。

创建外部知识库 API

1. 打开 Dify 实例(云端或自部署均可),进入知识库页面

2. 点击「连接外部知识库」

3. 填写名称和描述

4. 点击「+ 新建外部知识库 API」

  1. 填写 API 配置信息:

  • 名称:便于识别的标识

  • API 端点:https://infranodus.com/api/v1/dify

  • API Key:在infranodus.com/api-access生成

该 API 连接创建后可复用,指向不同的 InfraNodus 图谱。


指定目标图谱

API 连接建立后,需要在外部知识库 ID 字段中填入 InfraNodus 图谱名称。

重要提示:这一步需要确认两件事,Dify 选择的确实是你刚创建的外部知识库 API,且图谱名称与目标图谱一致。Dify 有时会默认选择其他 API 配置,务必检查确认。


配置检索参数

调整检索设置以优化效果:

  • Top K:建议设为 10,获取充足的上下文

  • Score Threshold:建议设为 0.3

为什么设置 0.3?InfraNodus 不仅返回直接匹配的语句,还会附带每个相关主题聚类的代表性语句作为背景信息。这些上下文语句的相似度分数通常在 0.3 左右,降低阈值可以让这些有价值的信息通过。


如果只需要精确匹配的结果,保持默认值0.5即可。


03

测试与部署工作流

验证连接

正式构建工作流之前,先验证知识库是否正常工作:

1. 进入 Dify 知识库页面

2. 刷新页面(Dify 有时不会立即显示新创建的外部知识库)

3. 输入测试查询,确认能够从 InfraNodus 图谱中检索到相关内容

构建基础工作流

创建一个使用外部知识库的工作流:

1. 进入 Studio > 从空白创建 > AI 工作流

2. 添加知识检索节点:

  • 点击左侧 + 按钮

  • 选择「知识检索」

  • 在设置 > 知识库中点击 +,选择刚添加的外部知识库

3. 按以下顺序连接节点:

  • 用户输入 → 接收用户查询

  • 知识检索 → 调用 InfraNodus,返回 GraphRAG + RAG 结果

  • LLM → 使用检索到的内容作为上下文生成回复

  • 回答 → 将最终结果返回给用户

使用现成模板

如需快速上手,可直接从 InfraNodus GitHub 仓库导入工作流模板:

github.com/infranodus/dify-infranodus


日常维护

这套架构的维护相对简单:

  • 内容更新:直接在 InfraNodus 中添加,支持编辑器输入或批量导入

  • 自动同步:可配置定时导入任务,支持网站、RSS 等来源

  • 内容审计:通过图谱可视化快速识别覆盖不足的区域

  • 无需重复上传:InfraNodus 中的更新会自动反映到 Dify 查询结果中

小结


将 InfraNodus 作为外部知识库接入 Dify,无需调整基础架构即可获得 GraphRAG 能力。图谱界面让知识结构一目了然,混合检索机制确保无论问题具体还是宽泛都能返回有价值的上下文。


更多进阶用法(如 prompt 增强工作流、高级问答机器人)可参考 InfraNodus 文档和 Dify 博客中的相关教程。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ