KnowFlow 无缝衔接 dify，分块支持添加父标题、Title 切块支持自定义标题层级切割、图片理解新增支持上下文

前言

KnowFlow v2.1.7 正式发布，本版本推出以下功能：

1. Dify 接入

为了方便 KnowFlow 更方便对接 Dify，我们提供了 Dify 插件以及 DSL 模板。这样开发者无需再去调试接口，便可以在 Dify 简单的通过配置实现 KnowFlow 和 Dify 的对接。

2. 分块优化

我们针对 MinerU/Dots 量身定制的 smart/title/parent_child 切块方法的标题做了统一优化，新增支持对分块内容添加父标题。

对 title 切块支持自定义标题层级，用户可以选择 H1~H6 标题层级，切块时候严格依照标题层级切分。

3. 图片理解优化

v2.1.6 版本我们发布了以文搜图功能，但图片上下文信息并未送入到视觉模型，导致数据模型的图片识别脱离原文。本版本我们会将图片关联的段落送给模型，实测下来图片理解功能大大增强。

本版本同时将官网文档再次更新，提供了分块方法的使用案例以及 dify 对接使用相关说明，详情可移动到官网文档。

为方便 Dify 对接到 KnowFlow，考虑到灵活性和扩展性，我们并不推荐 Dify 外接知识库方案，该方案存在一定的局限性。而是选择了直接调用 KnowFlow API。

1. 安装插件：为降低 API 调试成本，我们提供了 Dify API 插件，该插件已经封装好了 API。

2. 配置插件：用户只需要通过简单的插件配置，输入 API_KEY、URL、知识库 ID 信息，就可以无缝调用 API。

3. 导入 DSL：配置完插件后，在 Dify 平台需要解析 API 返回结果，并透传给大模型。为降低配置成本，我们提供了 DSL 可以一键导入，无需单独配置。

上述插件和 DSL 同样适用于 RAGFlow，极大的方便了 Dify 接入，不用代码调试，界面上简单配置即可。

由于 MinerU/Dots 识别产物是 MarkDown ，其中 MarkDown 的标题对于文档结构信息的还原至关重要。我们对 MarkDown 标题进行统一优化，作用于 smart/title/parent_child 切片方法。

追加父标题：对于任意切块，可以追加其所有的父标题，类似于 RAGFlow 新增的 Table Of Content 模式。实测上下文问题大大改善。

根据标题层级切割：该功能也是客户使用产品过程中提出的，针对一些论文，规章制度类型的文档，往往标题下内容不多，相对规范，此时我们可以通过标题层级切割，支持用户在前端进行选择。

为了让视觉模型更好的识别到图片语义，我们将图片附近的段落提取给模型，提取的规则是：

通过该规则，基本上可以满足大多数场景。

本版本围绕产品体验，将产品不断打磨，使用户体验更加友好。近期在和客户交流的过程中，KnowFlow 的产品定位也瑜伽清晰：将结构化与非结构化数据治理成对大模型更可信的输入，构建面向未来的数据治理平台，重塑 AI 时代的数据根基。

基于此定位，后续我们将围绕以下产品方向进行迭代：

本项目社区版已更新至 v2.1.2 版本，支持 RBAC 以及 Dots 文档引擎接入。欢迎关注公众号KnowFlow 企业知识库加入内部交流群，学习和分享 RAG 知识库。