dify应用：另类的关键词检索

显示全部楼层

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0.3em 1em;color: rgb(255, 255, 255);background: rgb(250, 81, 81);border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 6px;">背景

在使用ragflow的时候，分片的时候，有个比较好用的功能，就是自动关键词提取功能。

我们在检索的时候，可以通过调整语义和关键词的权重来检索知识。从而实现关键词+语义的互补。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">而在dify的rag中，是没有关键词的。在ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 12.6px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">dify1.2.0的时候，dify新增了一个元数据的功能，我们可以给文档设置元数据，从而在检索的时候，通过元数据作为关键词，可以过滤一部分内容。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">但是该功能是文档级别的，并不能匹配到分段内容。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">我们先看下我接下来的检索实验。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0.3em 1em;color: rgb(255, 255, 255);background: rgb(250, 81, 81);border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 6px;">dify中的检索实验

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">在dify中一共有三中模式。

•向量检索：向量化用户输入的问题并生成查询文本的数学向量，比较查询向量与知识库内对应的文本向量间的距离，寻找相邻的分段内容。
•全文检索：关键词检索，即索引文档中的所有词汇。用户输入问题后，通过明文关键词匹配知识库内对应的文本片段，返回符合关键词的文本片段；类似搜索引擎中的明文检索。
•混合检索：同时执行全文检索和向量检索，通过权重或 Rerank 模型，从查询结果中选择匹配用户问题的最佳结果。

知识库配置

为了减少干扰，我使用同一个文档，同一个向量模型，4个知识库做测试。

• 知识库1：bge-m3-向量检索
• 知识库2：bge-m3- 全文检索
• 知识库3：bge-m3-混合-权重
• 知识库4：bge-m3-混合-rerank

知识库1：bge-m3-向量检索

知识库2：bge-m3- 全文检索

知识库3：bge-m3-混合-权重

知识库4：bge-m3-混合-rerank

测试文档

## 案例1：风寒感冒

- **症状描述**：鼻塞流清涕、畏寒无汗、头痛、咳嗽白痰、舌淡苔白
 
- **理论依据**：《伤寒论》太阳病理论，寒邪束表致卫阳被遏。大椎为诸阳之会可散寒解表，风门为风邪出入门户，合谷属阳明经通调肺气
 
- **配穴方案**：大椎、风门、合谷
 
- **操作流程**：先灸大椎20分钟至潮红，再灸风门15分钟，最后灸合谷10分钟。每日1次，连续3天
 

## 案例2：脾胃虚寒型胃痛

- **症状描述**：胃脘冷痛、喜温喜按、食少便溏、四肢不温、舌淡胖有齿痕
 
- **理论依据**：《针灸甲乙经》"中脘主腹胀不通"，配合胃经合穴足三里健运脾土，神阙温补元阳
 
- **配穴方案**：中脘、足三里、神阙
 
- **操作流程**：神阙隔姜灸5壮，中脘悬灸25分钟，足三里双穴各灸15分钟。饭前操作，隔日1次
 

## 案例3：寒凝血瘀型痛经

- **症状描述**：经前小腹冷痛拒按、经血紫暗有块、得热痛减、面色青白
 
- **理论依据**：《妇人大全良方》寒客胞宫理论，关元为任脉与三阴经交会穴，三阴交统调阴经，次髎温通胞宫
 
- **配穴方案**：关元、三阴交、次髎
 
- **操作流程**：经前3天开始灸，关元灸30分钟，三阴交双穴各15分钟，次髎20分钟。每日1次至经期第2天