ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">2025年11月12日,RAGFlow 正式发布 v0.22.0 版本。本次更新带来了大量功能增强、架构优化及重要修复,涵盖数据集管理、智能代理、解析管线、管理界面及模型支持等方面。同时,本版本在镜像发布策略和功能上也进行了重要调整。以下为详细更新内容:
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">一、重大变更ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;color: rgb(63, 63, 63);" class="list-paddingleft-1">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;text-indent: -1em;display: block;margin: 0.2em 8px;color: rgb(63, 63, 63);">• 从本版本起,仅提供精简版(不含嵌入模型)Docker 镜像,镜像标签中不再追加ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 12.6px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">-slim后缀。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">二、新功能ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">1. 数据集(Dataset)ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;color: rgb(63, 63, 63);" class="list-paddingleft-1">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;text-indent: -1em;display: block;margin: 0.2em 8px;color: rgb(63, 63, 63);">• 支持从五大在线数据源进行数据同步:AWS S3、Google Drive、Notion、Confluence、Discord。• 支持针对整个数据集或单个文档构建 RAPTOR。• 新增管理 Web UI 仪表盘,用于图形化用户管理及服务状态监控。2. 智能代理(Agent)
- • 引入变量聚合器组件,可进行数据运算及会话变量定义。
三、功能改进
- • 文档引擎 Infinity 升级至 v0.6.5。
四、新增模型
五、新增代理模板
- • 新增交互式代理模板,可结合实时用户反馈动态优化输出。
六、更新详情(包含所有改进与修复)
- • 修复
rag.nlp.search.Dealer.search()方法中参数类型错误问题。 - • 移除 EditTag 中的 value 属性绑定。
- • Python API 传递 kwargs 支持。
- • MinerU 支持 VLM-Transformers 后端。
- • 修复 Excel Chartsheet 解析与负索引问题。
- • 重命名 rmSpace 为 remove_redundant_spaces。
- • 新增 LLM 模型与 Token Pony 支持。
- • 修复 table_structure_recognizer 日志参数问题。
- • README 更新 Octoverse 信息。
- • 优化 AnthropicCV 总 Token 计数逻辑。
- • 移除 Youdao 与 BAAI 嵌入模型提供商。
- • Docker 环境配置新增标准 HTTP/HTTPS 和 MCP 端口。
- • Infinity 升级至 0.6.2,再升级至 0.6.5。
- • 测试工作流中删除 Docker 镜像增加错误处理。
- • 优化 Rerank 模型 Token 计数逻辑。
- • 修复 MinerU 解析器 table_body 缺失问题。
- • jsonjoy-builder 目录文件改为小写。
- • 修复修改操作符名称后画布节点未及时更新的问题。
- • 移除 get_lan_ip 并新增 misc_utils 工具。
- • 支持 docx/pdf 超链接解析,并修复默认解析器 toc 提取配置。
- • 修复代理 output_structure 问题。
- • 修复 chunk.update API 位置更新问题。
- • Base64 图片处理函数迁移至 common。
- • 引入 common/constants.py、common/config_utils.py。
- • 修复 Ollama describe_with_prompt 参数错误。
- • 修复 Elasticsearch 连接硬编码问题。
- • Docker 移除过期 sandbox 配置。
- • 修复 meta_data_filter 参数错误。
- • 修复 HTTP API 与 Web UI 创建数据集性能差异问题。
- • MinerU 支持 HTTP Client/Server。
- • 修复 get_allowed_llm_factories 返回类型错误。
- • 功能:数据操作算子的值可以来自输入或变量引用。
- • 将 api.settings 移到 common.settings。
- • 重构:移除 HuggingFace 仓库下载功能。
- • 功能:代理算子和消息算子只能选择字符串变量作为提示词。
- • 修复:修复 pdf_parser 在 rag/app/naive.py 中被忽略的问题。
- • 在文档中新增 “SHOW VERSION” 使用说明。
- • 修复:OpenSearch 检索无返回结果,并为 /retrieval 添加文档。
- • 升级 infinity 到 0.6.4 版本。
- • 修复:添加 HuggingFace 模型下载功能。
- • 修复:Python API 的流式输出结构问题。
- • 功能:新增 kimi-k2-thinking 和 moonshot-v1-vision-preview 模型。
- • 文档:优化 MinerU 部分的常见问题说明。
- • 功能:数据操作算子的键名只能是数字、字母和下划线。
- • 修复:hierarchical_manager 中缺少文件格式支持。
- • 修复:移除 siliconflow API 中不支持的模型。
- • 修复:general chunk 中解包值不足的问题。
- • 功能:操作符的查询变量可选择全局定义的对话变量。
- • 修复:优化 use_sql() 的提示和正则。
- • 修复(配置):为 infinity 映射添加 raptor_kwd 字段。
- • 功能:添加 Google Drive 连接器的初步支持。
- • 配置:为 LLM 供应商添加排名值并移除已弃用的 LLM。
- • 修复:在知识库详情中添加 auto_parse。
- • 功能:添加任务执行器柱状图,添加系统版本字符串。
- • 修复:waitForResponse 组件问题。
- • 功能:Google Drive 支持基于网页的凭证。
- • 修复:data_operations 输入返回错误。
- • 修复:更新环境以支持 PPTX,并更新 README 的版本变更说明。
- • 修复:Confluence 因时区配置混乱导致无法检索新上传文件的问题。
- • 更新 llm_factories.json 中 LLM 工厂的排名。
- • 修复:GraphRAG 和 RAPTOR 任务不影响文档状态。
- • 升级 infinity 到 0.6.5 版本。
- • 文档:更新 README 和文档中的版本引用到 v0.22.0。
七、总结
RAGFlow v0.22.0 提供了更强的 数据源集成能力、更灵活的 智能代理结构化处理与变量管理、可视化更完善的 管理后台 以及更加稳定高效的文档解析管道。特别是在数据同步、多数据源支持、结构化输出以及变量聚合方面的提升,使其在知识检索与智能问答系统的应用中更加高效、可扩展。