ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;font-style: italic;padding: 1em 1em 1em 2em;border-radius: 6px;color: rgba(0, 0, 0, 0.6);background: rgb(247, 247, 247);box-shadow: rgba(0, 0, 0, 0.05) 0px 4px 6px;">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 1em;display: block;letter-spacing: 0.1em;color: rgb(63, 63, 63);">把 Word、PPT、扫描件、网页统统变成“可信答案”与“可溯源引用”
ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;padding: 0.3em 1em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 6px;">项目概述ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;color: rgb(63, 63, 63);">
ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;margin: 0.1em auto 0.5em;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 8px;" title="null"/>ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">RAGFlow 是 infiniflow 团队开源的一款ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(15, 76, 129);">基于深度文档理解的 RAG(Retrieval-Augmented Generation)引擎。
它不仅能把任何格式的企业知识“切片”后喂给大模型,还能让大模型在回答时给出精确的段落级引用,真正做到ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(15, 76, 129);">“Quality in, quality out”。ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">RAGFlow = 深度文档解析 + 模板化切片 + 多路召回 & 重排 + 引用可视化 + 一键 Docker 部署
问题背景

- •幻觉顽疾:企业级场景对答案准确性要求极高,但大模型天生“胡说八道”。
- •格式噩梦:合同、标书、财报、扫描件、网页……格式千奇百怪,传统解析器频频翻车。
- •部署臃肿:开源方案动辄十几个步骤,依赖复杂,运维想哭。
RAGFlow 的出现,就是要把这些问题一次性打包解决。
功能亮点
| |
|---|
| 支持 Word / PPT / Excel / PDF / 扫描图片 / 网页等20+ 格式,表格、公式、图文混排都能精准还原。 |
| 提供可视化模板市场,可拖拽定义“按标题、按表格、按段落”等切片策略,零代码也能调优。 |
| 答案附带原文定位高亮,支持一键跳转原文,溯源到页码、段落、表格单元格。 |
| 同一份知识库可混合上传本地文件、Web 抓取、S3、Notion、Confluence 等。 |
| 内置Agent 代码执行器、MCP(Multi-Chain Prompting)、跨语言查询,复杂任务也能一条指令跑完。 |
| Docker Compose 一条命令拉起,CPU/GPU 双模式可选;x86 预置镜像 2 GB(slim)/9 GB(full)。 |
技术细节

- •解析层 DeepDoc:自研 LayoutLM 系列模型,在财报/论文/标书中F1 > 95%。
- •向量存储:默认 Elasticsearch,可一键切换高性能引擎Infinity(百万级 QPS,毫秒延迟)。
- •召回 + 重排:多路向量 & 全文混合召回 → Cross-Encoder 重排 → Top-k 段落送入 LLM。
- •沙箱安全:代码执行器基于 gVisor 隔离,防止恶意脚本。
- •模型接入:已支持 OpenAI GPT-5、Kimi K2、Grok-4 等20+ 商业/开源模型,配置即用。
安装与使用
系统要求
- • CPU ≥ 4 核 / RAM ≥ 16 GB / 磁盘 ≥ 50 GB
- • Docker ≥ 24.0 & Docker Compose ≥ v2.26.1
30 秒启动
# 1. 一键克隆
gitclonehttps://github.com/infiniflow/ragflow.git &&cdragflow/docker
# 2. 调整系统参数(仅需一次)
sudosysctl -w vm.max_map_count=262144
# 3. CPU 版启动(GPU 版把 yml 换成 -gpu)
docker compose up -d
浏览器访问http://<服务器IP>,注册账号,即可拖拽上传第一批文档。
首次登录后,在「系统设置 → LLM 供应商」填入你的 OpenAI / Kimi API Key,即可立刻问答。
应用案例

- •某头部券商:把 2000 份 IPO 招股说明书接入 RAGFlow,问答准确率从 62% 提升到 93%,尽调时间缩短 70%。
- •律所知识库:扫描合同 + 法律条文混合检索,律师可在 3 秒内定位到条款依据。
- •高校科研组:将论文 & 实验笔记向量化,实现“跨语言提问 + 图表级溯源”,科研效率提升 2 倍。
- •在线 Demo:官方提供demo.ragflow.io[1](免登录即可体验)。