返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

RAGFlow:让大模型真正读懂公司所有文档的开源 RAG 引擎

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 19:26 |阅读模式 打印 上一主题 下一主题

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;font-style: italic;padding: 1em 1em 1em 2em;border-radius: 6px;color: rgba(0, 0, 0, 0.6);background: rgb(247, 247, 247);box-shadow: rgba(0, 0, 0, 0.05) 0px 4px 6px;">

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 1em;display: block;letter-spacing: 0.1em;color: rgb(63, 63, 63);">把 Word、PPT、扫描件、网页统统变成“可信答案”与“可溯源引用”


ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;padding: 0.3em 1em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 6px;">项目概述

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;margin: 0.1em auto 0.5em;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 8px;" title="null"/>

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">RAGFlow 是 infiniflow 团队开源的一款ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(15, 76, 129);">基于深度文档理解的 RAG(Retrieval-Augmented Generation)引擎
它不仅能把任何格式的企业知识“切片”后喂给大模型,还能让大模型在回答时给出精确的段落级引用,真正做到ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(15, 76, 129);">“Quality in, quality out”

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">RAGFlow = 深度文档解析 + 模板化切片 + 多路召回 & 重排 + 引用可视化 + 一键 Docker 部署


问题背景

  • 幻觉顽疾:企业级场景对答案准确性要求极高,但大模型天生“胡说八道”。
  • 格式噩梦:合同、标书、财报、扫描件、网页……格式千奇百怪,传统解析器频频翻车。
  • 部署臃肿:开源方案动辄十几个步骤,依赖复杂,运维想哭。

RAGFlow 的出现,就是要把这些问题一次性打包解决。


功能亮点

特性
一句话卖点
📄 深度文档理解
支持 Word / PPT / Excel / PDF / 扫描图片 / 网页等20+ 格式,表格、公式、图文混排都能精准还原。
🍱 模板化切片
提供可视化模板市场,可拖拽定义“按标题、按表格、按段落”等切片策略,零代码也能调优。
🌱 减少幻觉
答案附带原文定位高亮,支持一键跳转原文,溯源到页码、段落、表格单元格。
🍔 异构数据源
同一份知识库可混合上传本地文件、Web 抓取、S3、Notion、Confluence 等。
🛀 自动化工作流
内置Agent 代码执行器MCP(Multi-Chain Prompting)跨语言查询,复杂任务也能一条指令跑完。
🚀 一键部署
Docker Compose 一条命令拉起,CPU/GPU 双模式可选;x86 预置镜像 2 GB(slim)/9 GB(full)。

技术细节

  • 解析层 DeepDoc:自研 LayoutLM 系列模型,在财报/论文/标书中F1 > 95%
  • 向量存储:默认 Elasticsearch,可一键切换高性能引擎Infinity(百万级 QPS,毫秒延迟)。
  • 召回 + 重排:多路向量 & 全文混合召回 → Cross-Encoder 重排 → Top-k 段落送入 LLM。
  • 沙箱安全:代码执行器基于 gVisor 隔离,防止恶意脚本。
  • 模型接入:已支持 OpenAI GPT-5、Kimi K2、Grok-4 等20+ 商业/开源模型,配置即用。

安装与使用

系统要求

  • • CPU ≥ 4 核 / RAM ≥ 16 GB / 磁盘 ≥ 50 GB
  • • Docker ≥ 24.0 & Docker Compose ≥ v2.26.1

30 秒启动

# 1. 一键克隆
gitclonehttps://github.com/infiniflow/ragflow.git &&cdragflow/docker

# 2. 调整系统参数(仅需一次)
sudosysctl -w vm.max_map_count=262144

# 3. CPU 版启动(GPU 版把 yml 换成 -gpu)
docker compose up -d

浏览器访问http://<服务器IP>,注册账号,即可拖拽上传第一批文档。

首次登录后,在「系统设置 → LLM 供应商」填入你的 OpenAI / Kimi API Key,即可立刻问答。


应用案例

  • 某头部券商:把 2000 份 IPO 招股说明书接入 RAGFlow,问答准确率从 62% 提升到 93%,尽调时间缩短 70%。
  • 律所知识库:扫描合同 + 法律条文混合检索,律师可在 3 秒内定位到条款依据。
  • 高校科研组:将论文 & 实验笔记向量化,实现“跨语言提问 + 图表级溯源”,科研效率提升 2 倍。
  • 在线 Demo:官方提供demo.ragflow.io[1](免登录即可体验)。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ