返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

企业知识库图文混排再升级:可视化前端一键解析

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 18:35 |阅读模式 打印 上一主题 下一主题

产品效果

上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。

企业生产环境下知识库管理者通过 可视化前端页面完成文档上传解析,并自动支持图文混排 ,效率将会大幅度提升。

文档上传完成后,在 RAGFlow 进行问答,便可以 自动显示文档里的图片



实现原理

图文混排 整体流程如下

暂时无法在飞书文档外展示此内容

文档 OCR 引擎

在之前发布的「RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码)」文中,我们是内置了 MinerU 和 PyMuPDF 两种 OCR 引擎,经反复对比后 PyMuPDF 效果很差,几乎不能用。所以 OCR 引擎层面本次升级只支持 MinerU 。少即是多,提供过多的选择未必是一件正确的事, 产品层面越简单越好

图片存储与读取

之前方案中我们采用了 docker 独立容器部署图片服务,虽然安全性上进一步提升。但考虑到图片的存储与读取性能以及部署的复杂度,本次我们统一将图片存储到 RAGFlow 的 Minio。从设计的角度来看,也更加紧凑,复用原有的框架能力,降低复杂度。



上传文档

后台管理系统新上传了文档接口,可以 实时显示文档解析的进度 。需要注意的是目前文档解析并未存储到文件系统里,上传功能并未做持久化。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ