返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

开源RAG项目到底如何选型?

[复制链接]
链载Ai 显示全部楼层 发表于 3 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">注意: 中立靠谱来自实践的 RAG 开源项目技术选型,帮你快速用上用好 RAG。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(0, 152, 116);">结论

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">首先,我们参与比较的开源 RAG 项目包括 dify、maxkb、ragflow,当然其实还有 fastgpt、bisheng 等等之流,但本文主要集中在 dify、maxkb、ragflow 以及 langflow。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">首先给结论:
只专注知识库 ragflow > dify > maxkb,但如果有其他考虑,可以继续看下文。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(0, 152, 116);">ragflow分析

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">1、重点追求 RAG 知识库的可控可用,甚至打算后期商业化,就选 ragflow,从开源许可,RAG 深度,ragflow 做得最好,代码质量相对也不错。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ragflow 功能相对全面,特别是知识库,内置的deepdoc自研,基本满足了一般场景下的 文档解析。
同时在知识召回方面,除了基本的混合检索能力,也支持 graphrag 的知识图谱和召回能力以及 raptor 等,同时支持两种文档向量数据库,自家自研的infinity 就不建议了,优先推荐 elasticsearch,特别是 9.0 版本以后,官网的 bbq 能力进一步提升和稳定,简直是企业场景首选,这个后面单独写一篇文章。
上述讲了,除了独有的 deepdoc 模块,见上图,可以把文档的详细解析处理流程展示出来,可谓产品优秀小细节,还有下图中对于引用源的处理,也有小细节。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(0, 152, 116);">dify分析

2、追求工作流扩展+知识库齐飞,功能最全面,就选 dify 没错,美中不足就是开源许可,不适合二次开发商业化,同时项目复杂度也比较高,对于没有 saas 需求,有些设计不太合适,说白了 dify 是开源版本 coze 对齐。
至于更详细的技术分析,见我前一篇文章(1.0 版本),不过好像 dify 已经发布了 1.3 版本,后面对于这三个次要版本,dify 到底更新了什么,我也挖个坑,下下篇文章来聊下。

maxkb

3、追求二开,轻量级,小清新,就选 maxkb,maxkb工程虽小,但功能真不少,也支持工作流,页面交互也是我最喜欢的,当然 maxkb 开源许可也不太适合商业化,但不妨碍一些小团队或者个人使用,代码也清晰可读,整体就依赖了 PostgreSQL 数据库来实现工程元数据以及向量数据库,以及 全文检索,谁叫 PG 这么强呢,在 MySQL 日渐式微的当下,PG 就是王者。

langflow

4、如果你有工作流要求,且希望后期商业化,langflow 也可以作为一个不错的底座,可以快速出东西,一个字强,二个字很强,实现也没那么复杂,就是基于 langchain 实现了工作流,强是强,就是有点推屎爬的感觉,如果你希望代码更可控,也不需要那么多内置预设的插件,就不要选它了,pocketflow 不错。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ