• PDF文档结构复杂,解析后格式混乱
• 扫描件内容无法被正确识别
• 图表变形或消失
• 公式转换成乱码
重要的图表和示意图全都"蒸发",只剩下占位符
你期待的是数据分析,得到的却是一团乱码
精心编写的数学公式变成了一串无法辨认的符号
没有结构、没有层次,密密麻麻的文字堆在一起看得头疼,阅读五分钟就想闭眼
这哪是AI助手,分明是"折磨助手"...
说好的提升效率,怎么变成了增加烦恼?
作为国内领先的知识库产品,FastGPT决定彻底解决这些痛点!
告别传统知识库的单调文本体验,FastGPT 4.9带您进入多模态知识管理新时代!
还在为知识库中的PDF内容展示不全面而烦恼吗?FastGPT最新版带来革命性体验:
FastGPT现已在页面上集成PDF增强解析交互功能,并内嵌Doc2x专业文档处理服务,让您的PDF文件解析达到新高度!
扫描件精准识别- 支持扫描版PDF识别,文字清晰可辨
文本结构化- PDF可转换为结构化Markdown格式,保留原始排版和层次关系
?️图片保留- 可以提取文档中的所有图片,并以链接形式报错
➗LaTeX公式- 数学公式、专业符号精准识别并转换,文档处理更专业
?表格数据- 复杂表格结构化呈现,数据关系一目了然
Step 1: 准备工作
打开您的知识库,在右侧根据需要选择合适的模型
Step 2: 导入文档
点击右上角的"新建/导入"按钮选择"文本数据集"上传您的文档
ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";letter-spacing: 0.034em;text-align: justify;-webkit-font-smoothing: antialiased;text-rendering: optimizelegibility;color: rgb(36, 91, 219);">
ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";font-size: 16px;letter-spacing: 0.578px;text-align: center;background-color: rgb(255, 255, 255);"/>Step 3: 开启增强解析
上传完成后点击"下一步",您会看到全新的PDF增强解析选项
我们推荐同时开启自动生成补充索引和图片自动索引,效果更佳
Step 4: 预览与完成
点击左侧的文件进行预览
系统会显示分块预览内容
确认无误后,点击"下一步",再点击"开始上传"
耐心等待训练完成,状态变为"已就绪"
点击目标文件,立即体验增强解析的强大功能:
文本呈现清晰整洁
图片识别完整精准
LaTeX公式自动识别渲染
表格数据结构化展示,一整个爱上
PDF 扫描增强,丝滑转化
除了革命性的PDF增强解析,我们还带来了更多实用功能和性能提升!
FastGPT全新推出的图片自动标注功能,彻底改变了知识库处理视觉内容的方式,让图片都能够更好地被理解、被检索、被利用。
自动识别 PDF 中的图片内容并生成 Markdown 格式准确描述,并为图片创建可检索的标签
实际效果展示
来看一个真实案例,当我们在知识库中上传了 RAG 相关内容:
我们可以看到增加了对图片的索引部分
如果不打开这个功能,我们就只能自定义索引
为图片创建可检索的标签
这意味着您可以通过关键词直接搜索相关图片的内容
优化知识库内图片的搜索体验
无需人工干预,全程自动化处理
同时,我们还重新设计了知识库文件上传的数据逻辑和交互流程,让整个过程更加流畅高效。
通过升级 pg vector 插件至 0.8.0 版本,我们引入了迭代搜索技术:
扩大检索范围,减少死元组影响召回数量
新版本在保持检索精度的同时,将原本难以检索到的"边缘信息"纳入搜索范围,实现了更全面的知识覆盖。
除了闪亮的新功能,我们还对系统进行了全方位的优化与修复,让您的使用体验更加流畅!
重大突破:知识库索引数量不再受限!
可无限创建自定义索引,满足不同场景需求
系统会自动更新输入文本的索引
利用无限索引功能,您可以为同一知识点创建多种表述形式,大幅提高检索命中率!
我们优化了Markdown内容处理,特别是:
自动检测链接后的中文标点符号
Prompt模式工具调用现已支持思考模型,同时:
显著减少空输出概率
通过优化代码和数据库存储结构,我们实现了大幅的性能提升:
成果:50M PDF读取速度提升3倍!
增加了网页抓取的安全链接校验机制防止潜在风险
解决了批量运行时全局变量传递的问题:
修复了变量未能正确传递到下一次运行的bug
⚠️ 重要更新通知
ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";font-size: 16px;letter-spacing: 0.578px;-webkit-font-smoothing: antialiased;text-rendering: optimizelegibility;">为了提供更好的服务体验,我们进行了以下必要调整:ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";letter-spacing: 0.578px;-webkit-font-smoothing: antialiased;text-rendering: optimizelegibility;line-height: 1.4;">1️⃣ 私有化部署变更ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";font-size: 16px;letter-spacing: 0.578px;-webkit-font-smoothing: antialiased;text-rendering: optimizelegibility;">私有化部署的自定义文件解析方案已弃用ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";font-size: 16px;letter-spacing: 0.578px;-webkit-font-smoothing: antialiased;text-rendering: optimizelegibility;">请尽快同步更新到最新的配置方案,享受更稳定的服务和新功能支持ingFang SC", "Microsoft Yahei", "Hiragino Sans GB", sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji";letter-spacing: 0.578px;-webkit-font-smoothing: antialiased;text-rendering: optimizelegibility;line-height: 1.4;">2️⃣ API 接口更新旧版本地文件上传 API 已弃用:/api/core/dataset/collection/create/file(原商业版专属API)已切换为:/api/core/dataset/collection/create/localFile
外部文件库相关 API 即将停用:建议尽快迁移至功能更完善的 API 文件库
trainingType字段调整:未来仅支持chunk和QA两种模式
增强索引模式将使用独立字段:autoIndexes
目前仍兼容旧版trainingType=auto,但请尽快更新您的代码
这些优化和修复也许不如新功能那样引人注目,但它们是提升整体用户体验的关键基石。我们致力于在每个细节上精益求精,让FastGPT成为您最可靠的AI助手!
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |