链载Ai

标题: ppt检索的RAG方案(多模态、OCR、混合检索)评估结论 [打印本页]

作者: 链载Ai    时间: 昨天 22:21
标题: ppt检索的RAG方案(多模态、OCR、混合检索)评估结论

ppt RAG主要分下面3种:

那么哪种方式更好?下面主要记录一下评估结论。

数据集

SlideVQA 和 LPM 数据集中的示例

实验及结论

关键结论

检索ppt的最佳方法是什么

取决于应用场景。

因此,将多模态ppt检索问题转化为文本问题,能够利用成熟的文本信息检索技术,通常比直接进行多模态编码获得更实用的解决方案。在资源极度受限的环境中,即使仅对高质量标题使用简单的 BM25,也能提供一个合理且高效的基准。顶级重排序器(无论是视觉还是文本)带来的显著延迟,仍是在交互式 RAG 系统部署的主要挑战。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5