链载Ai

标题: 10万 开发者关注!PP-DocBee破局文档理解痛点 [打印本页]

作者: 链载Ai    时间: 5 小时前
标题: 10万 开发者关注!PP-DocBee破局文档理解痛点


一、中文PDF文档理解的不足

二、PP-DocBee的解决方案

2.1 丰富布局的文档数据合成

2.2 图表数据合成

2.3 表格数据合成

2.4 模型架构的创新

PP-DocBee基于Qwen2-VL-2B模型进行开发,采用“ViT+MLP+LLM”架构,其中ViT负责图像处理以提取视觉特征,MLP对特征进行处理和整合,LLM则负责理解和生成文本。

三、PP-DocBee实战

在线体验地址:https://aistudio.baidu.com/application/detail/60135

python paddlemix/examples/ppdocbee/ppdocbee_infer.py \
--model_path"addleMIX/PPDocBee-2B-1129"\
--image_file"paddlemix/demo_images/medal_table.png"\
--question"识别这份表格的内容"







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5