返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

基于MinerU的PDF解析API,支持一键启动

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 23:44 |阅读模式 打印 上一主题 下一主题

unsetunset简介unsetunset

https://github.com/gomate-community/GoMate/blob/main/docs/mineru.md

- MinerU的GPU镜像构建
- 基于FastAPI的PDF解析接口

支持一键启动,已经打包到镜像中,自带模型权重,支持GPU推理加速,GPU速度相比CPU每页解析要快几十倍不等

unsetunset主要功能unsetunset

    utside;" class="list-paddingleft-1">
  • 删除页眉、页脚、脚注、页码等元素,保持语义连贯
  • 对多栏输出符合人类阅读顺序的文本
  • 保留原文档的结构,包括标题、段落、列表等
  • 提取图像、图片标题、表格、表格标题
  • 自动识别文档中的公式并将公式转换成latex
  • 自动识别文档中的表格并将表格转换成latex
  • 乱码PDF自动检测并启用OCR
  • 支持CPU和GPU环境
  • 支持windows/linux/mac平台

unsetunset具体原理unsetunset

请见PDF-Extract-Kit:https://github.com/opendatalab/PDF-Extract-Kit/blob/main/README-zh_CN.md PDF文档中包含大量知识信息,然而提取高质量的PDF内容并非易事。为此,我们将PDF内容提取工作进行拆解:

布局检测:使用LayoutLMv3模型进行区域检测,如图像,表格,标题,文本等;公式检测:使用YOLOv8进行公式检测,包含行内公式和行间公式;公式识别:使用UniMERNet进行公式识别;表格识别:使用StructEqTable进行表格识别;光学字符识别:使用PaddleOCR进行文本识别;

unsetunset镜像地址:unsetunset

阿里云地址:docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.2-models

dockerhub地址:docker pull quincyqiang/mineru:0.2-models

unsetunset启动命令:unsetunset

docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models

具体截图请见博客:https://blog.csdn.net/yanqianglifei/article/details/141979684

unsetunset启动日志:unsetunset

unsetunset输入参数:unsetunset

访问地址:

http://localhost:8888/docs

http://127.0.01:8888/docs

unsetunset解析效果:unsetunset

返回内容字段包括:dict_keys(['layout', 'info', 'content']) 其中content是一个字典列表:

{
'type':'text',
'text':'现在我们知道:价值实体就是劳动;劳动量的尺度就是劳动持续时间。',
'page_idx':5
}

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ