MinerU是一款开源的工业级文档解析工具,致力于解决非结构化文档(如PDF、扫描图像)的智能化处理难题。它通过深度学习技术将原始文档精准转换为可编辑的Markdown、JSON或HTML格式,并完整保留文字、表格、数学公式、图片等多模态元素的结构与语义。
中/英/日/韩等主流语言全覆盖,特别优化东亚文字排版识别
学术论文(参考文献/章节层级)、法律文书(条款编号)、财务报表(跨页表格)均可精准还原
| 零安装Web版 | ||
| 命令行工具 | mineru -p report.pdf -o md | |
| Docker GPU加速 | docker run --gpus all mineru-sglang:latest |
# 自定义模型路径(例:加载本地OCR模型)
mineru --ocr_model_path ./custom_ppocrv5
--formula True)、表格还原(--table True)独立开关--source local完全断网运行MarkdownJSONHTML# 基础环境配置
conda create -n mineru python=3.10
pip install "mineru[core]" # 安装核心包
# 启用SGLANG加速(需NVIDIA显卡)
mineru -p input.pdf -o outputs -b vlm-sglang-client -u http://localhost:30000
InternLM团队研发,技术论文发布于arXiv:2409.18839
2025 V2.0路线图:垂直文本支持(古文献/乐谱)、显存动态回收机制
GitHub万星项目,提供:
让数据流动,从MinerU开始!🚀
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |