#1.安装依赖condacreate-nMinerUpython=3.10condaactivateMinerUpipinstall-Umagic-pdf[full]--extra-index-urlhttps://wheels.myhloli.com-ihttps://pypi.tuna.tsinghua.edu.cn/simple#2.下载模型权重文件#根据官方文档(https://github.com/opendatalab/MinerU/blob/master/docs/how_to_download_models_en.md)指示操作#3.配置Magic-PDFcpmagic-pdf.template.json~/magic-pdf.json#编辑~/magic-pdf.json,设置正确的模型文件路径#4.开始使用magic-pdf--helpmagic-pdf-p{some_pdf}-o{some_output_dir}-mauto
# 检查您的设备是否支持Docker上的CUDA加速。docker run --rm --gpus=all nvidia/cuda:12.1.0-base-ubuntu22.04 nvidia-smi#运行 docker 部署wget https://github.com/opendatalab/MinerU/raw/master/Dockerfiledocker build -t mineru:latest .docker run --rm -it --gpus=all mineru:latest /bin/bashmagic-pdf --help
更多使用方式,请查阅如下提供地址
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", "Helvetica Neue", Arial, sans-serif;letter-spacing: normal;text-wrap: wrap;background-color: rgb(255, 255, 255);text-align: left;margin-bottom: 0px;">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", "Helvetica Neue", Arial, sans-serif;letter-spacing: normal;text-wrap: wrap;background-color: rgb(255, 255, 255);text-align: left;margin-bottom: 0px;margin-top: 0px;">总结ingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", "Helvetica Neue", Arial, sans-serif;letter-spacing: normal;text-wrap: wrap;background-color: rgb(255, 255, 255);text-align: left;margin-bottom: 0px;margin-top: 0px;">MinerU 是一款强大且多功能的数据提取工具,它能够帮助用户从各种文档中提取高质量的数据,特别适合于AI研究和大数据模型训练。尽管存在一些局限性,但其开源特性和持续的社区支持使其成为一个值得关注和尝试的工具。| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |