基于多模态大语言模型的PDF转Markdown工具,高质量实现文档结构化转换
安装指南
conda create -n markpdfdown python=3.9conda activate markpdfdown# 克隆仓库gitclonehttps://github.com/jorben/markpdfdown.gitcdmarkpdfdown# 安装依赖pip install -r requirements.txt
# 设置OpenAI API密钥exportOPENAI_API_KEY=<你的API密钥># 可选设置API端点exportOPENAI_API_BASE=<你的API端点># 可选设置默认模型exportOPENAI_DEFAULT_MODEL=<你的模型># 运行转换程序python main.py < tests/input.pdf > output.md
#转换指定页码范围pythonmain.py起始页码结束页码<tests/input.pdf>output.md
dockerrun-i-eOPENAI_API_KEY=<你的API密钥>-eOPENAI_API_BASE=<你的API端点>-eOPENAI_DEFAULT_MODEL=<你的模型>jorben/markpdfdown<tests/input.pdf>output.md
requirements.txt欢迎贡献代码!请按以下流程提交PR:
git checkout -b feature/somefeat)git commit -m 'feat: 添加XX新功能')git push origin feature/somefeat)本项目采用 Apache License 2.0 开源协议,详见 LICENSE 文件。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |