字节开源Dolphin文档解析模型-部署指南实战测试

显示全部楼层

在数字化办公席卷全球的今天，文档解析技术已成为企业数字化转型的关键瓶颈。面对海量的合同、报告、论文等文档资料，传统解决方案要么速度缓慢，要么错误百出。5月22日，字节跳动开源的全新文档解析模型Dolphin横空出世，凭借仅322M参数的轻量级架构，在性能上实现了对GPT-4.1、Claude3.5等重量级模型的全面超越！

github: https://github.com/bytedance/Dolphin

在线Demo: http://115.190.42.15:8888/dolphin

下面开始部署指南：

一、安装依赖环境

# 下载代码

git clone https://github.com/ByteDance/Dolphin.git
cd Dolphin


# 创建虚拟环境
conda create -n Dolphin python=3.11

# 激活虚拟环境
conda activate Dolphin


# 安装uv

pip install uv -i https://pypi.tuna.tsinghua.edu.cn/simple/


# 修改numpy版本
先修改requirements.txt文件，否则会报错，报错信息放在了文末：
把numpy==1.24.4 改为 numpy==1.26.0


# 安装requirements.txt依赖包

uv pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/