n8n如何调用最近爆火的deepseek OCR？

显示全部楼层

继 DeepSeek-R1、DeepSeek-V3 等大模型之后，DeepSeek正式开源了全新的一个3B OCR模型：DeepSeek-OCR

今天来看看在n8n里如何调用：DeepSeek-OCR

我这里用到的是硅基流动里的免费的DeepSeek-OCR，所以先得在n8n里新建Credential：

找到Openai account，填写好硅基流动的base url和你的API key

然后在n8n里新建如下流程：

首先需要设置chat里的“Allow File Uploads”参数，这样你就可以上传图片并识别里面的内容了：

在AI Agent里设置你的prompts，比如：

识别图片里的文字，适当整理段落格式，不要翻译

运行即可

但说实话，调用的硅基流动里的这个DeepSeek-OCR效果并不是很好，你不妨也试试

另外，还能搭建一个webhook流程，去识别图片里的文字

然后利用webhook的链接写一个静态网页，来读取图片文字