|
继 DeepSeek-R1、DeepSeek-V3 等大模型之后,DeepSeek正式开源了全新的一个3B OCR模型:DeepSeek-OCR  今天来看看在n8n里如何调用:DeepSeek-OCR 我这里用到的是硅基流动里的免费的DeepSeek-OCR,所以先得在n8n里新建Credential:  找到Openai account,填写好硅基流动的base url和你的API key - https://api.siliconflow.cn/v1
然后在n8n里新建如下流程:  首先需要设置chat里的“Allow File Uploads”参数,这样你就可以上传图片并识别里面的内容了:  在AI Agent里设置你的prompts,比如: 识别图片里的文字,适当整理段落格式,不要翻译
运行即可  但说实话,调用的硅基流动里的这个DeepSeek-OCR效果并不是很好,你不妨也试试 另外,还能搭建一个webhook流程,去识别图片里的文字  然后利用webhook的链接写一个静态网页,来读取图片文字  |