免费：Dify工作流-视频/音频转会议纪要

显示全部楼层

最近有点懒，看视频教程的时候，不想做笔记，想着有个视频自动转文字甚至是有条理的总结就更好了。上网一搜发现，哇，要钱啊，而且基本都只是视频转文字。口袋空空的小编决定：DIY。

如何找一个免费又好用的视频总结助手呢，小编就用dify来构建一个。

首先，打开本地部署的Dify，新建一个空白应用：

因为视频总结基本都是一次性内容，那么可以选择创建一个工作流，随便给个名字：

然后就开始创建工作流，整体如下：

1.开始节点建立输入字段

字段类型选择单文件，支持的文件类型选择视频。

2.建立视频转音频节点

首先，在插件市场下载FFmpeg，其次，建立节点，在工具面板选择FFmpeg中的提取音频工具：

输入变量选择开始中创建的视频上传字段，提取的音频格式一般选择mp3即可。

3.建立音频转文字节点

在工具中找到Audio（如果没有，一样在应用市场找）中的Speech To Text，然后选择。

在输入变量，音频文件选项中选择上一节点的files输出变量。此时，模型可以选择FunAudioLLM（硅基流动中有免费可以用的版本）。

4.建立文本总结大模型节点

经过上述步骤，视频就已经转变成为一堆文字啦，那么，如何将众多文字转为想要的内容呢？AI大模型可以帮助你。

连接一个LLM节点，模型可以选择不要钱的小模型，追求更高性能的同学可以选择DeepSeek R1或者GPT5等模型。输入提示词，我期望他能够总结出视频教程的内容及步骤，因此我就输入：“你是一个总结专家，根据输入内容{上一节点的text输出变量}，有条理地总结一份纪要。如果涉及操作步骤，请分条细致地阐述，必要时用mermaid语句增加流程图。”

5.建立输出节点

建立结束输出节点，输出变量选择上一模型节点的text变量，这样就大功告成啦。

PS 踩坑小点

在使用提取音频节点时，一不小心会出现提取报错的情况，如下图：

这种情况就是因为dify docker下的.env文件中FILES_URL未做分配，如果是用docker部署的dify，那么可以采用5001的端口，文件中也有说明，打开文件编辑保存即可。

改完.env以后，一定要记得重置dify，用PowerShell或者命令提示符cd到dify docker的目录下输入

docker-compose down

然后再输入

docker-compose up -d

即可完成。