|
最近有点懒,看视频教程的时候,不想做笔记,想着有个视频自动转文字甚至是有条理的总结就更好了。上网一搜发现,哇,要钱啊,而且基本都只是视频转文字。口袋空空的小编决定:DIY。
如何找一个免费又好用的视频总结助手呢,小编就用dify来构建一个。
首先,打开本地部署的Dify,新建一个空白应用:
因为视频总结基本都是一次性内容,那么可以选择创建一个工作流,随便给个名字:首先,在插件市场下载FFmpeg,其次,建立节点,在工具面板选择FFmpeg中的提取音频工具:输入变量选择开始中创建的视频上传字段,提取的音频格式一般选择mp3即可。在工具中找到Audio(如果没有,一样在应用市场找)中的Speech To Text,然后选择。在输入变量,音频文件选项中选择上一节点的files输出变量。此时,模型可以选择FunAudioLLM(硅基流动中有免费可以用的版本)。经过上述步骤,视频就已经转变成为一堆文字啦,那么,如何将众多文字转为想要的内容呢?AI大模型可以帮助你。连接一个LLM节点,模型可以选择不要钱的小模型,追求更高性能的同学可以选择DeepSeek R1或者GPT5等模型。输入提示词,我期望他能够总结出视频教程的内容及步骤,因此我就输入:“你是一个总结专家,根据输入内容{上一节点的text输出变量},有条理地总结一份纪要。如果涉及操作步骤,请分条细致地阐述,必要时用mermaid语句增加流程图。”建立结束输出节点,输出变量选择上一模型节点的text变量,这样就大功告成啦。在使用提取音频节点时,一不小心会出现提取报错的情况,如下图:这种情况就是因为dify docker下的.env文件中FILES_URL未做分配,如果是用docker部署的dify,那么可以采用5001的端口,文件中也有说明,打开文件编辑保存即可。
改完.env以后,一定要记得重置dify,用PowerShell或者命令提示符cd到dify docker的目录下输入
然后再输入
即可完成。
|