返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

AI-Media2Doc: 视频一键转图文的 AI 工具

[复制链接]
链载Ai 显示全部楼层 发表于 半小时前 |阅读模式 打印 上一主题 下一主题


AI 视频图文创作助手是一款Web工具, 基于AI大模型, 将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。一键将视频和音频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档。

主要功能

  • ✅ 完全开源:MIT 协议授权,支持本地部署。

  • ? 隐私保护:无需登录注册,任务记录保存在本地

  • ? 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg

  • ? 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。

  • ? AI 对话:支持针对视频内容进行 AI 二次问答。

  • ? 支持字幕导出: 结果一键导出为字幕文件。

  • ? 一键部署:支持 Docker 一键部署。

安装和使用

? docker 本地一键部署

1️⃣:镜像构建:

$make docker-image

2️⃣:请根据后端部署指引 / 配置项说明完善根目录下的variables.env文件。

3️⃣:修改前端的 evn.development 中的 VITE_API_BASE_URL 为http://0.0.0.0:8080

4️⃣:运行项目

$make run

后端本地部署

后端依赖于字节跳动火山引擎高代码 SDK Arkitect高代码 SDK Arkitect。 在启动后端服务之前, 需要先安装好 Arkitect 的依赖, 并且申请字节 Tos 对象存储服务 以及 对应大模型的 API 调用权限

注意 ⚠️: 请至少保证你本地的 Python 版本为 3.9 及以上, 否则可能会出现依赖无法安装, 项目启动失败等问题。


  1. 安装依赖

pip install -r requirements.txt

  1. 配置环境变量

export ENDPOINT_ID=xxxx
export ARK_API_KEY=xxxx
export TOS_ACCESS_KEY=xxxx
export TOS_SECRET_KEY=xxxx
export TOS_ENDPOINT=xxxx
export TOS_REGION=xxxx
export TOS_BUCKET=xxxx
export AUC_APP_ID=xxxx
export AUC_ACCESS_TOKEN=xxxx

  1. 启动服务

python main.py

前端本地部署


  1. 安装 Node.js

要求 node 版本为 20+, 我本地的 node 版本为22.0.0


  1. 安装依赖

npm install

  1. 启动服务

npm run dev
  • 浏览器访问

打开浏览器访问http://localhost:5173/即可。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ