返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

在pyVideoTrans软件中使用

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 10:00 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1em;letter-spacing: 0.1em;color: rgb(80, 80, 80);">一个简单的本地网页界面,直接使用ChatTTS将文字合成为语音,同时支持对外提供API接口。

Github:https://github.com/jianchang512/ChatTTS-ui

亲爱的读者朋友们,你们好。书接上回啊,前天介绍了ChatTTS ,今天介绍它的本地化安装方式以及API调用,有API真的是帮大忙了,就可以随心操作了,往期文章在这里,话不多说,今天这个ChatTTS-ui也是一个开源项目

6k Star!ChatTTS:开源领域最强的文本到语音转换(TTS)模型!

2024-05-30

‍‍

除此以外,第3个项目是:Ollama ChatTTS是与 ChatTTS & ChatTTS WebUI & API 项目绑定的扩展项目,通过调用 ChatTTS API 接口功能,使用 Streamlit 作为 Web 界面的前端库。

https://github.com/hkgood/Ollama_ChatTTS‍‍

ChatTTS Web界面与API

这是一个能让你在网页上直接使用ChatTTS进行语音合成的项目,还提供API接口供你调用,项目地址在GitHub。

试听合成语音效果

Windows预打包版

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;padding-left: 1em;color: rgb(63, 63, 63);" class="list-paddingleft-1">
  1. 1.从Releases页面下载压缩包。

  2. 2.解压后双击app.exe就能用了。

Linux下源码部署

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;padding-left: 1em;color: rgb(63, 63, 63);" class="list-paddingleft-1">
  1. 1. 配置 python3.9+ 环境。

  2. 2.创建空目录/data/chattts,执行命令cd /data/chattts && git clone https://github.com/jianchang512/chatTTS-ui .

  3. 3.创建虚拟环境python3 -m venv venv

  4. 4.激活虚拟环境source ./venv/bin/activate

  5. 5.安装依赖pip3 install -r requirements.txt

  6. 6.如果不需要CUDA加速,执行pip3 install torch torchaudio。如果需要CUDA加速,执行:

  7. ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;overflow-x: auto;border-radius: 8px;margin: 10px 8px;">pipinstalltorchtorchaudio--index-urlhttps://download.pytorch.org/whl/cu118
    pipinstallnvidia-cublas-cu11nvidia-cudnn-cu11

    另需安装 CUDA11.8+ ToolKit,请自行搜索安装方法或参考 https://juejin.cn/post/7318704408727519270。

  8. 7.执行python3 app.py启动,将自动打开浏览器窗口,默认地址http://127.0.0.1:9966

MacOS下源码部署

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;padding-left: 1em;color: rgb(63, 63, 63);" class="list-paddingleft-1">
  1. 1. 安装python3.9+和git。

  2. 2.创建目录/data/chattts,运行git clone https://github.com/jianchang512/chatTTS-ui .

  3. 3.创建并激活虚拟环境python3 -m venv venvsource ./venv/bin/activate

  4. 4.安装依赖pip3 install -r requirements.txtpip3 install torch torchaudio

  5. 5.启动程序python3 app.py,浏览器会自动打开http://127.0.0.1:9966

  6. 6.如果遇到问题,可以查看常见问题与报错解决方法。

Windows源码部署

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;padding-left: 1em;color: rgb(63, 63, 63);" class="list-paddingleft-1">
  1. 1. 安装python3.9+和git。

  2. 2.创建目录D:/chattts,在该目录下运行git clone https://github.com/jianchang512/chatTTS-ui .

  3. 3.创建并激活虚拟环境python -m venv venv.\venv\scripts\activate

  4. 4.安装依赖pip install -r requirements.txt

  5. 5.启动程序python app.py,浏览器会自动打开http://127.0.0.1:9966

源码部署注意事项

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;padding-left: 1em;color: rgb(63, 63, 63);" class="list-paddingleft-1">
      ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;padding-left: 1em;color: rgb(63, 63, 63);list-style-type: lower-alpha;" class="list-paddingleft-1">
    1. 1.部署后需下载spk_stat.pt并放入项目目录/models/pzc163/chatTTS/asset/文件夹内。

    2. 2. 如果遇到proxy错误,关闭代理。想从huggingface.co下载模型,可修改app.py中相应的注释。

常见问题与报错解决方法

修改HTTP地址

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">默认地址是http://127.0.0.1:9966,可通过修改.env文件中的WEB_ADDRESS来更改。

使用API请求

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">请求方法:POST
请求地址:http://127.0.0.1:9966/tts
请求参数:

  • •text: str 必须, 要合成语音的文字

  • •voice: int 可选,默认 2222, 决定音色的数字

  • •prompt: str 可选,设定笑声、停顿

  • •temperature: float 可选,默认 0.3

  • •top_p: float 可选, 默认 0.7

  • •top_k: int 可选, 默认 20

  • •skip_refine: int 可选, 默认0

  • •custom_voice: int 可选, 默认0,自定义音色种子值

返回:json数据

  • •code=0 成功,返回文件名和可下载网址

  • •code=1 失败,返回错误原因

示例代码:

importrequests

res=requests.post('http://127.0.0.1:9966/tts',data={"text":"你好啊亲爱的朋友。[laugh]","voice":2222,"prompt":'[oral_2][laugh_0][break_6]'})
print(res.json())

#成功
{code:0,msg:'ok',filename:'1.wav',url:'http://${location.host}/static/wavs/1.wav'}

#错误
{code:1,msg:"error"}

在pyVideoTrans软件中使用

  1. 1.升级 pyVideoTrans 至 1.82+,点击菜单-设置-ChatTTS,填写请求地址http://127.0.0.1:9966

  2. 2.测试无问题后,在主界面中选择ChatTTS


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ