链载Ai

标题: 字节超快超强声音克隆 MegaTTS3, 声音克隆几乎一模一样, 可跨语言克隆. [打印本页]

作者: 链载Ai    时间: 7 小时前
标题: 字节超快超强声音克隆 MegaTTS3, 声音克隆几乎一模一样, 可跨语言克隆.

ComfyUI 的 MegaTTS3 声音克隆节点

https://github.com/billwuhao/ComfyUI_MegaTTS3

声音克隆质量非常高, 支持中英文, 并可跨语言克隆.

? 更新

[2025-04-06]⚒️: 发布 v1.0.0.

安装

cdComfyUI/custom_nodes
gitclonehttps://github.com/billwuhao/ComfyUI_MegaTTS3.git
cdComfyUI_MegaTTS3
pip install -r requirements.txt

# python_embeded
./python_embeded/python.exe -m pip install -r requirements.txt

模型下载

模型和音色需要手动下载放到ComfyUI\models\TTS路径下:

[MegaTTS3](https://huggingface.co/ByteDance/MegaTTS3/tree/main) 整个文件夹全部下载放到TTS文件夹下.

MegaTTS3文件夹中新建speakers文件夹, 从 [Google drive](https://drive.google.com/drive/folders/1QhcHWcy20JfqWjgqZX1YM3I6i9u4oNlr)下载所有.wav.npy文件, 放到speakers文件夹下.

唯一的遗憾是不能自定义克隆声音, 因为克隆质量太好了, 出于安全考虑, 官方未发布自定义克隆的参数, 但是你可以上传要克隆的声音申请(长度 24s 内), 申请地址:
https://drive.google.com/drive/folders/1gCWL1y_2xu9nIFhUX_OW5MbcFuB7J5Cl
目前已经有近 300 种音色了. 我已经打包上传到云盘, 文末获取.
鸣谢


- 效果演示. 前面是原声, 后面是克隆:

01

02

03

04

05


公众号后台聊天窗口回复250406获取.








欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5