链载Ai

标题: ChatTTS - 用于日常对话的生成语音模型 [打印本页]

作者: 链载Ai    时间: 3 天前
标题: ChatTTS - 用于日常对话的生成语音模型

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">短短一周时间,Star数就飙升到了18k。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">先来听听Demo:

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">英文男声

英文女声
中文男声
中文女声

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">ChatTTS 是一个专为对话场景(如大语言模型助手)设计的文本转语音模型。它支持中英文两种语言。模型经过超过10万小时的中英文语音训练。开源版本在 HuggingFace 上,是一个经过4万小时预训练但未进行微调(SFT)的模型。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: normal;text-align: left;text-wrap: wrap;">项目亮点

    ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;">
  1. 对话式TTS:ChatTTS 经过优化,专用于对话任务,能够生成自然且富有表现力的语音合成。它支持多说话人,有助于实现互动对话。
  2. 细粒度控制:该模型能够预测并控制细粒度的韵律特征,包括笑声、停顿和感叹词等。
  3. 更好的韵律:在韵律方面,ChatTTS 超过了大多数开源的TTS模型。ChatTTS提供预训练模型,以支持进一步的研究和开发。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: normal;text-align: left;text-wrap: wrap;line-height: 26px;">生成过程还是有点慢的,耐心等待~这个是我最后跑的效果:







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5