返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

23.5k Star!OpenVoice:这款AI工具能够精准模仿你的声音并说出任何语言!

[复制链接]
链载Ai 显示全部楼层 发表于 3 天前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1em;letter-spacing: 0.1em;color: rgb(80, 80, 80);">从一小段音频中复制声音并生成多种语言的语音。它不仅支持精准的音色克隆,还可以灵活控制语音风格,如情感和口音,确保声音输出自然流畅。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">体验地址:

https://app.myshell.ai/zh/web3/chat

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-left: 3px solid rgb(0, 152, 116);color: rgb(63, 63, 63);">准确的音色克隆

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">OpenVoice 可以准确克隆参考音色并生成多种语言和口音的语音。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-left: 3px solid rgb(0, 152, 116);color: rgb(63, 63, 63);">灵活的语音风格控制

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">OpenVoice 可以对语音风格(例如情感和口音)以及其他风格参数(包括节奏、停顿和语调)进行精细控制。在这里,我们演示了对生成声音的情感和口音的控制。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-left: 3px solid rgb(0, 152, 116);color: rgb(63, 63, 63);">零样本跨语言语音克隆

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">参考语音和生成的语音可以是海量说话人多语言数据集之外的任何语言。在下面的例子中,我们使用“U”来表示未见过的语言。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-left: 3px solid rgb(0, 152, 116);color: rgb(63, 63, 63);">如何使用

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">以下涉及到的链接无法跳转,请参考如下原教程文档链接

https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md

Linux安装

本节仅供熟悉Linux、Python和PyTorch的开发人员和研究人员使用。克隆此存储库,并运行

condacreate-nopenvoicepython=3.9
condaactivateopenvoice
gitclonegit@github.com:myshell-ai/OpenVoice.git
cdOpenVoice
pipinstall-e.

无论您使用V1还是V2,上述安装过程都是相同的。

OpenVoice V1

从这里下载检查点,并将其解压缩到checkpoints文件夹中。

1. 灵活的语音风格控制。请参阅demo_part1.ipynb以了解OpenVoice如何实现对克隆声音的灵活风格控制的示例用法。

2. 跨语言语音克隆。请参阅demo_part2.ipynb以了解在MSML训练集中看到或未看到的语言的示例。

3. Gradio演示。我们在这里提供了一个简约的本地gradio演示。如果用户在使用gradio演示时遇到问题,我们强烈建议用户查看demo_part1.ipynbdemo_part2.ipynb和QnA。使用python -m openvoice_app --share启动本地gradio演示。

OpenVoice V2

从这里下载检查点,并将其解压缩到checkpoints_v2文件夹中。

安装MeloTTS:

pipinstallgit+https://github.com/myshell-ai/MeloTTS.git
python-munidicdownload

演示用法。请参阅demo_part3.ipynb以了解OpenVoice V2的示例用法。现在它原生支持英语、西班牙语、法语、中文、日语和韩语。

更多配音相关

下面两个灰色的,一个是微软最新的神经网络配音网页资源,一个是实时配音:唯有入梦rvc

获取:

链接:https://pan.baidu.com/s/16aG3_cZPVjvkkd-QWuKmOw?pwd=1234提取码:1234

除此以外这个视频介绍了使用GPT4语音api的教程:

https://www.bilibili.com/video/BV1P64y1E72W/



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ