链载Ai

标题: 开口跪!小智 AI 语音情感值拉满,全靠 CosyVoice 2.0! 太顶了,多语言、方言、声音克隆全拿捏! [打印本页]

作者: 链载Ai    时间: 昨天 17:57
标题: 开口跪!小智 AI 语音情感值拉满,全靠 CosyVoice 2.0! 太顶了,多语言、方言、声音克隆全拿捏!


ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">混迹技术圈有些年头了,平时就喜欢捣鼓各种新鲜玩意儿,特别是那些能改变我们生活、提升效率的技术。我总觉得,光会用还不够,得琢磨它背后是咋实现的,能用它来解决点啥实际问题,这样才带劲。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">最近啊,语音技术是越来越火了,从智能音箱到各种 App 的语音助手,甚至虚拟人直播,都离不开一个核心技术——语音合成,也就是 TTS(Text-to-Speech)。让机器像人一样自然地说话,这事儿听起来简单,做起来可不容易。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">市面上 TTS 工具不少,但要么效果差点意思,要么就是闭源收费,想自己定制或者深入研究就比较麻烦。不过,就在最近,我发现 FunAudioLLM 团队开源了一个叫ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(183, 110, 121);">CosyVoice的项目,特别是他们刚发布的ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(183, 110, 121);">CosyVoice 2.0[1]版本,简直让我眼前一亮,忍不住想跟大家唠唠。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;margin: 0.1em auto 0.5em;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 8px;height: auto !important;" title="null" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=108106&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy9vWHFHOEVUdkFla0oyc1F2bjdFa3pqSm5wVXBpY0FDVnZIS1RmUG5NcUZtMUxKbW8yVmptVGtiM21pYmFNSE1qaWI0UlQwREtDaWJkdVYwaWM2SUJIYXkzVmh3LzY0MD93eF9mbXQ9cG5nJmFtcA==;from=appmsg"/>

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这玩意儿可不是一般的 TTS,它不仅效果惊人,而且功能强大到有点“离谱”,关键还是ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(183, 110, 121);">开源的!Apache-2.0 许可,意味着你可以自由地使用、修改和分发,对于我们开发者来说,这简直是福音啊!

CosyVoice 2.0:它到底“顶”在哪?

咱们直接上干货,看看 CosyVoice 2.0 都有哪些让人惊艳的本事:

  1. 1.语言大师,连方言都hold住!





欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5