返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

中国电信推出支持30种方言的星辰语音大模型

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 09:57 |阅读模式 打印 上一主题 下一主题

中国电信在2024年智算云生态大会上展示了其在人工智能领域的最新技术成果,其中包括业内首个支持30多种方言自由混说的星辰语音大模型。

星辰语音大模型由中国电信人工智能研究院自主研发,采用了“蒸馏+膨胀”联合训练算法、超大规模语音预训练和多方言联合建模技术。使得该模型能够同时识别和理解包括粤语、上海话、四川话、温州话等在内的多种方言,有效解决了传统语音识别系统仅适用于特定方言的局限。

中国电信人工智能公司总经理何忠江在大会上介绍,研发团队构建了一个超过30种方言、30万小时以上的高质量方言数据库。这一系统不仅大大降低了推理时的语音传输比特率,而且让沟通更加自然流畅,尤其为老年人及“老少边穷”地区的信息服务提供了极大的便利。

何忠江还表示,发布会后,星辰语音大模型的算法代码和训练代码将面向社会全部开源开放。中国电信希望业界同仁能够利用这一大模型底座,发挥出更好的商业价值和学术价值,共同构建中国方言的AI体系,推动方言的数字化和AI化,防止方言在历史长河中消失。

除了星辰语音大模型,中国电信还展示了TeleSearch视觉大模型3.0版本,这是一个面向千种场景的新一代大规模视频AI解析系统。TeleSearch通过整合多源跨模态信息,实现了精准的跨模态理解,解决了行业内的多个痛点,如数据采集难、算法精度低、任务碎片化和开发周期长等问题。

在智算云生态大会上,中国电信还展示了包括星辰大模型一体机、星海大数据AI融合平台、星辰慧记、AIGC文创、AI智能听力机等在内的多项AI软硬件产品。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ