返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

OpenAI发布高级语音模式(AVM):ChatGPT更自然的对话体验

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

01

概述

OpenAI于周二宣布,将向ChatGPT Plus和团队级别的付费用户推出高级语音模式(AVM)。这项音频功能将使用户与ChatGPT的对话更加自然。AVM的初期推出将面向ChatGPT Plus和Teams用户,企业与教育用户则将从下周开始获得使用权限。
作为此次更新的一部分,AVM的界面也经过了重新设计,现在以一个蓝色的动态球体来代表这项功能,取代了5月份展示该技术时所用的动态黑点。用户将在ChatGPT应用中的语音图标旁收到一个弹出窗口,以提示AVM功能的可用性。

02

功能新增与调整

此外,ChatGPT新增了五种新的声音,分别是Arbor、Maple、Sol、Spruce和Vale,使得ChatGPT的总声音种类达到九种,几乎与谷歌的Gemini Live相当。这些名称均受到大自然的启发,可能是因为AVM旨在使ChatGPT的使用体验更加自然。
值得注意的是,OpenAI在此次更新中没有包括之前春季更新中展示的Sky声音。这是因为演员斯嘉丽·约翰逊对该声音提出异议,认为其与她在电影《她》中扮演的AI系统的声音过于相似。OpenAI迅速响应,撤下Sky声音,并声明从未有意模仿约翰逊的声音。这一决定显示了OpenAI对用户反馈的重视。

03

性能改进与个性化功能

OpenAI还表示,自AVM的alpha测试发布以来,已经进行了一些改进。ChatGPT的语音功能现在对各种口音的理解更为精准,对话也变得更加流畅和快速。此外,OpenAI将ChatGPT的一些定制功能扩展到了AVM,包括允许用户个性化ChatGPT的响应方式以及增强记忆功能,以便ChatGPT能够在后续对话中引用之前的内容。
然而,此次推广中并未包括ChatGPT的视频和屏幕共享功能。该功能原本应该允许GPT-4同时处理视觉和听觉信息。目前,OpenAI尚未提供这些多模态功能推出的时间表。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ