AI在线 AI在线

​ChatGPT 语音功能升级,实时翻译对话更自然流畅

最近,OpenAI 对其 ChatGPT 的语音功能进行了全面升级,特别是针对订阅用户,旨在提升 AI 的语音表达的自然性和情感丰富度。 根据 OpenAI 的说法,更新后的 “高级语音模式” 现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。 图源备注:图片由AI生成,图片授权服务商Midjourney值得注意的是,此次更新还新增了实时翻译功能。

最近,OpenAI 对其 ChatGPT 的语音功能进行了全面升级,特别是针对订阅用户,旨在提升 AI 的语音表达的自然性和情感丰富度。根据 OpenAI 的说法,更新后的 “高级语音模式” 现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。

音频 声波 智能语音

图源备注:图片由AI生成,图片授权服务商Midjourney

值得注意的是,此次更新还新增了实时翻译功能。用户现在可以选择特定的语言对,要求 ChatGPT 进行翻译。AI 将会不断地对话双方的内容进行翻译,直到用户指示停止。这一功能非常适用于餐馆点餐或多语言的工作场景。

付费用户只需在聊天界面的语言图标上点击,即可在所有平台上体验这些语音改进。然而,OpenAI 也指出仍存在一些已知问题。用户可能会遇到偶尔的音频质量下降,比如音调或音量的突变,这在某些语音中可能更为明显。此外,所谓的 “幻觉” 现象仍然存在,ChatGPT 有时会无缘无故地产生奇怪的声音,例如广告片段、随机噪音,甚至是背景音乐。最近有用户反映,ChatGPT 在对话中突然播放了一段广告,尽管 OpenAI 并未投放广告。

image.png

OpenAI 在2024年5月首次推出了 “高级语音模式”,并于2024年10月扩大了在欧盟的可用性。该功能的目标是实现与 AI 的自然实时互动,包括在对话中打断和表达情感。如果用户打开摄像头,ChatGPT 还可以对周围的物体或环境进行实时评论。类似的功能也出现在谷歌的 Gemini 应用中。

划重点:  

🌟 OpenAI 对 ChatGPT 进行了语音功能升级,使其语音更加自然流畅,情感表达更丰富。  

🌍 新增实时翻译功能,用户可选择语言对进行连续翻译,适用于多语言场景。  

⚠️ 仍存在一些问题,包括音频质量波动和无故生成的奇怪声音。

相关资讯

告别打字:OpenAI 免费开放 ChatGPT AI 语音聊天,GPT-4o mini 加持

OpenAI宣布免费开放ChatGPT高级语音模式,基于GPT-4o mini模型,提供更自然的语音对话体验。macOS和Windows用户现可免费使用,但音频输入输出有每日限制。Plus用户享受5倍限额,Pro用户无限制。#ChatGPT #AI语音对话
2/26/2025 10:26:49 AM
故渊

​OpenAI 更新语音助手功能,让对话更自然流畅、减少打断频率

OpenAI 于本周一发布了其高级语音模式的更新,该功能允许用户与 ChatGPT 进行实时对话。 更新后的语音助手在交流中表现得更加人性化,并且减少了对用户的打断频率。 OpenAI 的后期培训研究员 Manuka Stratta 通过一段视频在公司官方社交媒体渠道上公布了这一消息。
3/25/2025 9:44:00 AM
AI在线

OpenAI 升级 ChatGPT AI 高级语音模式:减少打断、支持暂停思考

OpenAI近日升级了ChatGPT的高级语音模式,重点优化了对话流畅度,减少了不必要的打断,并新增了暂停功能。针对付费用户,还增强了语音个性表现,提供9种风格化人声选项。#ChatGPT升级# #OpenAI#
3/25/2025 2:42:41 PM
故渊
  • 1