AI在线 AI在线

OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术

科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA

科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。

OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。

OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术

OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:

OpenAI 在发布会上展示了一款调用 Realtime API 制作的旅行规划应用,用户可以与 AI 助手交谈有关伦敦之行,并获得快速回复,该 API 还可以在地图上添加餐厅建议。

Speak 是一款语言学习应用程序,它使用 Realtime API 来支持其角色扮演功能,鼓励用户用新语言练习对话。

Healthify 是一款营养和健身指导应用程序,它使用 Realtime API 实现与其 AI 教练 Ria 的自然对话,同时在需要个性化支持时让人类营养师参与进来。

相关资讯

OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通

OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。 该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。 该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。
8/29/2025 9:27:11 AM
AI在线

微软正式发布 GPT-realtime 模型,主打更逼真语音与多模态输入

微软正式宣布,其最新的语音转语音 (S2S) 模型 GPT-realtime 已在 Azure AI Foundry 平台上正式发布。 这款新模型将微软在语音技术方面的多项改进整合到一个统一的产品中,其核心优势聚焦于自然的语言处理、卓越的音频质量以及更精准的指令跟随能力。 开发者现在可以通过全新的 Real-time API 访问 GPT-realtime。
9/5/2025 10:17:04 AM
AI在线

微软发布 VibeVoice 0.5B:仅0.5B参数却实现300毫秒实时开口

微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。 尽管模型规模仅为0.5B,但却具备接近实时的语音生成能力,最快可在约300毫秒内开始发声,实现“话未说完音已先到”的流畅体验。 该模型支持中英文实时转录与语音生成,其中中文表现略逊于英文,但整体依然保持高流畅度与高还原度。
12/5/2025 11:26:14 AM
AI在线