AI在线 AI在线

​谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

谷歌最近发布了 Gemini2.5Flash Native Audio 的更新,显著增强了其语音助手的功能。 这一版本旨在更好地处理复杂的工作流程,提高执行用户指令的准确性,同时使对话更加自然流畅。 根据谷歌的反馈,新版本在开发者指令的遵循率上从84% 提升至90%,这表明语音助手在理解和执行用户请求方面有了显著进步。

谷歌最近发布了 Gemini2.5Flash Native Audio 的更新,显著增强了其语音助手的功能。这一版本旨在更好地处理复杂的工作流程,提高执行用户指令的准确性,同时使对话更加自然流畅。根据谷歌的反馈,新版本在开发者指令的遵循率上从84% 提升至90%,这表明语音助手在理解和执行用户请求方面有了显著进步。

在多步骤对话的质量上,更新也带来了明显改善。用户在与语音助手互动时,将体验到更流畅的沟通。这种提升使得助手能够更好地适应复杂的询问和任务,使用户感受到更高效的服务。

谷歌还透露,更新后的音频模型在 ComplexFuncBench 基准测试中,函数调用的准确率达到了71.5%,相比之下,OpenAI 的 gpt-realtime 则为66.5%。不过需要指出的是,谷歌在测试中可能并未使用 OpenAI 最近发布的最新版本。

此次更新已经在 Google AI Studio、Vertex AI、Gemini Live 和 Search Live 中上线,Google Cloud 的客户也开始使用这项新技术。开发者们可以通过 Gemini API 对模型进行测试,进一步探索其潜力。

这次的更新不仅仅是功能的提升,也反映出谷歌在人工智能领域不断进步的决心和努力,为用户提供更好的体验。

划重点:  

🌟 更新后的语音助手在遵循用户指令方面的准确率从84% 提升至90%。  

📈 新版本在 ComplexFuncBench 基准测试中,函数调用准确率达到71.5%。  

💻 开发者可通过 Gemini API 对新模型进行测试,体验其改进的功能。

相关资讯

谷歌推出更新版 Gemini 2.5 Pro,AI 性能大幅提升

谷歌最近在其 AI 模型系列中迎来了重要更新。 继今年3月底推出 Gemini2.5Pro 模型后,谷歌紧接着在4月发布了更为轻量的 Gemini2.5Flash 版本。 虽然两者目前都处于预览阶段,但 Gemini2.5Flash 版本已经通过 Gemini App 向全球用户开放,用户可以体验其强大的功能。
6/6/2025 9:00:55 AM
AI在线

Anthropic在移动端推Claude对话语音模式,可搜索Google 文档、日历等

位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。 该功能已在苹果 App Store(iOS 设备)和谷歌 Play Store(Android 设备)的移动应用中上线。 除了语音模式的推出,Anthropic还为所有免费用户扩展了网络搜索功能。
5/28/2025 10:01:00 AM
AI在线

Salesforce 斥资80亿美元收购 Informatica 押注Agent

Salesforce 周二宣布,将以约80亿美元现金收购云数据管理公司 Informatica,旨在进一步强化其 AI 战略核心 Agentforce 平台的能力。 根据协议,Informatica A 类和 B-1类普通股股东将获得每股25美元的现金回报。 交易将通过 Salesforce 的现金储备与新增债务的方式融资。
5/28/2025 10:01:01 AM
AI在线