AI在线 AI在线

OpenAI Evals 新增原生音频评估功能,简化语音模型测试

OpenAI 正在进一步拓展其 Evals 工具的功能,为开发者带来了原生音频输入和音频评分支持。 这项更新意味着,现在可以直接评估模型的音频响应,而无需先进行文本转录。 这一新功能极大地简化了语音识别和语音生成模型的评估流程。

OpenAI 正在进一步拓展其 Evals 工具的功能,为开发者带来了原生音频输入和音频评分支持。这项更新意味着,现在可以直接评估模型的音频响应,而无需先进行文本转录。这一新功能极大地简化了语音识别和语音生成模型的评估流程。

通过 Evals 的原生音频支持,开发者可以更高效地测试和优化其音频应用。用户只需上传音频文件,即可直接在平台上进行性能评估,这不仅减少了数据处理的复杂性,还提高了评估结果的准确性和可靠性。对于那些需要频繁测试和调整音频模型的开发者而言,这是一项重要的进步。

OpenAI

该功能的应用场景非常广泛,例如:智能语音助手的开发与优化,语音识别系统的性能评估,音频内容生成的质量控制。

这一更新为开发者提供了更直接、更高效的工具,以确保其音频应用的高质量和高性能。

地址:https://cookbook.openai.com/examples/evaluation/use-cases/evalsapi_audio_inputs

相关资讯

OpenAI Evals新增原生音频输入和评估功能

近日,OpenAI 的 Evals 工具迎来了令人振奋的重大更新,新增了原生音频输入和评估功能。 这一创新意味着开发者们在测试和优化语音识别与生成模型时,可以直接使用音频文件进行评估,而无需经过繁琐的文本转录过程。 这一变化极大地简化了评估流程,使得音频应用的开发变得更加高效。
9/16/2025 10:06:11 AM
AI在线

OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算,从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题,控制成本成行业挑战。##AI模型成本##
4/3/2025 7:59:45 AM
远洋

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o
9/22/2024 1:27:00 PM
机器之心
  • 1