AI在线 AI在线

清华与 OpenBMB 联合推出 UltraEval-Audio:音频模型评测新框架开源发布

近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。 UltraEval-Audio 不仅为音频大模型领域建立了一整套完整的评测方法论,还将这一体系具体化为一个开箱即用的工程框架,从而完善了音频评测的整体结构。 UltraEval-Audio 的最新版本 v1.1.0在原有 “一键测评” 功能的基础上,增加了热门音频模型的一键复现能力,并扩展了对文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业模型的支持。

近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域建立了一整套完整的评测方法论,还将这一体系具体化为一个开箱即用的工程框架,从而完善了音频评测的整体结构。

image.png

UltraEval-Audio 的最新版本 v1.1.0在原有 “一键测评” 功能的基础上,增加了热门音频模型的一键复现能力,并扩展了对文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业模型的支持。此外,这一版本引入了隔离推理的运行机制,旨在降低模型复现的门槛,提高评测流程的可控性与可迁移性。

值得注意的是,UltraEval-Audio v1.1.0已经成为 MiniCPM-o2.6、VoxCPM 等众多高影响力音频及全模态模型的重要测评工具。该框架的开源将显著提高研究者在音频模型开发过程中的效率,推动相关领域的研究进展。

开源地址也已公开,研究者们可以通过 GitHub 获取更多信息。UltraEval-Audio 的发布,标志着音频模型评测的标准化进程迈出了重要一步,助力音频技术的快速发展。

开源地址:https://github.com/OpenBMB/UltraEval-Audio

划重点:  

🌟 UltraEval-Audio 是音频模型的测评框架,由清华 NLP 实验室、OpenBMB 与面壁智能联合发布。  

🚀 最新版本 v1.1.0新增一键复现功能,支持更多专业模型的评测。  

📈 开源发布将显著提升研究者的开发效率,推动音频模型领域的进步。

相关资讯

调查:超72% 的企业选择 AI 工具时最看重易用性

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM AI在线
可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM 准泽(实习)
城商行掀起大模型招标潮,百万级投入成行业新风口!

城商行掀起大模型招标潮,百万级投入成行业新风口!

在人工智能技术快速发展的背景下,越来越多的城商行开始纷纷参与到大模型的招标中。 根据最新消息,超过10家中小银行近期启动了大模型相关项目的招标,标志着这一领域的竞争加剧。 这些银行希望通过大模型技术优化现有的金融服务流程,提高运营效率,进而为客户提供更优质的服务。
7/11/2025 11:11:51 AM AI在线