AI在线 AI在线

音频,模型,AI,技术,7B,MiDashengLM,小米,效率,Dasheng,应用

小米全量开源MiDashengLM-7B:音频理解性能刷新SOTA,推理速度暴增20倍

小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型,这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。 该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩,更在推理效率上展现出惊人优势——单样本推理的首Token延迟仅为业界先进模型的四分之一,数据吞吐效率更是高出20倍以上。 技术架构:双核心设计实现音频全域理解MiDashengLM-7B采用了创新的双核心架构设计,以Xiaomi Dasheng作为音频编码器,结合Qwen2.5-Omni-7B Thinker作为自回归解码器。
8/5/2025 11:19:01 AM
AI在线
  • 1