AI在线 AI在线

面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升

6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。 MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。 这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。

MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

在速度方面,MiniCPM4.0实现了极限情况下220倍、常规5倍的速度提升,这一突破得益于系统级稀疏创新的层层加速。通过高效双频换挡技术,模型能够根据文本长度自动切换稀疏与稠密注意力机制,确保长文本处理快速且高效,同时大幅减少端侧存储需求,相较于同类模型Qwen3-8B,仅需1/4的缓存存储空间。

微信截图_20250608095812.png

效能上,MiniCPM4.0贡献了行业首例全开源的系统级上下文稀疏化高效创新,以5%的极高稀疏度实现极限加速,并融合自研创新技术,从架构层、系统层、推理层到数据层进行全面优化,真正做到系统级软硬件稀疏化高效落地。

性能方面,MiniCPM4.0延续了“以小博大”的传统,0.5B版本仅以2.7%的训练开销便达到了一半参数、性能翻倍的效果;而8B稀疏版则以22%的训练开销对标并超越Qwen3及Gemma312B,巩固了其在端侧领域的领先地位。

落地应用上,MiniCPM4.0展现出强悍的实力。通过自研CPM.cu极速端侧推理框架,结合投机采样创新、模型压缩量化创新及端侧部署框架创新,实现了模型瘦身90%的同时极致提升速度,确保端侧推理从天生到终生的丝滑体验。

目前,该模型已成功适配Intel、高通、MTK、华为昇腾等主流芯片,并在多个开源框架上实现部署,进一步拓展了其应用潜力。

模型合集:

https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d

Github:

https://github.com/openbmb/minicpm

相关资讯

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。 同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。 新发布的“产品支持代理”由Adobe Experience Platform Agent Orchestrator提供技术支持,能够在AI Assistant的对话界面中,为用户提供即时的操作指导和支持案例创建流程。
6/6/2025 11:00:55 AM
AI在线

OpenAI 升级 ChatGPT 语音模式,体验更自然对话

OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。 这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。 在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。
6/9/2025 11:00:56 AM
AI在线

Claude移动端语音对话功能测试版上线,支持日程查询与文档搜索

Anthropic近日宣布,其AI助手Claude的移动端应用推出语音对话功能测试版,为用户带来更便捷的交互体验。 该功能支持通过语音指令查询日程、搜索文档、发送邮件等操作,显著提升移动端生产力。 目前,测试版仅支持英语,Anthropic计划在未来几周内向全球用户推出多语言支持。
5/28/2025 10:01:01 AM
AI在线
  • 1