AI在线 AI在线

面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升

6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。 MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。 这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。

MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

在速度方面,MiniCPM4.0实现了极限情况下220倍、常规5倍的速度提升,这一突破得益于系统级稀疏创新的层层加速。通过高效双频换挡技术,模型能够根据文本长度自动切换稀疏与稠密注意力机制,确保长文本处理快速且高效,同时大幅减少端侧存储需求,相较于同类模型Qwen3-8B,仅需1/4的缓存存储空间。

微信截图_20250608095812.png

效能上,MiniCPM4.0贡献了行业首例全开源的系统级上下文稀疏化高效创新,以5%的极高稀疏度实现极限加速,并融合自研创新技术,从架构层、系统层、推理层到数据层进行全面优化,真正做到系统级软硬件稀疏化高效落地。

性能方面,MiniCPM4.0延续了“以小博大”的传统,0.5B版本仅以2.7%的训练开销便达到了一半参数、性能翻倍的效果;而8B稀疏版则以22%的训练开销对标并超越Qwen3及Gemma312B,巩固了其在端侧领域的领先地位。

落地应用上,MiniCPM4.0展现出强悍的实力。通过自研CPM.cu极速端侧推理框架,结合投机采样创新、模型压缩量化创新及端侧部署框架创新,实现了模型瘦身90%的同时极致提升速度,确保端侧推理从天生到终生的丝滑体验。

目前,该模型已成功适配Intel、高通、MTK、华为昇腾等主流芯片,并在多个开源框架上实现部署,进一步拓展了其应用潜力。

模型合集:

https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d

Github:

https://github.com/openbmb/minicpm

相关资讯

北京国资助力!面壁智能大模型融资再创佳绩,落地汽车、手机等领域

在人工智能领域持续升温的大背景下,北京国有资本再度出手,助力面壁智能完成新一轮融资。 自今年8月国务院发布《关于深入实施 “人工智能 ” 行动的意见》以来,国内端侧大模型领域的首笔公开融资便浮出水面。 面壁智能此次融资金额达到数亿元,由北京市属国有投资平台 “京国瑞” 及创投基金 “米聚合基” 等共同参与,资金将主要用于提升端侧大模型的研发及商业化进程。
10/12/2025 9:24:12 AM
AI在线

独家对话刘知远:AGI 是一场技术理想与商业现实的「持久战」

DeepSeek 以迅雷不及掩耳之势出圈后,中国大部分的大模型团队都被打得措手不及,只有一家公司因为底层技术和 AGI 思想路径与 DeepSeek 相近而暂时“逃过一劫”,这家公司就是:面壁智能。 作为中国最早的一批大模型团队之一,面壁智能成立于 2022 年 8 月,其创始团队从 2021 年就主力参与北京智源人工智能研究院的大模型项目“悟道”,训练出多个百亿、千亿参数规模的大模型,并成立大模型开源社区OpenBMB,是国内最早提出“平民版大模型”、最早促进大模型开源事业的团队之一。 但意料之外、又情理之中的是,尽管团队技术实力出色、对 AGI 的理解深刻,其在 2022 年到 2023 年大模型浪潮刚起、国内纯种大模型团队并不多时,却遭到冷落与误解,未能吃到首轮红利。
3/4/2025 4:26:00 PM
二维马晓宁

面壁智能 CEO 李大海:汽车比手机更适合端侧模型落地

李大海指出,因为汽车这个场景,用户的手天然就会在方向盘上,用户更需要用语音去跟座舱交互,同时座舱也有更多的传感器能够去感知环境。相比之下,手机反而没有这样的条件,所以,汽车反而是端侧模型落地更好的产品。(新浪科技)
3/30/2025 4:14:33 PM
-
  • 1