面壁智能发布端侧大模型“前进四”MiniCPM 4.0，号称性能大小王

作者：界面快报 2025-06-07 09:31

该公司称新模型通过自研 CPM.cu 推理框架，在极限场景下实现最高 220 倍提速，常规 5 倍提速，支持在 vLLM、SGLang、LlamaFactory 等框架部署。

面壁智能 6 日晚发布端侧大模型 MiniCPM 4.0。该公司称新模型通过自研 CPM.cu 推理框架，在极限场景下实现最高 220 倍提速，常规 5 倍提速，支持在 vLLM、SGLang、LlamaFactory 等框架部署。

此次发布的一款 8B 闪电稀疏版，采用创新稀疏架构掀起高效风暴；另一款 0.5B 则被称作“轻巧灵动的最强小小钢炮”。

据官方介绍，此次面壁推出的 MiniCPM 4.0 系列 LLM 模型拥有 8B、0.5B 两种参数规模，针对单一架构难以兼顾长、短文本不同场景的技术难题，MiniCPM 4.0-8B 采用「高效双频换挡」机制，能够根据任务特征自动切换注意力模式：在处理高难度的长文本、深度思考任务时，启用稀疏注意力以降低计算复杂度，在短文本场景下切换至稠密注意力以确保精度，实现了长、短文本切换的高效响应。

面壁智能发布端侧大模型“前进四”MiniCPM 4.0，号称性能大小王

据AI在线了解，MiniCPM 4.0 可在 vLLM、SGLang、LlamaFactory、XTuner 等开源框架部署。其内置自研 CPM.cu 极速端侧推理框架，从投机采样创新、模型压缩量化创新、端侧部署框架创新几方面，带来 90% 的模型瘦身和速度提升，官方宣称将实现端侧推理“从天生到终生”的丝滑。

独家对话刘知远：AGI 是一场技术理想与商业现实的「持久战」

DeepSeek 以迅雷不及掩耳之势出圈后，中国大部分的大模型团队都被打得措手不及，只有一家公司因为底层技术和 AGI 思想路径与 DeepSeek 相近而暂时“逃过一劫”，这家公司就是：面壁智能。作为中国最早的一批大模型团队之一，面壁智能成立于 2022 年 8 月，其创始团队从 2021 年就主力参与北京智源人工智能研究院的大模型项目“悟道”，训练出多个百亿、千亿参数规模的大模型，并成立大模型开源社区OpenBMB，是国内最早提出“平民版大模型”、最早促进大模型开源事业的团队之一。但意料之外、又情理之中的是，尽管团队技术实力出色、对 AGI 的理解深刻，其在 2022 年到 2023 年大模型浪潮刚起、国内纯种大模型团队并不多时，却遭到冷落与误解，未能吃到首轮红利。

3/4/2025 4:26:00 PM 二维马晓宁

面壁智能 CEO 李大海：汽车比手机更适合端侧模型落地

李大海指出，因为汽车这个场景，用户的手天然就会在方向盘上，用户更需要用语音去跟座舱交互，同时座舱也有更多的传感器能够去感知环境。相比之下，手机反而没有这样的条件，所以，汽车反而是端侧模型落地更好的产品。（新浪科技）

3/30/2025 4:14:33 PM -

面壁智能推出MiniCPM 4.0端侧大模型可实现220倍速度提升

6月6日，面壁智能正式推出其最新力作——MiniCPM4.0系列模型，这一系列被誉为“有史以来最具想象力的小钢炮”，不仅在端侧性能上实现了飞跃，更在技术创新上树立了新的标杆。 MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版，以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版，被誉为“最强小小钢炮”。这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

6/8/2025 10:00:56 AM AI在线

面壁智能发布端侧大模型“前进四”MiniCPM 4.0，号称性能大小王

相关资讯

独家对话刘知远：AGI 是一场技术理想与商业现实的「持久战」

面壁智能 CEO 李大海：汽车比手机更适合端侧模型落地

面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升

面壁智能推出MiniCPM 4.0端侧大模型可实现220倍速度提升