面壁智能
AI 的下一个战场:小模型崛起
过去一段时间,大模型行业经历了一场风切变。 八月初,腾讯官宣“混元系列小模型”落地,不久后,阿里跟进了两款通义Qwen3-4B。 起初,大家以为只是国内大厂对轰,互秀肌肉罢了。
9/5/2025 9:13:00 PM
齐铖湧
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长! 高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。 MiniCPM-V 4.5 亮点一览 ?
8/27/2025 11:50:00 AM
徐咪
大模型热度退潮,真正的技术创新者开始被「看见」
“过去两年中国的大模型投资并不是投技术,而是套着投技术的壳投商业模式。 硅谷的投资人投 OpenAI 是投技术。 ”一位投资人对 AI 科技评论表示。
6/20/2025 4:30:00 PM
郭海惟
面壁智能 MiniCPM 4 与 Intel 全面适配,实现 AI PC 2.2 倍长文本推理优化
面壁智能于本月 6 日晚发布端侧大模型 MiniCPM 4.0。面壁智能官方今日发文称,面壁 MiniCPM 4 与 Intel 全面适配,结合英特尔加速套件与 KV Cache 内存增强技术,实现 AI PC 2.2 倍长文本推理优化。
6/12/2025 11:40:03 PM
归泷
面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升
6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。 MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。 这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。
6/8/2025 10:00:56 AM
AI在线
面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
该公司称新模型通过自研 CPM.cu 推理框架,在极限场景下实现最高 220 倍提速,常规 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。
6/7/2025 9:31:12 AM
界面快报
面壁智能 CEO 李大海:汽车比手机更适合端侧模型落地
李大海指出,因为汽车这个场景,用户的手天然就会在方向盘上,用户更需要用语音去跟座舱交互,同时座舱也有更多的传感器能够去感知环境。相比之下,手机反而没有这样的条件,所以,汽车反而是端侧模型落地更好的产品。(新浪科技)
3/30/2025 4:14:33 PM
-
独家对话刘知远:AGI 是一场技术理想与商业现实的「持久战」
DeepSeek 以迅雷不及掩耳之势出圈后,中国大部分的大模型团队都被打得措手不及,只有一家公司因为底层技术和 AGI 思想路径与 DeepSeek 相近而暂时“逃过一劫”,这家公司就是:面壁智能。 作为中国最早的一批大模型团队之一,面壁智能成立于 2022 年 8 月,其创始团队从 2021 年就主力参与北京智源人工智能研究院的大模型项目“悟道”,训练出多个百亿、千亿参数规模的大模型,并成立大模型开源社区OpenBMB,是国内最早提出“平民版大模型”、最早促进大模型开源事业的团队之一。 但意料之外、又情理之中的是,尽管团队技术实力出色、对 AGI 的理解深刻,其在 2022 年到 2023 年大模型浪潮刚起、国内纯种大模型团队并不多时,却遭到冷落与误解,未能吃到首轮红利。
3/4/2025 4:26:00 PM
二维马晓宁
面壁智能发布 MiniCPM-o 2.6 全模态模型,号称“端侧 GPT-4o”
官方表示,其总参数量 8B,视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别,是开源社区中模态支持最丰富、性能最佳的模型之一。
1/16/2025 6:23:58 PM
清源
大模型隐藏玩家上桌:DeepSeek 向左,面壁向右
作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后,玩家已逐步分化为三种趋势:一类玩家仍追随 OpenAI 的脚步卷大参数基座模型,另外一类烧不起钱的玩家转头拥抱应用端,而第三类则自始至终都在摸索如何更高效打造出性能更优的模型。 目前,第一类卷向大参数的玩家也都在寻找高效解决方案,连 OpenAI 此前发布 GPT-4o mini 切入小模型市场,Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。 算力存在上限已是不争的事实,而且也并非参数越大就意味着效果一定能达到预期,更何况,如若如果每增长一倍参数规模,效果能力却并未呈一倍增长,大模型发展起来会很慢:OpenAI 能用百千亿达到 GPT-4 的水平,其他家则可能需要投入更多资源,如此一来要追赶 GPT-5 会更难,因为在 OpenAI 的基础上再加码更多算力、参数的可能性不大,这对于大多数无法如同 OpenAI 一般大把烧钱的玩家而言并非理智选择。
1/16/2025 5:14:00 PM
朱可轩
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
真实世界的视觉信息是流动的,而在处理流动性的视觉信息上,端侧视频理解具有天然优势,手机、PC、AR、机器人、智能座驾等端侧设备自带的摄像头,具有天然的多模态输入能力。 与云端相比,端侧离用户更近,链路更短,效率更高,同时具有更强的信息安全优势。 今日,面壁正式发布了 MiniCPM-V 2.6,在端侧性能实现全面对标 GPT-4V——据介绍,MiniCPM-V 2.6 首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越GPT-4V,三项能力均取得 20B 以下 SOTA 成绩,单图理解越级比肩 Gemini 1.5 Pro 和 GPT-4o mini 。
8/7/2024 9:42:00 AM
朱可轩
可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文主要作者来自 MiniCPM-V 团队,其中第一作者余天予是清华大学 2021 级硕士研究生,他的主要研究方向是通用多模态基础大模型构建及其对齐方法。近期,由清华大学自然语言处理实验室
6/11/2024 12:15:00 AM
机器之心
国产端侧小模型超越 GPT-4V,「多模态」能力飞升
在刚刚过去的机器人学术顶会 ICRA 2024 上,「具身智能」成为热议,其中围绕具身智能的一个普遍疑问是:若将 AI 大模型应用到消费级机器人领域,首先是模型适配终端,还是终端适配模型? 过去一年,由于 6B、7B 等小模型的成果井喷,以及 MoE 训练技术的越发成熟,将模型跑在手机、学习机、平板电脑、机器人甚至汽车等等终端应用上的想象力开始变大,无论算法层还是硬件层都「蠢蠢欲动」。 诚然,这已经成为一个明朗的行业方向,但在系统整合上却要面临不同话语体系之间的博弈。
5/20/2024 4:10:00 PM
陈彩娴
面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!
图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。 图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。 Eurux-8x22B 由 Mistral-8x22B对齐而来。
5/1/2024 9:38:00 PM
张进
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。 从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最大的一个,被调侃为「庞然大物」。 然而,有研究人员测试却发现,参数规模量如此巨大的 Grok-1 ,效果竟然只与 Mistral AI 的 8x7B MoE 模型相当。
4/16/2024 2:28:00 PM
王悦
企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书
一年多来,大模型技术的进步日新月异,模型能力的上限不断抬高。但从产业变革的角度看,大模型的落地或许刚刚处于开端阶段。如何才能发挥出大模型的巨大潜力,并推动生产力更快更好地变革,仍然是一个充满探索空间的课题。每个行业都关心一个问题:将大模型应用到业务层面的最优方法论是什么?当我们谈及这个问题,自然无法避开「AI Agent」(智能体)。当 AI 从学术前沿跨越到实际应用,大模型驱动的智能体正成为推动革新的核心动力。连比尔盖茨也预言,AI Agent 将是人工智能的未来。到那时,AI Agent 将具备规划、执行、感知
4/12/2024 7:54:00 PM
机器之心
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
OpenAI后,大模型新增长曲线来了。大语言模型的效率,正在被这家「清华系」创业公司发展到新高度。从 ChatGPT 到 Sora,生成式 AI 技术遵从《苦涩的教训》、Scaling Law 和 Emerging properties 的预言一路走来,让我们已经看到了 AGI 的冰山一角,但技术的发展的方向还不尽于此。最近一段时间,科技公司大力投入生成式 AI,一系列新的概念正在出现:手机厂商认为「AI 手机」正在引领手机形态的第三次转变;PC 厂商认为「AI PC」可能会改变个人电脑的形态;而对于更多科技公司来
4/12/2024 7:51:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型