端侧模型

AI 的下一个战场：小模型崛起

过去一段时间，大模型行业经历了一场风切变。八月初，腾讯官宣“混元系列小模型”落地，不久后，阿里跟进了两款通义Qwen3-4B。起初，大家以为只是国内大厂对轰，互秀肌肉罢了。

9/5/2025 9:13:00 PM

齐铖湧

vivo发布端侧多模态模型，只有3B可理解GUI界面，20项评测表现亮眼

vivo AI Lab发布AI多模态新模型了，专门面向端侧设计，紧凑高效～. 能够直接理解GUI页面的那种：模型BlueLM-2.5-3B，融合文本和图文的理解和推理能力，支持长短思考模式自由切换，并引入思考预算控制机制。与同尺寸模型相比，BlueLM-2.5-3B在多个文本与多模态评测任务中表现出色。

7/10/2025 4:59:08 PM

西风

作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后，玩家已逐步分化为三种趋势：一类玩家仍追随 OpenAI 的脚步卷大参数基座模型，另外一类烧不起钱的玩家转头拥抱应用端，而第三类则自始至终都在摸索如何更高效打造出性能更优的模型。目前，第一类卷向大参数的玩家也都在寻找高效解决方案，连 OpenAI 此前发布 GPT-4o mini 切入小模型市场，Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。算力存在上限已是不争的事实，而且也并非参数越大就意味着效果一定能达到预期，更何况，如若如果每增长一倍参数规模，效果能力却并未呈一倍增长，大模型发展起来会很慢：OpenAI 能用百千亿达到 GPT-4 的水平，其他家则可能需要投入更多资源，如此一来要追赶 GPT-5 会更难，因为在 OpenAI 的基础上再加码更多算力、参数的可能性不大，这对于大多数无法如同 OpenAI 一般大把烧钱的玩家而言并非理智选择。

1/16/2025 5:14:00 PM

朱可轩

机器人端侧模型的十字路口

作者｜朱可轩编辑｜陈彩娴自 2023 年以来，以大模型为代表的人工智能与以具身智能为代表的机器人成为科技发展的两股重要力量。与此同时，将人工智能算法、尤其是大模型应用于进一步提升机器人智能水平也成为一个自然而然的趋势。在这个背景下，“机器人学习”、“具身大脑”成为炙手可热的名词。

12/25/2024 9:34:00 AM

朱可轩

端侧ChatGPT时刻！这家清华系大模型公司赶在OpenAI、苹果之前

下周苹果即将召开发布会了！但最令笔者期待的不是 iphone16，而是苹果今年提出的 Apple Intelligence 的进展，这是苹果今年进军端侧 AI 的一大杀手锏。其实早在今年年初，国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号，当时还没有太多玩家意识到端侧AI的重要性。

9/9/2024 3:54:00 PM

我在思考中

独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元

近日，关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情，坊间传得沸沸扬扬。此前，杨红霞为大家所熟知的是，她曾是阿里达摩院万亿参数规模多模态预训练模型 M6 的技术负责人，参与过北京智源研究院主导的“悟道”大模型项目，而该项目是中国最早的大模型项目之一。 2007 年，杨红霞从南开大学本科毕业后，赴杜克大学攻读博士，师从著名统计学家 David Dunson，著有超过 100 篇杰出学术论文。

5/30/2024 5:18:00 PM

晓楠

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云