智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

作者：AI在线 2025-12-09 11:36

智谱正式并上线开源 GLM-4.6V 多模态大模型系列，含基础版 GLM-4.6V（总参106B，激活12B）与轻量版 GLM-4.6V-Flash(9B)。新模型将上下文窗口提升至128k tokens，视觉理解精度达同参数 SOTA，首次把 Function Call 能力原生融入视觉模型，打通「视觉感知 → 可执行行动」完整链路。 API 价格较 GLM-4.5V 下降50%，输入1元 / 百万 tokens、输出3元 / 百万 tokens;GLM-4.6V-Flash 完全免费，已集成 GLM Coding Plan 与专用 MCP 工具，开发者可零成本商用。

技术亮点:128k 多图长文 + 原生视觉 Function Call

128k 多模态上下文:单轮可输入30张高分辨率图片 +8万字文本，在 Video-MME、MMBench-Video 等长视频理解基准中取得 SOTA

原生 Function Call:视觉信号直接映射为可执行 API，无需额外 Projector，延迟降低37%，成功率提升18%

统一编码:图像、视频、文本共用一套 Transformer，推理时动态路由，显存占用下降30%

价格与授权:轻量版免费，基础版腰斩

GLM-4.6V-Flash（9B）:0元调用，开放权重与商用 License，适合边缘设备与 SaaS 集成

GLM-4.6V（106B-A12B）:输入1元 / 百万 tokens、输出3元 / 百万 tokens，约为 GPT-4V 的1/4

降价50%:相比 GLM-4.5V 整体下调50%，并赠送100万 tokens 试用额度

开发者工具:MCP + Coding Plan 一键接入

专用 MCP（Model-Context-Protocol）工具:10行代码即可把 GLM-4.6V 接入 VS Code、Cursor，实现“框选 UI→自动生成前端代码”

GLM Coding Plan:提供50+ 场景模板（网页、小程序、脚本），视觉需求→可执行代码→自动部署

在线 Playground:支持拖拽图片、实时调试 Function Call，一键导出 Python/Node.js 调用片段

基准成绩:同参数 SOTA，长视频理解领先

| --------------------- | -------- | ------ | -------------- |

| Video-MME |74.8 |69.1 |72.9 |

| MMBench-Video |82.1 |78.4 |80.6 |

| LongVideoBench （128k） |65.3 |58.2 |62.1 |

商用场景与案例

影视预览:导演上传角色图+分镜，自动输出30秒预览视频，主体一致性>96%

工业检测:拍摄设备面板→自动识别异常区域→调用维修 API 创建工单

教育课件:教师框选课本插图→生成3D 动画+语音讲解，一键导出 PPT

开放路线

今日起:权重、推理代码、MCP 工具已在 GitHub 与 Hugging Face 开源（搜索 GLM-4.6V）

2025Q1:发布1M context 版本与端侧 INT4量化模型，可在笔记本 CPU 运行

2025Q2:推出「视觉 Agent Store」，开发者可上架自定义 Function Call，按调用分成

行业观察

当多模态仍停留在“看得懂”阶段时，智谱把「看得懂 + 做得出」塞进一条模型:Function Call 原生集成，让图片直接触发 API，省去视觉→文本→Prompt 的冗余链路。免费9B 版本降低尝鲜门槛，106B 基础版价格腰斩，意在快速抢占视觉 Agent 生态。随着128k 长视频理解落地，影视、工业、教育等垂直场景有望率先规模化落地。AIbase 将持续跟踪其端侧量化与 Agent Store 进展。

智谱宣布旗下多款大模型产品降价其中GLM-4-Plus降价90%

4月24日，智谱BigModel开放平台宣布进入“亿时代”，对旗下多款大模型产品进行价格调整，大幅降低使用门槛，让更多的企业能够以极低成本拥抱大模型技术。智谱BigModel开放平台此次价格调整涉及多个模型产品。其中，GLM-4-FlashX模型每亿tokens的价格仅为10元，该模型基于强大的预训练基座，具有超快的推理速度，功能调用能力与GPT-4相当，在数据抽取、生成、翻译等方面表现出色。

4/24/2025 12:00:49 PM AI在线

GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线，免费开放

清华大学 KEG 实验室（THUDM）研发的 GLM-4-32B 及 GLM-Z1-32B 两款前沿大语言模型(LLM)正式在 OpenRouter 平台上线，且完全免费向全球用户开放。这一里程碑式的事件标志着高性能 AI 模型的普及迈出了重要一步，为开发者、研究人员及 AI 爱好者提供了强大的工具，以推动人工智能应用的进一步创新。模型上线:性能强劲，免费开放GLM-4-32B 作为一款拥有320亿参数的通用大语言模型，以其在复杂推理、数学能力及多语言处理方面的卓越表现，成为当前开源 LLM 领域的佼佼者。

4/22/2025 9:00:40 AM AI在线

最接近GPT-4的国产大模型诞生了

2024 年，国产大模型的第一个重磅消息，来自智谱 AI。在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上，智谱 AI 正式发布新一代基座大模型「GLM-4」。经历了三个月的技术迭代，GLM-4 相比上一代基座模型 GLM-3 实现了 60% 的性能全面提升，直接逼近 GPT-4。一方面，GLM-4 支持更长的上下文、更强的多模态能力；另一方面，GLM-4 支持更快的推理、更多并发，大大降低了推理成本。同时，GLM-4 也增强了智能体能力，智谱 AI 正式上线了「GLM-4

1/17/2024 3:02:00 PM 机器之心

智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

相关资讯

智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90%

GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线，免费开放

最接近GPT-4的国产大模型诞生了

智谱宣布旗下多款大模型产品降价其中GLM-4-Plus降价90%