AI在线 AI在线

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

2025 倒计时,新 SOTA 模型涌现没有放缓迹象。 一夜之间,编程 SOTA 模型易主,而且上线即开源,依然来自中国大模型公司 —— 智谱 AI,GLM-4.7。 这波更新,技术报告里满眼都是 Coding,Coding,还是 Coding。

2025 倒计时,新 SOTA 模型涌现没有放缓迹象。

一夜之间,编程 SOTA 模型易主,而且上线即开源,依然来自中国大模型公司 —— 智谱 AI,GLM-4.7

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

这波更新,技术报告里满眼都是 CodingCoding,还是 Coding

而能力的提升,带来的最直观效果是:

  • AIME 25 和人类最后考试(HLE)等基准中,GLM-4.7 分数超 GPT-5.1;

  • SWE-Bench 分数达(73.8%,+5.8%),创开源新高。

官方 Demo 显示,写个植物大战僵尸不费劲:

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

总而言之,模型这么一发,双旦的节庆氛围一下到位了(doge)。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

官网 Chatbot 和 API 均已就位,现在就能在线开玩。

Demo 来吧,展示

在前端生成质量上,GLM-4.7 展现出明显升级:页面结构更干净、组件层级更清晰。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

相比 GLM-4.6,更像是现代的 Web UI,网页元素中更加美观。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

在 PPT 与视觉物料生成方面,GLM-4.7 标题层级明确、元素尺寸更合理。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

在复杂几何结构与空间关系的表达上,GLM-4.7 模型能够保持较好的结构一致性与细节稳定性。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

3D 资产的生成质量也有显著提升。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

刷新开源 SOTA

这次最新的模型主打编程,相较前代 GLM-4.6,GLM-4.7 在编码能力、交互体验与复杂推理等多个维度实现了系统性升级。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

  • 复杂推理能力(Reasoning):全面提升,HLE(含工具)42.8(+12.4 vs GLM-4.6),MMUL-Pro 84.3,GPQA-Diamond 85.7,数学与推理能力更稳更强。

  • 核心编码能力(Code Agent):多语言与终端任务显著增强,SWE-bench Verified 73.8(+5.8)、SWE-bench Multilingual 66.7(+12.9)、Terminal Bench 2.0 41.0(+16.5),支持“先思考、再行动”模式。

  • 工具使用能力(General Agent):工具调用更高效,BrowseComp 52.0(+6.9)、BrowseComp w/ Context Management 67.5(+10.0)、τ²-Bench 87.4(+12.2),网页浏览与工具链管理表现更优。

此外,GLM-4.7 在对话、创意写作、角色扮演等场景中同样有提升,系统性增强了编码、推理与工具使用能力。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

交错式思考和保留式思考

技术方面,GLM-4.7 强化了自 GLM-4.5 起引入的交错式思考(Interleaved Thinking),并进一步引入了保留式思考(Preserved thinking)和轮级思考(Turn-level Thinking)。

交错式思考

GLM 在工具调用之间、收到工具结果之后继续思考。

这让模型能够进行更复杂的分布推理,提升了指令遵从和生成质量:

在决定下一步行动前先解读每次的工具输出,把多次工具调用和推理步骤串联起来,并根据中间结果做出更细粒度的决策。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

保留式思考

在编码场景中,GLM-4.7 引入了一种新的思考模式:

模型会自动在多回合对话中保留所有思考块,复用已有推理而不是从头重新推理。这减少了信息丢失和不一致性,使得模型更适用于长程、复杂任务。还能在真实任务中节省更多 tokens。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

轮级思考

轮级思考是一种按轮控制推理计算的能力,即在同一个会话中,每一轮请求都可以独立选择开启 / 关闭思考。

这使得 GLM-4.7 具备以下优势:

  • 更灵活的成本 / 时延控制:对“问个事实 / 改个措辞”等轻量轮次可关闭思考,追求快速响应;对“复杂规划 / 多约束推理 / 代码调试”等重任务轮次可开启思考,提升正确率与稳定性。

  • 更顺滑的多轮体验:思考开关在会话内可随时切换,模型能在不同轮次间保持对话连贯与输出风格一致,让用户感觉“聪明时更聪明、简单时更快”。

  • 更适合 Agent / 工具调用场景:在需要快速执行的工具轮次可降低推理开销,在需要综合工具结果做决策的轮次再开启深度思考,实现效率与质量的动态平衡。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

更多技术详情,智谱官方也附上了详细技术报告。

BTW,智谱这个月还真上了“节日限定优惠”。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

每月最低 20 元即可畅享 GLM-4.7,用上 Claude Pro 套餐 3 倍用量。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

又是一位好价格屠夫呀。

智谱发布新一代旗舰 AI 模型 GLM-4.7:编程 SOTA,上线即开源

而且 GLM-4.7 的深夜炸场,也算是已经冲刺 IPO 上市的智谱,带来的最新技术证明。

目前智谱已经通过了港交所上市聆讯,IPO 敲钟仅剩下最后 100 米。

而 GLM-4.7 可能也是智谱上市之前,最重要的模型更新了…… 吧?

本文来自微信公众号:量子位(ID:QbitAI),作者:鱼羊 henry,原标题《智谱 IPO 敲钟前,连夜把开源编程大模型 SOTA 了》

相关资讯

智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造

AI在线 7 月 28 日消息,今天智谱发布了新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型。 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License。 AI在线附官方介绍要点如下:GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA,在真实代码智能体的人工对比评测中,实测国内最佳;采用混合专家(MoE)架构,包括 GLM-4.5:总参数量 3550 亿,激活参数 320 亿;GLM-4.5-Air:总参数 1060 亿,激活参数 120 亿;两种模式:用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式;高速、低成本:API 调用价格低至输入 0.8 元 / 百万 tokens、输出 2 元 / 百万 tokens;高速版最高可达 100 tokens / 秒。
7/28/2025 9:31:58 PM
远洋

​THUDM 发布 GLM 4:32 亿参数模型与 GPT-4o 和 DeepSeek-V3 正面竞争

在快速发展的语言模型领域,研究人员和组织面临着诸多挑战。 这些挑战包括提升推理能力、提供强大的多语言支持以及有效管理复杂的开放任务。 尽管较小的模型通常更容易获得且成本较低,但在性能上往往不及更大的模型。
4/15/2025 10:01:31 AM
AI在线

又一国产最强!GLM4.5正式开源,真实测,全栈开发能力封神,免费可玩。对话刘昊然:南京照相馆PPT着实震撼!智谱背后技术公开了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天凌晨,智谱新开源了自家的最强模型 GLM 4.5。 从官方发布了的博客看,这次发布聚焦在了三项能力:推理、coding 和 Agentic 任务。 圈里一些朋友反馈看,说它拿下了新一轮的卷王宝座,小编反而觉得 GLM 这次发布没那么简单,有几项新的功能,可以说市面上仅此一家。
7/29/2025 4:01:45 PM
云昭