AI在线 AI在线

智谱AI重磅开源GLM-4.1V-Thinking!多模态推理新王者,挑战全球顶尖模型

中国人工智能领域的领军企业智谱AI(Zhipu AI)再次掀起行业热潮。 AIbase最新获悉,智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。 这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景,不仅在多项权威评测中刷新纪录,还展现了比肩甚至超越72亿参数模型的强大实力。

中国人工智能领域的领军企业智谱AI(Zhipu AI)再次掀起行业热潮。AIbase最新获悉,智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景,不仅在多项权威评测中刷新纪录,还展现了比肩甚至超越72亿参数模型的强大实力。以下是AIbase整理的最新资讯,带您深入了解这一突破性技术。

image.png

引入思维链推理,性能大幅提升

GLM-4.1V-Thinking基于智谱AI此前的GLM-4V架构进行了深度优化,引入了创新的思维链推理机制(Chain-of-Thought Reasoning)。这一机制显著增强了模型在复杂认知任务中的表现,使其能够更高效地处理多模态输入,包括图像、视频和文档等。据AIbase了解,该模型在28项权威评测(如MMStar、MMMU-Pro、ChartQAPro、OSWorld等)中,23项达到了10亿参数级别模型的最高成绩,其中18项表现持平或超越了参数规模更大的Qwen-2.5-VL72B模型,展现了其惊艳的推理能力。

多模态能力全面覆盖,赋能千行百业

GLM-4.1V-Thinking支持高达64K的上下文长度和4K图像分辨率,同时具备中英文双语能力,能够无缝处理多语言场景下的复杂任务。无论是长视频理解、图像问答、学科解题、文字识别、文档解读,还是图像定位(Grounding)、GUI代理操作以及代码生成,这款模型都能游刃有余。其开源特性进一步降低了使用门槛,单张3090显卡即可运行,免费商用授权更是为企业和开发者提供了广阔的应用空间。AIbase认为,这一灵活性和高性能的结合将极大推动AI技术在教育、金融、医疗等行业的落地应用。

开源战略,引领全球AI竞争

智谱AI此次选择将GLM-4.1V-Thinking完全开源,并通过Hugging Face平台提供模型权重和演示,彰显了其推动AI技术普及的决心。AIbase注意到,智谱AI近年来在开源领域动作频频,其GLM系列模型已累计全球下载超3000万次,成为中国AI生态的重要组成部分。此次开源的GLM-4.1V-Thinking不仅为开发者提供了高性能的多模态推理工具,还通过MIT许可证确保了其商业应用的灵活性,进一步巩固了智谱AI在全球AI领域的竞争力。

与全球顶尖模型正面交锋

在性能对比中,GLM-4.1V-Thinking展现了令人瞩目的实力。AIbase综合评测数据发现,该模型在多项复杂任务中表现出色,尤其是在STEM学科问题和长文档理解等高难度场景中,部分性能甚至超过了OpenAI的GPT-4o模型。这种跨越式的进步表明,智谱AI在多模态推理领域已跻身全球领先行列,与OpenAI、Google等国际巨头展开正面竞争。

中国AI的崛起新篇章

作为中国AI领域的“新四虎”之一,智谱AI通过持续的技术创新和开放的生态战略,正在重塑全球AI格局。AIbase认为,GLM-4.1V-Thinking的发布不仅是智谱AI技术实力的体现,更是中国AI产业在全球舞台上的一次重要发声。未来,随着更多开发者基于GLM-4.1V-Thinking构建创新应用,中国AI的国际影响力将进一步扩大。

结语

智谱AI的GLM-4.1V-Thinking以其强大的多模态推理能力和开源特性,为全球AI社区带来了新的可能性。AIbase将持续关注智谱AI的最新动态,为您带来更多前沿科技报道。让我们共同期待这款模型如何在千行百业中掀起变革!

相关资讯

智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90%

4月24日,智谱BigModel开放平台宣布进入“亿时代”,对旗下多款大模型产品进行价格调整,大幅降低使用门槛,让更多的企业能够以极低成本拥抱大模型技术。 智谱BigModel开放平台此次价格调整涉及多个模型产品。 其中,GLM-4-FlashX模型每亿tokens的价格仅为10元,该模型基于强大的预训练基座,具有超快的推理速度,功能调用能力与GPT-4相当,在数据抽取、生成、翻译等方面表现出色。
4/24/2025 12:00:49 PM
AI在线

智谱发布Agent产品AutoGLM沉思:首个实现"边想边干"的智能体

今日,智谱AI在2025中关村论坛上发布了其最新Agent产品——AutoGLM沉思。 这是业内首个集深度研究能力和操作能力于一体的Agent产品,其最大特点是能够"边想边干"。 AutoGLM沉思突破了传统AI模型的局限,能够同时进行复杂思考与执行操作。
3/31/2025 11:06:00 AM
AI在线

GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线,免费开放

清华大学 KEG 实验室(THUDM)研发的 GLM-4-32B 及 GLM-Z1-32B 两款前沿大语言模型(LLM)正式在 OpenRouter 平台上线,且完全免费向全球用户开放。 这一里程碑式的事件标志着高性能 AI 模型的普及迈出了重要一步,为开发者、研究人员及 AI 爱好者提供了强大的工具,以推动人工智能应用的进一步创新。 模型上线:性能强劲,免费开放GLM-4-32B 作为一款拥有320亿参数的通用大语言模型,以其在复杂推理、数学能力及多语言处理方面的卓越表现,成为当前开源 LLM 领域的佼佼者。
4/22/2025 9:00:40 AM
AI在线
  • 1