GLM-4.1V-Thinking
智谱AI重磅开源GLM-4.1V-Thinking!多模态推理新王者,挑战全球顶尖模型
中国人工智能领域的领军企业智谱AI(Zhipu AI)再次掀起行业热潮。 AIbase最新获悉,智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。 这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景,不仅在多项权威评测中刷新纪录,还展现了比肩甚至超越72亿参数模型的强大实力。
7/2/2025 5:00:55 PM
AI在线
智谱AI开源GLM-4.1V-Thinking:多模态推理模型再突破
智谱AI正式开源最新一代通用视觉模型GLM-4.1V-Thinking,基于GLM-4V架构,新增思维链推理机制,显著提升复杂认知任务能力。 该模型支持图像、视频、文档等多模态输入,擅长长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等多样化场景,覆盖千行百业的应用需求。 GLM-4.1V-9B-Thinking在28项权威评测中表现卓越,其中23项达成10B级模型最佳成绩,18项持平或超越72B参数的Qwen-2.5-VL,涵盖MMStar、MMMU-Pro、ChartQAPro、OSWorld等基准测试。
7/2/2025 5:00:55 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
开发者
xAI
具身智能
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
生成式AI
视频生成
DeepMind
场景
特斯拉
深度学习
AI模型
架构
亚马逊
Transformer
MCP
编程
视觉
预测