AI在线 AI在线

V-Thinker

V-Thinker: 让模型像人一样「边画边想」

本文共同第一作者为北京邮电大学博士生乔润祺与硕士生谭秋纳,主要研究方向为多模态推理,其共同完成的工作主要有 We-Math、We-Math 2.0,并曾在 CVPR、ACL、ICLR、AAAI、ACM MM 等多个顶会中有论文发表。 本文的通讯作者为博士生导师张洪刚与微信视觉技术中心李琛。 在人类解决复杂视觉问题的过程中,视觉交互往往是重要的认知工具。
12/25/2025 10:22:00 AM
机器之心