AI在线 AI在线

混元,Large,Vision,模型,模态,视觉,输入,分辨率,理解,MoE

腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率全场景输入

腾讯混元团队近日发布了全新的多模态理解模型——混元Large-Vision,该模型采用腾讯混元擅长的MoE(专家混合)架构,激活参数达到52B规模,在性能与效率之间实现了良好平衡。 混元Large-Vision的核心亮点在于其强大的多模态输入支持能力。 该模型不仅支持任意分辨率的图像处理,还能处理视频和3D空间输入,为用户提供了全方位的视觉理解体验。
8/13/2025 10:32:39 AM
AI在线
  • 1