上海人工智能实验室开源多模态大模型“书生・万象 3.0”：能同时处理文本和多模态输入

作者：清源 2025-04-17 12:39

该团队提出了一种创新的原生多模态预训练方法，与传统的先优化大语言模型再添加视觉能力的方法不同，这种方法在模型的预训练阶段将文本数据与多模态数据无缝结合，让模型能够同时学习语言和视觉。

据上海人工智能实验室官方公众号，4 月 16 日，上海人工智能实验室（上海 AI 实验室）升级并开源了通用多模态大模型书生・万象 3.0（InternVL3）。

官方介绍，通过采用创新的多模态预训练和后训练方法，InternVL3 多模态基础能力全面提升，在专家级基准测试、多模态性能全面测试中，10 亿~780 亿参数的全量级版本在开源模型中性能均位列第一，同时大幅提升了图形用户界面（GUI）智能体、建筑场景图纸理解、空间感知推理以及通识学科推理等方面的能力。

据介绍，该团队提出了一种创新的原生多模态预训练方法，与传统的先优化大语言模型再添加视觉能力的方法不同，这种方法在模型的预训练阶段将文本数据与多模态数据无缝结合，让模型能够同时学习语言和视觉，从而能够同时处理文本和多模态输入。

除了可以处理通用的多模态任务之外，InternVL3 还拓展了多方面的多模态能力，如图形用户界面（GUI）智能体、建筑场景图纸理解、空间感知推理、通识学科推理等。

据介绍，InternVL3 可作为 GUI 智能体，遵循指令去操作电脑或者手机上的专业软件。

上海人工智能实验室开源多模态大模型“书生・万象 3.0”：能同时处理文本和多模态输入

AI在线汇总有关链接如下：

技术报告链接：https://huggingface.co/ papers / 2504.10479
代码开源 / 模型使用方法：https://github.com/ OpenGVLab / InternVL
模型地址：https://huggingface.co/ OpenGVLab / InternVL3-78B
公测版本：https://chat.intern-ai.org.cn/

江西：促进智能眼镜、智能手表、VR / AR 设备等智能设备消费

AI在线 12 月 24 日消息，江西省人民政府今日印发《江西省“人工智能 ”行动方案》，其中提出，“人工智能 ”生活消费行动方面，加强云侧智能决策、场景引擎和自适应感知等关键技术与购物、文娱、家居等领域深度融合，发展新型智慧电商、智慧娱乐、智慧家居等新业态。促进智能眼镜、智能手表、VR / AR 设备等智能设备消费。据AI在线了解，《方案》还提到，加大具身智能、消费电子等领域传感器研发生产，加快智能穿戴、虚拟现实等领域产品创新，支持企业开展光通信、显示、音视频等模组研发应用。

12/24/2025 4:15:36 PM 清源

调查：超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告，企业在人工智能（AI）领域的投资高达2.5亿美元，尽管在证明投资回报率(ROI)方面面临挑战。商业领袖们正努力提高生产力，但新技术的集成往往需要重构现有应用、更新流程并激励员工学习，以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查，以揭示 AI 采用的现实情况，探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。

3/18/2025 10:02:00 AM AI在线

Instacart CEO即将加盟 OpenAI，领导应用部门

Instacart 的首席执行官 Fidji Simo 将于8月18日正式加入 OpenAI，担任应用部门的负责人。 Simo 将领导 OpenAI 公司至少三分之一的业务，并直接向 OpenAI 的首席执行官 Sam Altman 汇报。她的新职位是 “应用首席执行官”，主要任务是扩展和推动人工智能技术的应用场景。

7/22/2025 4:11:19 PM AI在线

上海人工智能实验室开源多模态大模型“书生・万象 3.0”：能同时处理文本和多模态输入

相关资讯

江西：促进智能眼镜、智能手表、VR / AR 设备等智能设备消费

调查：超72% 的企业选择 AI 工具时最看重易用性

​Instacart CEO即将加盟 OpenAI，领导应用部门

Instacart CEO即将加盟 OpenAI，领导应用部门