AI在线 AI在线

青岛发布国内首个全模态实时交互大模型 VisualGPT,打造“所见即所得”AI体验

青岛虚拟智能体产业大会正式推出国内首个支持全模态实时交互的视觉语言大模型 VisualGPT,并同步上线智能体训练平台,面向全国开发者开放多模态数据与算力资源,标志着AI交互从“文字对话”迈入“视觉界面即时互动”新阶段。 模型亮点  - 全模态实时交互:用户上传图片/视频后可直接在画面上圈选、标注或语音提问,模型秒级返回结构化答案、可执行代码或3D场景,无需切换文字输入。   - 所见即所得:VisualGPT将视觉编码器与流式解码器耦合,实现300ms端到端延迟,支持1080p60fps实时画面分析与多轮对话。

青岛虚拟智能体产业大会正式推出国内首个支持全模态实时交互的视觉语言大模型 VisualGPT,并同步上线智能体训练平台,面向全国开发者开放多模态数据与算力资源,标志着AI交互从“文字对话”迈入“视觉界面即时互动”新阶段。

模型亮点  

- 全模态实时交互:用户上传图片/视频后可直接在画面上圈选、标注或语音提问,模型秒级返回结构化答案、可执行代码或3D场景,无需切换文字输入。  

- 所见即所得:VisualGPT将视觉编码器与流式解码器耦合,实现<300ms端到端延迟,支持1080p60fps实时画面分析与多轮对话。  

- 多域应用:官方已在教育、医疗、金融三大场景开放SDK,教师可在课件上圈选公式即时生成动画讲解,医生可边阅片边询问病灶指标,金融分析师可对K线图直接提问获取策略回测。

平台配套  

青岛智能体训练平台提供 1000 张A100/H100 混合算力与10PB多模态数据,面向企业、高校及个人开发者免费开放申请, 2026 年计划扩容至 5000 张H100,打造北方最大AI训练集群。大会同时发布“百企百景”对接清单,首批征集超 200 个视觉交互需求,预计 2025 年底完成 100 个标杆案例落地。

产业意义  

VisualGPT的推出使青岛在虚拟智能体赛道抢占先机,市工信局透露,未来三年将依托该模型建设“青岛AI创新谷”,吸引上下游企业超 300 家,形成千亿级全模态交互产业链。

相关资讯

如何做好对话式AI的交互设计?高手总结了6个章节!

对话式人工智能技术正在彻底改变我们访问信息的方式,它通过提供定制化和直观的搜索体验,不仅满足了用户的需求,还为企业带来了新的力量。 一个设计精良的对话AI就像一个充满智慧的顾问,能够深刻理解用户的意图,并在庞大的数据集中轻松导航,这样的能力显著提高了用户的幸福感和参与度,建立了牢固的忠诚度和信任关系。 与此同时,企业也享受到了效率的提升、成本的节约和利润的增加。
3/5/2025 12:01:38 AM
团队iFlytek STC UXD

AI 正在重塑 UI 和体验,这场变革才刚刚开始

编者按:AI 的出现,正在隐形地重构我们熟知的交互模式,推动着 UI 范式历史性地进化。 但是,但是仅仅只在目前已有的 UI 上打 AI 补丁就够了吗? 当然不是,这篇来自 Tetiana Sydorenko 的文章重新回溯了设计交互的历史,并且洞悉了 AI 加入之后,这场变革的内在逻辑链,揭示了从操作指令到 AI 意图识别的设计范式转变,对于资深的设计从业者而言,新的契机藏在其中。
3/6/2025 12:32:02 AM
Tetiana Sydorenko

宇树机器人首次亮相李佳琦直播间 展示高科技互动魅力

宇树机器人在淘宝直播间与知名主播李佳琦合作,首次向公众展示了其最新产品 —— 宇树机器人 G1和机器狗 Go2。 直播于晚上8点开始,吸引了大量观众的关注。 这两款机器人在直播中表现出色,展现了惊人的交互能力。
3/8/2025 9:56:00 AM
AI在线