AI在线 AI在线

AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力

人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然

人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。

AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力

这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。

整个对话过程自然流畅,Gemini 还会询问用户注意到的细节,成功识别出了该活动为谷歌 I / O 开发者大会,并进行了简要介绍。

谷歌发布该预告片的时机非常巧妙,恰好在 OpenAI 有关 ChatGPT 的发布会前几个小时,OpenAI 在此发布会上推出了全新的 ChatGPT-4o 大模型,其理解和对话的流畅性以及连贯性方面都达到了无与伦比的水平。

虽然过去的一些演示视频让外界对这类内容持有一定的怀疑态度,但今天展示的案例无疑证实了人工智能聊天机器人可以无缝集成语音和视频输入。这种多模态能力,加上非常自然的对话流,让我们仿佛看到了未来人工智能交互的一瞥。

谷歌 I / O 大会主题演讲将于明天凌晨 1 点举行,届时IT之家将第一时间带来相关报道。

相关资讯

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋

谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用

谷歌Gemini 2.5 Pro和Flash全面开放,新增视频分析功能,用户可在安卓和网页端上传视频进行分析。Gemini能概述视频内容、查找特定部分或物品,并在回复中显示相关视频片段。目前该功能已上线,但暂不支持直接录制视频。#谷歌Gemini# #AI视频分析#
6/18/2025 1:21:35 PM
远洋

谷歌推出 Gemini CLI(命令行界面),基于 Gemini 2.5 Pro AI 模型

谷歌发布Gemini CLI命令行工具,搭载Gemini 2.5 Pro模型,支持100万token上下文窗口,深度集成代码助手和谷歌搜索。开发者可免费试用,但配额有限。#AI开发工具# #谷歌Gemini#
6/25/2025 11:17:04 PM
潞源(实习)
  • 1