AI在线 AI在线

谷歌正在推出 Gemini 实时人工智能视频功能

谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实,谷歌已开始向 Gemini Live 推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。

谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实,谷歌已开始向 Gemini Live 推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。这些功能是在谷歌首次展示为其提供技术支持的“阿斯特拉项目”(Project Astra)近一年后推出的。

谷歌正在推出 Gemini 实时人工智能视频功能

AI在线注意到,谷歌公司在去年 5 月召开的 2024 年 I / O 开发者大会上,曾展示了基于 Gemini 的全新 Project Astra 项目,可以本地运行在 Pixel 手机上,被看作是对标 OpenAI GPT-4o 的最新模型。

谷歌表示 Project Astra 是最新的多模态 AI 项目,用户打开摄像头,该多模态项目可以直接解释用户画面中物品。

相关资讯

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋

谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用

谷歌Gemini 2.5 Pro和Flash全面开放,新增视频分析功能,用户可在安卓和网页端上传视频进行分析。Gemini能概述视频内容、查找特定部分或物品,并在回复中显示相关视频片段。目前该功能已上线,但暂不支持直接录制视频。#谷歌Gemini# #AI视频分析#
6/18/2025 1:21:35 PM
远洋

谷歌推出 Gemini CLI(命令行界面),基于 Gemini 2.5 Pro AI 模型

谷歌发布Gemini CLI命令行工具,搭载Gemini 2.5 Pro模型,支持100万token上下文窗口,深度集成代码助手和谷歌搜索。开发者可免费试用,但配额有限。#AI开发工具# #谷歌Gemini#
6/25/2025 11:17:04 PM
潞源(实习)
  • 1