Gemini
8秒出大片!10个案例实测谷歌Veo 3视频生成功能
前几天的 2025 年 Google I/O 开发者大会上,谷歌发布了一系列先进的图像和视频生成工具,好玩的太多了,我还没来得及一一体验,今天先尝试一下最近超级火的 Veo 3 视频生成。 后续再尝试下 Imagen 4 和 Flow 平台和大家分享。 先简单介绍一下。
5/27/2025 7:31:45 AM
阿真Irene
谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限
谷歌在其AI视频生成工具Veo3发布仅100小时后,迅速将其推广至全球71个新国家用户使用。 不过,这一波扩展仍未包括欧盟国家。 这一消息由谷歌Gemini副总裁Josh Woodward在X平台宣布。
5/26/2025 10:01:00 AM
AI在线
如何使用Google Gemini模型完成计算机视觉任务?
译者 | 李睿审校 | 重楼自从人工智能聊天机器人兴起以来,Google Gemini脱颖而出,已经成为推动智能系统进化的主要参与者之一。 除了强大的会话能力之外,Gemini还释放了计算机视觉实际应用的潜力,让它们能够看到、解释和描述周围的世界。 本文将逐步讲解如何利用Google Gemini完成计算机视觉任务,其中包括如何设置环境,发送带有指令的图像以及解释模型的输出以进行对象检测、字幕生成和OCR,还将探讨数据注释工具(例如YOLO中使用的工具),为自定义训练场景提供上下文。
5/26/2025 8:36:25 AM
李睿
大语言模型究竟为何会在对话中“迷失”
译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现,即使是功能最强大的大型语言模型,如果面临的指令是分阶段而非一次性给出,往往也会表现不佳。 该文作者运行六项任务进行研究,最终发现:当提示被拆分成多个回合时,大语言模型的性能平均下降了39%。 单轮次对话(左图)可获得最佳结果,但对最终用户而言显得并不自然。
5/23/2025 8:18:52 AM
张哲刚
谷歌创意利器 Canvas 升级 Gemini 2.5:降低开发门槛,AI 多样化呈现文本内容
谷歌在I/O开发者大会上宣布Canvas平台升级至Gemini 2.5模型,能将文档和代码转化为动态网页、信息图表、测验和播客,支持45种语言。用户无需编写代码,通过自然语言对话即可创建互动网页应用。#谷歌Canvas# #Gemini2.5#
5/22/2025 12:30:36 PM
故渊
谷歌CEO宣布:Gemini AI月活用户突破4亿,覆盖15亿全球用户
在最近的一次公开讲话中,谷歌的 CEO 桑达尔・皮查伊透露,公司的 Gemini AI 应用程序的月活跃用户数量已经超过4亿。 这一数据的公布无疑为 Gemini AI 的成功增添了光彩,并显示出消费者对这一人工智能技术的强烈兴趣。 Gemini AI 不仅在用户量上取得了显著的成绩,还在全球范围内实现了广泛的覆盖。
5/22/2025 10:00:55 AM
AI在线
每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能
谷歌宣布推出全新的 AI Ultra 订阅计划,旨在为用户提供最高级别的 AI 模型访问和丰富的高级功能。 随着人工智能技术的迅速发展,谷歌希望通过这一新计划,让更多用户能够利用其先进的 AI 能力来提升知识、创造力和工作效率。 AI Ultra 计划适合电影制作人、开发者、创意专业人士,或者任何追求最佳 AI 体验的用户,可以看作是进入谷歌 AI 世界的 “贵宾通行证”。
5/21/2025 10:01:51 AM
AI在线
谷歌推出Project Mariner,AI智能助手即将全面上线Chrome与搜索
在今日的 Google I/O2025大会上,谷歌正式发布了名为 “Project Mariner” 的新项目,标志着公司在人工智能领域的新一步。 这一项目原本被称为 “Jarvis”,并在去年年底进行了测试,现在终于迎来了更为成熟的形态。 Project Mariner 是一款强大的网络 AI 智能体,预计将在今年全面上线,旨在优化用户的浏览体验。
5/21/2025 10:01:51 AM
AI在线
谷歌的 Gemini AI 将全面革新 Android Auto,驾驶体验将更智能
在近日召开的2025年 I/O 开发者大会上,谷歌宣布通过其新推出的 Gemini AI 技术,全面升级 Android Auto 车载系统。 这一升级的核心目标是为驾驶者提供更加自然、流畅的语音交互体验,令他们在驾驶过程中无需动手即可完成多项操作。 根据科技媒体 Android Central 的报道,谷歌在会议上展示了这一技术的预发布版本,并在沃尔沃汽车上进行了试用。
5/21/2025 10:01:45 AM
AI在线
Gmail 新功能上线:Gemini AI 助力轻松管理日历事件
在2025年的 I/O 开发者大会上,谷歌宣布其移动邮件应用 Gmail 将全面整合 Gemini AI 功能,为用户带来更便捷的日历管理体验。 无论是 Android 还是 iOS 平台,用户都可以通过 Gmail 应用轻松创建、删除和编辑日历事件,并查看每日日程概览。 据悉,这一新功能允许用户在 Gmail 内直接管理日历,无需切换到其他应用。
5/21/2025 10:01:45 AM
AI在线
Google249美元订阅服务AI Ultra登场,打造AI创作“最强套装”
在2025年Google I/O开发者大会上,谷歌展示了其AI与XR技术的最新成果,覆盖创作工具、开发者平台和用户体验三大核心领域。 新一代视频生成器Veo3、图像生成器Imagen4、全新XR平台Android XR以及顶配AI订阅服务“AI Ultra”成为发布会焦点。 作为AI创作工具的重磅升级,Veo3可生成原生音轨视频,区别于OpenAI Sora等当前不支持音频的产品,现已面向美国Ultra订阅用户及Vertex AI企业客户开放。
5/21/2025 10:01:02 AM
AI在线
史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP
谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
5/21/2025 9:01:06 AM
AI在线
骄傲藏不住!谷歌CEO劈柴哥5.20深夜开大:15项重磅炸弹,两大Gemini前沿方向!中国队Xreal成为谷歌XR原型机代表
编辑 | 云昭北京时间5月21日凌晨1点,谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre,发表了 Google IO 2025 大会的主题演讲。 全程一部定影的时间, 115 分钟,可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。 先说整体感受,整体上如大部分媒体所预料的:Andriod 已经退出焦点,AI 可以说是全部。
5/21/2025 7:45:43 AM
云昭
谷歌 Meet 视频会议平台将上线 Gemini“AI 同传”,可还原声音、语气、情感
在今日的 I/O 大会上,谷歌宣布将语音翻译功能引入 Meet视频会议平台。该技术借助 Gemini 人工智能,可将用户语音实时翻译成对方所使用的语言。
5/21/2025 1:22:12 AM
清源
谷歌Gemini网页版对话搜索全面上线,移动端逐步推出,重塑AI搜索新体验
谷歌宣布正式向全球所有用户推出Gemini网页版对话搜索功能,标志着其基于Gemini2.5的AI搜索体验进入全面普及阶段。 这一功能允许用户通过自然语言进行多轮对话式搜索,取代传统关键词查询,提供更智能、直观的答案。 谷歌同时透露,移动端对话搜索功能也将逐步上线,进一步扩展Gemini的覆盖范围。
5/20/2025 10:01:06 AM
AI在线
谷歌I/O 2025重磅炸弹!Gemini AI搜索引擎将取代传统搜索框,灰度测试启动,竞争对手颤抖!
随着谷歌I/O开发者大会临近(5月20日至21日),业界传出重磅消息:谷歌正计划推出基于Gemini2.5的下一代AI搜索引擎,全面替换传统的搜索框界面。 这一新模式已进入灰度测试阶段,标志着谷歌将其最大流量入口切换至AI驱动的Gemini生态,对OpenAI、Perplexity等竞争对手构成重大挑战。 AIbase综合最新动态,深入解析这一变革性举措及其对全球搜索市场的潜在冲击。
5/19/2025 12:00:55 PM
AI在线
消息称Google I/O大会或发布Gemini驱动的全新AI搜索引擎
有消息人士透露,Google 可能会在其年度 I/O 开发者大会上发布一款颠覆性的全新搜索引擎,该引擎的核心技术将是 Google 最新的生成式人工智能模型 Gemini。 据称,目前该新搜索模式已经开始进行小范围的灰度测试。 如果消息属实,这可能标志着 Google 将其最重要的流量入口——目前的搜索框——全面切换到基于 Gemini 的 AI 搜索引擎。
5/19/2025 11:00:29 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
AI设计
工具
RAG
大语言模型
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
特斯拉
应用
DeepMind