AI
从手机到手语翻译,Gemma模型家族全面升级亮相Google I/O
在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。 作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。 据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。
谷歌虚拟试衣间重磅上线!上传照片秒变时尚模特,AI一键比价+自动下单
谷歌在I/O2025大会上宣布推出全新AI虚拟试衣工具,允许用户上传一张全身照片,即可在数秒内生成逼真的穿搭效果图。 这一功能依托谷歌最新的时尚专用图像生成模型和Shopping Graph的50亿商品数据,不仅提供高度个性化的试穿体验,还支持多条件搜索、比价分析和全自动购物流程。 AIbase综合最新社交媒体动态,深入解析这一工具的技术亮点及其对时尚电商的革命性影响。
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
在2025年5月20日的Google I/O开发者大会上,谷歌正式推出了全新AI驱动的视频剪辑工具Flow,专为影视创作者打造。 Flow整合了谷歌最先进的生成式AI模型——Veo3、Imagen4和Gemini,旨在通过自然语言提示和模块化工作流,简化视频创作过程,助力专业人士和初学者实现电影级视觉叙事。 整合三大AI模型,生成电影级视频Flow的核心在于其结合了Veo3的视频生成、Imagen4的图像生成以及Gemini的自然语言处理能力。
谷歌发布 Gemini 2.5 系列新版本:轻量版与增强推理版即将上线
在最新举行的 Google I/O2025大会上,谷歌公布了其 AI 模型 Gemini2.5系列的重要更新。 这一系列新版本包括了轻量级的 Gemini2.5Flash 和更强大的 Gemini2.5Pro,前者预计将在今年6月初正式推出。 Gemini2.5Flash 是针对普通用户需求而设计的轻量级版本,相较于其前代产品,其效率提升了22%。
Gmail 新功能上线:Gemini AI 助力轻松管理日历事件
在2025年的 I/O 开发者大会上,谷歌宣布其移动邮件应用 Gmail 将全面整合 Gemini AI 功能,为用户带来更便捷的日历管理体验。 无论是 Android 还是 iOS 平台,用户都可以通过 Gmail 应用轻松创建、删除和编辑日历事件,并查看每日日程概览。 据悉,这一新功能允许用户在 Gmail 内直接管理日历,无需切换到其他应用。
谷歌的 Gemini AI 将全面革新 Android Auto,驾驶体验将更智能
在近日召开的2025年 I/O 开发者大会上,谷歌宣布通过其新推出的 Gemini AI 技术,全面升级 Android Auto 车载系统。 这一升级的核心目标是为驾驶者提供更加自然、流畅的语音交互体验,令他们在驾驶过程中无需动手即可完成多项操作。 根据科技媒体 Android Central 的报道,谷歌在会议上展示了这一技术的预发布版本,并在沃尔沃汽车上进行了试用。
Google 发布最强 AI 全家桶 音乐、电影、图像全套上线
在近期的 Google I/O 大会上,谷歌推出了一系列引人注目的 AI 新功能,旨在彻底改变用户的搜索和创作体验。 此次发布会展示了 Google 有史以来最强大的 AI 工具,涵盖了从高级搜索到多媒体创作的广泛应用,令人期待。 首先,谷歌推出了 AI Mode,这是其最新的 AI 搜索体验,用户在进行复杂查询时,可以获得更智能的反馈。
谷歌推出AI虚拟试衣工具:只需上传照片 “试穿+结账”一条龙购物体验
在 2025 年I/O开发者大会上,谷歌发布了一项全新AI购物工具,让用户仅需上传一张照片,即可实现虚拟试衣。 这一功能由专为时尚领域训练的定制图像生成模型提供支持,是首个大规模集成至谷歌搜索的虚拟试穿体验。 用户上传照片后,系统将生成拟真的穿衣效果图,帮助用户快速判断搭配效果并缩短决策路径。
Google249美元订阅服务AI Ultra登场,打造AI创作“最强套装”
在2025年Google I/O开发者大会上,谷歌展示了其AI与XR技术的最新成果,覆盖创作工具、开发者平台和用户体验三大核心领域。 新一代视频生成器Veo3、图像生成器Imagen4、全新XR平台Android XR以及顶配AI订阅服务“AI Ultra”成为发布会焦点。 作为AI创作工具的重磅升级,Veo3可生成原生音轨视频,区别于OpenAI Sora等当前不支持音频的产品,现已面向美国Ultra订阅用户及Vertex AI企业客户开放。
AI数据治理破局的战略重构
人工智能正重塑商业世界,那些真正理解当代数据治理变革的企业将占据决定性优势。 旧日的数据治理手册已经无法应对AI时代的全新挑战,我们需要一场根本性的思维转变。 AI正在颠覆传统数据治理模式传统数据管理就像一本厚重的规则手册,将决策封存在层层审批中。
大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前
北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新
今天凌晨,谷歌召开了“I/O 2025”全球开发者大会,发布了很多产品包括新视频模型、代码模型、文本模型等,尤其是对Agent智能体进行了重磅升级。 例如,全新影视级文生视频模型Flow,创新架构小参数模型Gemma3n,基于AI模型的全新搜索模式等。 下面「AIGC开放社区」为大家介绍谷歌在第一天开发者大会上,与Agent智能体相关的重要内容。
陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题
视频新人博主陶哲轩又更新了! 这次是“喂饭级”AI教程——手把手演示如何只用GitHub Copilot证明函数极限问题。 (这更新频率确实o( ̄▽ ̄)d)据陶哲轩介绍,他此前主要将GitHub Copilot用于一些“花里胡哨”的代码补全,但实际情况是,如果想让它来证明数学定理,往往需要人类的“正确指挥”。
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样? 谷歌最新版Project Astra展示了终极AI助手的能力:以下视频来源于谷歌黑板报实时观察周围环境,搜索资料指导小哥修自行车,零件不够还能自动电话询问周边商店有没有货。 在最新的I/O大会上,谷歌连续放大招,就好像大招不要钱。
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
美图与阿里巴巴达成战略合作 获得2.5亿美元投资
2025年5月20日,美图公司宣布与阿里巴巴达成战略合作,并获得2.5亿美元的投资。 这一合作标志着双方将在电商平台、AI技术、云计算等多个领域展开深度合作,共同推动技术创新和业务发展。 根据公告,阿里巴巴以可转债的形式对美图公司进行投资,投资总额为2.5亿美元,净筹资额约为2.496亿美元。
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。 以下是AIbase整理的关于Veo3的核心亮点与技术突破。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉