AI在线 AI在线

从手机到手语翻译,Gemma模型家族全面升级亮相Google I/O

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。 作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。 据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。

作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。该模型已于发布日面向开发者预览,并与Gemini Nano共享底层架构。

QQ20250521-094734.png

谷歌强调,Gemma3n的轻量与隐私优势,使其成为离线AI应用的理想选择。相比需要依赖云端的大型模型,本地AI模型不仅响应更快、成本更低,还能保护用户数据不被传输至远程服务器,尤其适用于隐私敏感型场景。

在健康领域,谷歌通过旗下健康AI开发者基金会,推出了MedGemma——一组针对健康相关文本与图像的开放模型。据介绍,MedGemma具备出色的多模态分析能力,支持开发者在医疗影像识别、病历文本处理等场景中构建更精准的AI工具。

此外,谷歌还预告了即将推出的SignGemma模型,专为手语识别而设计,能够将美国手语(ASL)翻译成英语文本,旨在帮助开发者为聋哑与听障用户构建更友好的沟通工具。谷歌表示,这是“目前为止最强大的手语理解模型”。

尽管Gemma模型系列因其非标准许可条款引发部分开发者对商业化使用的担忧,但其广泛的功能性仍获得开发者社区热烈响应,Gemma模型系列的下载量已突破数千万次。

随着Gemma模型家族不断拓展,谷歌正推动开放AI模型在设备端、本地隐私保护、医疗健康与无障碍领域迈向更广阔的应用空间。

相关资讯

谷歌Gemma 3n发布!可在手机上流畅跑多模态AI,音频+图像+文本全能

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。 Gemma3n继承了Gemini Nano的架构,新增音频理解功能,支持文本、图像、视频和音频的实时处理,且无需云端连接,彻底颠覆了移动端AI体验。 AIbase综合最新社交媒体动态,深入解析Gemma3n的技术亮点及其对AI生态的影响。
5/21/2025 10:01:51 AM
AI在线

谷歌重磅AI代理即将上线!从任务到文档一键搞定,开发效率飙升3倍!

最近,谷歌正积极开发一款名为“软件开发生命周期AI代理”(Software Development Lifecycle AI Agent)的创新工具,预计未来可能集成至Gemini生态()。 该代理旨在为软件工程师提供端到端的开发支持,覆盖从任务响应到代码文档化的全流程,堪称“全天候数字同事”。 AIbase观察到,这一消息在2025年5月13日引发开发者社区热议,被认为是谷歌在AI驱动开发工具领域的又一重大布局。
5/14/2025 3:00:52 PM
AI在线

谷歌挖走 OpenAI 大将,前开发者关系负责人 Logan Kilpatrick 官宣加盟

【新智元导读】AI 人才争夺战拉响!谷歌四大高管挖走了 OpenAI 前开发者关系负责人 Logan Kilpatrick。他将 AI Studio 产品,并为 Gemini API 提供支持。网友纷纷看好谷歌。入职整整一个月后,OpenAI 前开发者关系负责人 Logan Kilpatrick 正式官宣加入谷歌。他将负责 AI Studio 产品,并为 Gemini API 提供支持。Logan 表示,未来还有很多工作要做,让谷歌成为开发人员使用 AI 进行开发的最佳场所。Logan 加入谷歌是收到了来自谷歌四位
4/3/2024 1:28:17 PM
汪淼
  • 1