AI在线 AI在线

从手机到手语翻译,Gemma模型家族全面升级亮相Google I/O

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。 作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。 据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。

作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。该模型已于发布日面向开发者预览,并与Gemini Nano共享底层架构。

QQ20250521-094734.png

谷歌强调,Gemma3n的轻量与隐私优势,使其成为离线AI应用的理想选择。相比需要依赖云端的大型模型,本地AI模型不仅响应更快、成本更低,还能保护用户数据不被传输至远程服务器,尤其适用于隐私敏感型场景。

在健康领域,谷歌通过旗下健康AI开发者基金会,推出了MedGemma——一组针对健康相关文本与图像的开放模型。据介绍,MedGemma具备出色的多模态分析能力,支持开发者在医疗影像识别、病历文本处理等场景中构建更精准的AI工具。

此外,谷歌还预告了即将推出的SignGemma模型,专为手语识别而设计,能够将美国手语(ASL)翻译成英语文本,旨在帮助开发者为聋哑与听障用户构建更友好的沟通工具。谷歌表示,这是“目前为止最强大的手语理解模型”。

尽管Gemma模型系列因其非标准许可条款引发部分开发者对商业化使用的担忧,但其广泛的功能性仍获得开发者社区热烈响应,Gemma模型系列的下载量已突破数千万次。

随着Gemma模型家族不断拓展,谷歌正推动开放AI模型在设备端、本地隐私保护、医疗健康与无障碍领域迈向更广阔的应用空间。

相关资讯

重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。 核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。 该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。
6/27/2025 11:00:52 AM
AI在线

谷歌Gemma 3n发布!可在手机上流畅跑多模态AI,音频+图像+文本全能

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。 Gemma3n继承了Gemini Nano的架构,新增音频理解功能,支持文本、图像、视频和音频的实时处理,且无需云端连接,彻底颠覆了移动端AI体验。 AIbase综合最新社交媒体动态,深入解析Gemma3n的技术亮点及其对AI生态的影响。
5/21/2025 10:01:51 AM
AI在线

谷歌重磅AI代理即将上线!从任务到文档一键搞定,开发效率飙升3倍!

最近,谷歌正积极开发一款名为“软件开发生命周期AI代理”(Software Development Lifecycle AI Agent)的创新工具,预计未来可能集成至Gemini生态()。 该代理旨在为软件工程师提供端到端的开发支持,覆盖从任务响应到代码文档化的全流程,堪称“全天候数字同事”。 AIbase观察到,这一消息在2025年5月13日引发开发者社区热议,被认为是谷歌在AI驱动开发工具领域的又一重大布局。
5/14/2025 3:00:52 PM
AI在线
  • 1