AI在线 AI在线

重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。 核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。 该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。

 谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。

核心特性:小体积大能力

Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。

值得一提的是,E4B版本在LMArena评测中得分超过1300,成为首个达到此基准的100亿参数以下模型,在多语言、数学、编码和推理能力方面均实现显著提升。

QQ20250627-101207.png

技术创新:四大突破性架构

MatFormer架构:Gemma3n采用全新的Matryoshka Transformer架构,如俄罗斯套娃般实现一个模型包含多种尺寸。训练E4B模型时同步优化E2B子模型,为开发者提供灵活的性能选择。通过Mix-n-Match技术,用户可在E2B和E4B之间创建自定义尺寸模型。

每层嵌入(PLE)技术:这项创新允许大部分参数在CPU上加载计算,只有核心Transformer权重需要存储在加速器内存中,大幅提高内存效率的同时不影响模型质量。

KV Cache共享:针对长内容处理优化,通过键值缓存共享技术,预填充性能相比Gemma34B提升两倍,显著加快长序列处理的首个token生成时间。

先进编码器:音频方面采用基于通用语音模型(USM)的编码器,支持自动语音识别和语音翻译功能,可处理长达30秒的音频片段。视觉方面配备MobileNet-V5-300M编码器,支持多种输入分辨率,在Google Pixel上可达到每秒60帧的处理速度。

QQ20250627-101357.png

实用功能与应用场景

Gemma3n在语音翻译方面表现突出,特别是英语与西班牙语、法语、意大利语、葡萄牙语之间的转换。视觉编码器MobileNet-V5通过先进蒸馏技术,相比基线模型实现13倍加速,参数减少46%,内存占用降低4倍,同时保持更高准确率。

开源生态与发展前景

谷歌已在Hugging Face平台开源模型和权重,并提供详细文档和开发指南。自去年首个Gemma模型发布以来,该系列累计下载量已超过1.6亿次,显示出强劲的开发者生态。

Gemma3n的发布标志着端侧AI进入新的发展阶段,将云端级别的多模态能力下沉到用户设备,为移动应用、智能硬件等领域带来无限可能。

地址:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

文档:https://ai.google.dev/gemma/docs/gemma-3n

相关资讯

从手机到手语翻译,Gemma模型家族全面升级亮相Google I/O

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。 作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。 据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。
5/21/2025 10:01:46 AM
AI在线

谷歌Gemma 3n发布!可在手机上流畅跑多模态AI,音频+图像+文本全能

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。 Gemma3n继承了Gemini Nano的架构,新增音频理解功能,支持文本、图像、视频和音频的实时处理,且无需云端连接,彻底颠覆了移动端AI体验。 AIbase综合最新社交媒体动态,深入解析Gemma3n的技术亮点及其对AI生态的影响。
5/21/2025 10:01:51 AM
AI在线

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。 同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。 新发布的“产品支持代理”由Adobe Experience Platform Agent Orchestrator提供技术支持,能够在AI Assistant的对话界面中,为用户提供即时的操作指导和支持案例创建流程。
6/6/2025 11:00:55 AM
AI在线
  • 1