重磅!谷歌开源Gemma3n多模态模型，手机也能跑出云端AI性能

作者：AI在线 2025-06-27 11:00

谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n，这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本，虽然原始参数量分别为5B和8B，但通过架构创新，其内存占用仅相当于传统2B和4B模型，分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理，支持140种文本语言和35种语言的多模态理解。

谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n，这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。

核心特性:小体积大能力

Gemma3n提供E2B和E4B两个版本，虽然原始参数量分别为5B和8B，但通过架构创新，其内存占用仅相当于传统2B和4B模型，分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理，支持140种文本语言和35种语言的多模态理解。

值得一提的是，E4B版本在LMArena评测中得分超过1300，成为首个达到此基准的100亿参数以下模型，在多语言、数学、编码和推理能力方面均实现显著提升。

技术创新:四大突破性架构

MatFormer架构:Gemma3n采用全新的Matryoshka Transformer架构，如俄罗斯套娃般实现一个模型包含多种尺寸。训练E4B模型时同步优化E2B子模型，为开发者提供灵活的性能选择。通过Mix-n-Match技术，用户可在E2B和E4B之间创建自定义尺寸模型。

每层嵌入（PLE）技术:这项创新允许大部分参数在CPU上加载计算，只有核心Transformer权重需要存储在加速器内存中，大幅提高内存效率的同时不影响模型质量。

KV Cache共享:针对长内容处理优化，通过键值缓存共享技术，预填充性能相比Gemma34B提升两倍，显著加快长序列处理的首个token生成时间。

先进编码器:音频方面采用基于通用语音模型（USM）的编码器，支持自动语音识别和语音翻译功能，可处理长达30秒的音频片段。视觉方面配备MobileNet-V5-300M编码器，支持多种输入分辨率，在Google Pixel上可达到每秒60帧的处理速度。

实用功能与应用场景

Gemma3n在语音翻译方面表现突出，特别是英语与西班牙语、法语、意大利语、葡萄牙语之间的转换。视觉编码器MobileNet-V5通过先进蒸馏技术，相比基线模型实现13倍加速，参数减少46%，内存占用降低4倍，同时保持更高准确率。

开源生态与发展前景

谷歌已在Hugging Face平台开源模型和权重，并提供详细文档和开发指南。自去年首个Gemma模型发布以来，该系列累计下载量已超过1.6亿次，显示出强劲的开发者生态。

Gemma3n的发布标志着端侧AI进入新的发展阶段，将云端级别的多模态能力下沉到用户设备，为移动应用、智能硬件等领域带来无限可能。

地址：https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

文档：https://ai.google.dev/gemma/docs/gemma-3n

从手机到手语翻译，Gemma模型家族全面升级亮相Google I/O

在2025年Google I/O开发者大会上，谷歌正式发布轻量级多模态模型Gemma3n，并宣布Gemma模型家族持续扩展，新增面向医疗和无障碍场景的MedGemma与SignGemma。作为本地运行AI趋势的代表，Gemma3n专为手机、笔记本和平板等低算力设备设计，具备处理文本、音频、图像和视频的能力。据谷歌介绍，Gemma3n甚至可在低于2GB运行内存的设备上流畅运行，体现出其高效架构优势。

5/21/2025 10:01:46 AM AI在线

谷歌Gemma 3n发布！可在手机上流畅跑多模态AI，音频+图像+文本全能

谷歌在I/O2025大会上正式揭晓Gemma3n，一款专为低资源设备设计的多模态AI模型，仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。 Gemma3n继承了Gemini Nano的架构，新增音频理解功能，支持文本、图像、视频和音频的实时处理，且无需云端连接，彻底颠覆了移动端AI体验。 AIbase综合最新社交媒体动态，深入解析Gemma3n的技术亮点及其对AI生态的影响。

5/21/2025 10:01:51 AM AI在线

谷歌重磅新作！Portraits让你与虚拟专家对话，解锁沟通与领导力秘籍

2025年6月5日，谷歌悄然推出了一款名为 Portraits 的创新AI产品，通过虚拟专家对话为用户提供个性化的学习体验。这款产品允许用户与预设的虚拟专家进行实时互动，学习专业领域的知识与技能。首批虚拟专家之一是畅销书《Radical Candor》和《Radical Respect》的作者，专注于教授沟通技巧与领导力内容。

6/6/2025 12:01:05 PM AI在线