AI在线 AI在线

谷歌发布第七代 TPU Ironwood:首度专为 AI 推理设计,能效达 TPU v6e 两倍

Ironwood 搭载 292GB HBM 内存,峰值 FP8 AI 算力可达到 4614 TFLOP,支持扩展到 9216 芯片。

谷歌今日在 Google Cloud Next 2025 大会上发布了其第七代 TPU 张量处理器 "Ironwood"。这是其 TPU 家族中首款专为 AI 推理而设计的型号,拥有迄今为止最强大的功能、能力和能效。

谷歌发布第七代 TPU Ironwood:首度专为 AI 推理设计,能效达 TPU v6e 两倍

谷歌表示 "Ironwood" 代表了 AI 发展和推动其进步的基础设施的重大转变:从传统响应式 AI 模型转向提供主动生成的见解和解释的模型;AI 智能体(AI在线注:Agent)将主动去检索和生成数据,以协作提供见解和答案,而不仅仅是数据。

谷歌发布第七代 TPU Ironwood:首度专为 AI 推理设计,能效达 TPU v6e 两倍

在芯片参数方面,每颗 "Ironwood" TPU 搭载了共计 192GB 的 7.2Tbps HBM 内存,峰值 FP8 AI 算力可达到 4614 TFLOP,支持 1.2Tbps 带宽的 ICI 芯片间互连,能效则达到了 TPU v6e "Trillium" 的两倍。

对于 Google Cloud 云客户,谷歌提供两种不同规模的 "Ironwood" TPU Pod 配置:256 芯片和 9216 芯片,后者的整体 AI 算力达到了惊人的 42.5 Exaflops

相关资讯

全面突围,谷歌昨晚更新了一大波大模型产品

这次,谷歌要凭「量」打败其他竞争对手。当地时间本周二,谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品,包括 Gemini 1.5 Pro 首次提供了本地音频(语音)理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 Axion 等等。Gemini 1.5 ProGemini 1.5 Pro 是 Google 功能最强大的生成式 AI 模型,现已在 Google 以企业为中心的 AI 开发平台 Vertex AI 上提供公共预览版。这是谷歌面向
4/10/2024 2:55:00 PM
机器之心

刚刚!谷歌最强AI全家桶上线!自家主干网络都要公开对外用了!黄仁勋站台,最新TPU性能猛涨3600倍,提Agent通信新协议

编辑|云昭4月10凌晨,谷歌CEO皮查伊带着一系列重磅的发布亮相拉斯维加斯Next2025,可谓从底层的TPU芯片到上层的Agent构建,都有让人眼前一亮的新品。 1.性能提升3600倍,专为推理而生的TPU正式发布谷歌第七代 TPU Ironwood,它专为推理而设计。 皮查伊介绍道,相较于第一代云 TPU ,Ironwood 性能提升了 3600 倍,效率提升了 29 倍。
4/10/2025 6:16:33 AM
云昭

解锁CNN和Transformer正确结合方法,字节跳动提出有效的下一代视觉Transformer

来自字节跳动的研究者提出了一种能在现实工业场景中有效部署的下一代视觉 Transformer,即 Next-ViT。Next-ViT 能像 CNN 一样快速推断,并有 ViT 一样强大的性能。
7/22/2022 5:26:00 PM
机器之心
  • 1