AI在线 AI在线

​Nvidia 发布全新 Rubin CPX GPU,助力 “海量上下文” 人工智能应用

Nvidia 近日宣布,其全新的 Vera Rubin 微架构正处于研发阶段,计划于2026年正式推出。 该架构下的 Rubin CPX 变体将专注于满足那些需要处理海量上下文窗口的人工智能工作负载。 Nvidia 首席执行官黄仁勋在新闻发布会上表示:“Vera Rubin 平台将标志着人工智能计算的新飞跃,推出下一代 Rubin GPU 和名为 CPX 的新类别处理器。

Nvidia 近日宣布,其全新的 Vera Rubin 微架构正处于研发阶段,计划于2026年正式推出。该架构下的 Rubin CPX 变体将专注于满足那些需要处理海量上下文窗口的人工智能工作负载。Nvidia 首席执行官黄仁勋在新闻发布会上表示:“Vera Rubin 平台将标志着人工智能计算的新飞跃,推出下一代 Rubin GPU 和名为 CPX 的新类别处理器。”

Rubin CPX 特别适用于需要处理超过一百万个 token 的应用场景,例如复杂的软件开发和高清晰度视频生成。根据 Nvidia 的计划,Vera Rubin NDL144CPX 类 GPU 将于2026年底上市。CPX 模型是针对需要长上下文窗口的应用而特别设计的,能够提供8exaflops 的人工智能性能、30PF NVFP4的上下文计算能力,以及相较于 Nvidia GB300NVL72系统提升了三倍的指数运算能力。此外,CPX 模型还配备了128GB GDDR7内存、4个编码器和4个解码器,专为生成视频而设计,并提供100TB 的快速内存。

Nvidia 的高管表示,Vera Rubin NDL144CPX 可被视为大型人工智能工厂的一部分。为了支持大规模数据中心的构建,Nvidia 还计划推出千兆规模的参考设计。这意味着,Nvidia 将与基础设施公司密切合作,从计算的角度重新设计数据中心,以提供覆盖建筑、设计、模拟、运营等各个方面的参考设计。

在此次发布前,Nvidia 还公布了最新的 MLPerf 推理测试结果,黑威尔 GPU 在该基准测试中创下了新记录,超越了 Llama3.1405B 交互模型的基线。此项创新技术被称为 “解耦服务”,能够使相同硬件在性能上得到提升,这为已经部署解决方案的企业带来了额外的收入机会。

划重点:  

🔍 **Nvidia 发布 Rubin CPX GPU,旨在支持海量上下文 AI 应用。**  

🚀 ** 该 GPU 将于2026年底上市,具备强大的 AI 性能和内存配置。**  

🏢 **Nvidia 计划推出数据中心的千兆规模参考设计,助力 AI 工厂建设。**

相关资讯

英伟达将下一代AI芯片命名为Rubin:纪念发现暗物质天文学家

英伟达公司近日宣布,其下一代AI芯片将以著名天文学家Vera Rubin的名字命名。 Vera Rubin,这位1928年出生于美国费城的杰出女性,以其卓越的学术成就和对科学界的深远影响,成为了这一命名背后的光辉典范。 Vera Rubin的学术生涯充满了传奇色彩。
3/14/2025 10:01:00 AM
AI在线

算力再飞跃!英伟达官宣下一代AI芯片Rubin,性能剑指Hopper900倍

在 GTC2025大会上,英伟达正式官宣其下一代人工智能(AI)芯片平台,并命名为「Vera Rubin」,致敬美国著名天文学家薇拉·鲁宾(Vera Rubin),延续了英伟达以科学家名字命名架构的传统。 该系列的首款产品 Vera Rubin NVL144预计将于2026年下半年发布。 英伟达首席执行官黄仁勋表示,Rubin 的性能将达到当前 Hopper 架构的900倍,相较之下,最新的 Blackwell 架构已经实现了对 Hopper68倍的性能提升,预示着 Rubin 将带来又一次巨大的算力飞跃。
3/19/2025 9:59:00 AM
AI在线

解锁 AI 开发新高度:AI 工作站与 NVIDIA AI Workbench 全栈解决方案

AI 开发项⽬的不断增加意味着越来越多的 AI ⼯程师和研究⼈员正在创建 AI 模型和. AI 集成应⽤程序。 需要额外的计算资源来⽀持这些新的开发者和新的.
4/17/2025 2:19:46 PM
  • 1