AI在线 AI在线

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

AI在线 7 月 28 日消息,2025 世界人工智能大会(WAIC)于 7 月 26 日在上海世博中心启幕。 本次 WAIC,华为首次线下展出昇腾 384 超节点 Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。 据华为中国官方消息,昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝,其主要有以下 3 大优势:① 超大带宽超节点内任意两个 AI 处理器之间通信带宽,相较于传统架构提升 15 倍,超节点内单跳时延降低 10 倍。

AI在线 7 月 28 日消息,2025 世界人工智能大会(WAIC)于 7 月 26 日在上海世博中心启幕。本次 WAIC,华为首次线下展出昇腾 384 超节点 Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。

3a83c3e98949ce2ff403d4c8295b3384.jpg

据华为中国官方消息,昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝,其主要有以下 3 大优势:

① 超大带宽

超节点内任意两个 AI 处理器之间通信带宽,相较于传统架构提升 15 倍,超节点内单跳时延降低 10 倍。

② 超低时延

昇腾超节点支持全局内存统一编址,具备更高效的内存语义通信能力。通过更低时延指令级内存语义通信,可满足大模型训练 / 推理中的小包通信需求,提升专家网络小包数据传输及离散随机访存通信效率。昇腾 384 超节点 Atlas 900 SuperPoD 是业界唯一突破 Decode 时延 15ms 的方案,满足实时深度思考下的用户体验需求。

③超强性能

经过实际测试,在昇腾超节点集群上,LLaMA3 等千亿稠密模型训练性能可达传统集群的 2.5 倍以上。在通信占比更高的 Qwen、DeepSeek 等多模态、MoE 模型上,可以达到 3 倍以上的提升。

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

据AI在线此前报道,在今年 5 月的鲲鹏昇腾开发者大会上,华为推出了昇腾超节点,成功实现业界最大规模的 384 卡高速总线互联。昇腾超节点具备超大带宽、超低时延、超强性能的三大优势,包括多款训练和推理产品,基于超节点创新架构,更好地满足模型训练和推理对低时延,大带宽,长稳可靠的要求。

图片

华为官方透露,目前业界已基于昇腾适配和开发超过 80 个大模型,在基础大模型方面多个技术方向均有积累,如讯飞星火认知、DeepSeek、Qwen、鹏城、LLaMA 等。同时,昇腾联合 2700 + 行业合作伙伴,共同孵化了超过 6000 + 个行业解决方案。

华为本次展区面积超过 800 平方米,AI在线注意到,除了展示昇腾软硬件能力,训练、推理解决方案和开源开放的软硬件生态,华为还携手伙伴共同展示互联网、运营商、金融、政务、医疗、油气、交通等 11 大行业解决方案实践。

2025 世界人工智能大会专题

相关资讯

华为首次线下展出昇腾 384 超节点:业界最大规模 384 卡高速总线互联

AI在线 7 月 26 日消息,2025 世界人工智能大会(WAIC)于今日在上海世博中心启幕。 本次 WAIC,华为首次线下展出昇腾 384 超节点,即 Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。 通过系统工程的优化,实现资源的高效调度,让超节点像一台计算机一样工作。
7/26/2025 4:02:47 PM
汪淼

华为推出昇腾超节点技术,成功实现业界最大规模 384 卡高速总线互联

IT之家从华为中国官方获悉,此次推出的昇腾 384 超节点,由 12 个计算柜和 4 个总线柜构成,是目前业界规模最大的超节点。依托华为在 ICT 领域深厚的技术与工程经验,通过最佳负载均衡组网方案,该超节点可进一步扩展为包含数万卡的 Atlas 900 SuperCluster 超节点集群,为未来更大规模的模型演进提供支撑。
5/25/2025 2:40:16 PM
归泷

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。
2/11/2025 5:58:54 PM
归泷(实习)
  • 1