AI在线 AI在线

华为发布昇腾大模型:无GPU训练高数大题仅需2秒!

最近,华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。 而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。 在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。

最近,华为通过其新推出的 “昇腾 + Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。

在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。在其技术报告中,华为详尽披露了在 CloudMatrix384超节点上进行的多项技术创新,包括改进的通信机制和负载均衡策略。这些创新使得大规模 MoE 训练的专家并行通信开销几乎降至零,同时有效平衡了计算负载。

image.png

此外,华为在提高单节点算力方面也取得了显著成效。他们通过优化训练算子的执行,成功将微批处理规模提升至原来的两倍,同时解决了算子下发的效率问题。这种技术的进步意味着,华为的系统在面对复杂计算任务时,能够更加高效地利用现有资源。

华为的这一系列技术创新不仅让 MoE 模型的训练效率大幅提升,更为未来大规模 AI 模型的训练与应用打开了新的可能性。

相关资讯

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。
2/11/2025 5:58:54 PM
归泷(实习)

DeepSeek 系列新模型上线华为昇腾社区:一键获取,开箱即用

据华为官方公众号,2 月 4 日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区,支持一键获取 DeepSeek 系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
2/5/2025 3:40:10 PM
清源

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

在AI技术日新月异的今天,大型语言模型已成为推动AI发展的重要力量。 2024年12月26日,DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。 这款开源模型采用了高达6710亿参数的混合专家(MoE)架构,每秒能够处理60个token,比V2快了3倍。
1/3/2025 7:38:33 PM
张诚
  • 1