AI在线 AI在线

全流程昇腾平台训练,华为推出准万亿参数盘古 Ultra MoE 模型

华为今日宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。
感谢华为今日推出参数规模高达 7180 亿的全新模型盘古 Ultra MoE,这是一个全流程在昇腾 AI 计算平台上训练的准万亿 MoE 模型。

据AI在线了解,盘古团队提出 Depth-Scaled Sandwich-Norm(DSSN)稳定架构和 TinyInit 小初始化的方法,在昇腾平台上实现了超过 18TB 数据的长期稳定训练

在训练方法上,华为团队首次披露在昇腾 CloudMatrix 384 超节点上打通大稀疏比 MoE 强化学习(RL)后训练框架的关键技术,使 RL 后训练进入超节点集群时代。

在 5 月初发布的预训练系统加速技术基础上,在不到一个月的时间内,华为团队又完成了一轮迭代升级,包括:适配昇腾硬件的自适应流水掩盖策略,进一步优化算子执行序,进一步降低 Host-Bound 以及提升 EP 通信的掩盖;自适应管理内存优化策略的开发;数据重排实现 DP 间 Attention 负载均衡;以及昇腾亲和的算子优化,这些技术实现万卡集群预训练 MFU 由 30% 大幅提升至 41%

AI在线附技术报告:点此前往 及项目文件预览:点此前往

相关阅读:

  • 《英伟达含量为零:华为密集模型盘古 Ultra 性能比肩 DeepSeek-R1,纯昇腾集群训练》

相关资讯

华为昇腾适配阶跃星辰多模态开源模型

据科创板日报报道,今日魔乐社区(Modelers)上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。
3/10/2025 2:47:58 PM
远洋

支持大模型百花齐放,推进全面智能化战略:华为中国合作伙伴大会2025召开

华为正计划今年在计算产业伙伴中将重点发展 IT 类伙伴,包括构建计算经销商伙伴体系,并新增大模型一体机伙伴,计划今年发展十几家大模型伙伴。
3/20/2025 5:17:00 PM
新闻助手

加速行业智能化,华为发布AI创新解决方案

3 月 21 日,华为中国合作伙伴大会 2025 在深圳继续举行。 继大会首日系统阐述了战略、体系升级、政策变化后,华为进一步阐述了以「伙伴 华为」的合作伙伴体系为核心,与伙伴共同打造坚实的算力底座,全面加速行业智能化走深向实,共筑解决方案竞争力,共赢时代新机遇的战略。 加速行业智能化,共赢时代新机遇随着人工智能技术的迅猛发展与广泛落地应用,让企业利用 AI 创造价值、推进行业智能化的进程全面提速。
3/22/2025 10:30:00 AM
新闻助手
  • 1