华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

作者：归泷（实习） 2025-02-11 05:58

华为技术有限公司今日宣布，MindSpeed 支持 DeepSeek V3 预训练、微调，同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。

感谢华为技术有限公司今日宣布，MindSpeed 支持 DeepSeek V3 预训练、微调，同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。

据介绍，MindSpeed 现已支持 DeepSeek V3 模型预训练与微调。所使用的并行配置与模型参数如下：

DeepSeek 团队通过知识蒸馏，实现了较小的模型也能具备较强的推理能力。华为称已基于昇腾完成蒸馏流程验证，并表示经过蒸馏后的 Qwen 模型在对应领域上的评分获得显著提升，开发者可基于此参考，完成自定义蒸馏模型训练。

另外，华为昇腾还适配完成 Open R1 项目的重要步骤：打通 Open R1-Zero 的 GRPO 流程，同时支持通过 vLLM 等生态库实现训练过程中的数据生成。

据介绍，Open R1 项目是 Hugging Face 官方开源的对 DeepSeek-R1 模型流程进行完全开放式复现的项目，是当前主流复现项目之一，当前已有 18K+ star 数，其目标是构建 DeekSeek-R1 训练流程的缺失部分。

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

据华为官方公众号，2 月 4 日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区，支持一键获取 DeepSeek 系列模型，支持昇腾硬件平台上开箱即用，推理快速部署。

2/5/2025 3:40:10 PM 清源

华为发布昇腾大模型：无GPU训练高数大题仅需2秒！

最近，华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现，显示出华为在自主可控的国产算力和模型训练方面的强大能力。在技术层面，华为的团队成功提升了训练系统的整体性能，通过智能选择并行策略和优化计算通信，大幅提高了集群的训练效率。

5/30/2025 4:00:54 PM AI在线

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

AI在线 7 月 28 日消息，2025 世界人工智能大会（WAIC）于 7 月 26 日在上海世博中心启幕。本次 WAIC，华为首次线下展出昇腾 384 超节点 Atlas 900 A3 SuperPoD，该产品基于超节点架构，通过总线技术实现 384 个 NPU 之间的大带宽低时延互联，解决集群内计算、存储等各资源之间的通信瓶颈。据华为中国官方消息，昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝，其主要有以下 3 大优势：① 超大带宽超节点内任意两个 AI 处理器之间通信带宽，相较于传统架构提升 15 倍，超节点内单跳时延降低 10 倍。

7/28/2025 11:20:37 AM 归泷

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

相关资讯

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

华为发布昇腾大模型：无GPU训练高数大题仅需2秒！

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝