AI在线 AI在线

DeepSeek 系列新模型上线华为昇腾社区:一键获取,开箱即用

据华为官方公众号,2 月 4 日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区,支持一键获取 DeepSeek 系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
感谢据华为官方公众号,2 月 4 日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区,支持一键获取 DeepSeek 系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。

DeepSeek 系列新模型上线华为昇腾社区:一键获取,开箱即用

AI在线附模型调用方式如下:

权重转换

  • GPU:

git clone https://github.com/deepseek-ai/DeepSeek-V3.git
cd DeepSeek-V3/inference/
python fp8_cast_bf16.py --input-fp8-hf-path /path/to/DeepSeek-V3 --output-bf16-hf-path /path/to/deepseek-v3-bf16

图片

  • NPU:

git clone https://modelers.cn/MindIE/deepseekv3.git
cd NPU_inference/
python fp8_cast_bf16.py --input-fp8-hf-path /path/to/DeepSeek-V3 --output-bf16-hf-path /path/to/deepseek-v3-bf16

图片

加载镜像

在昇腾社区 / 开发资源下载适配 DeepSeek-V3 的镜像包:

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后,请使用 docker images 命令确认查找具体镜像名称与标签。

docker load -i mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64(下载的镜像名称与标签)

图片

容器启动

提供的 MindIE 镜像预置了 DeepSeek-V3 模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为 1001,执行权限为 750,启动容器。

图片

chown -R 1001:1001 /path-to-weights/deepseekv3
chowd -R 750 /path-to-weights/deepseekv3

图片

服务化测试

  • 配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。

export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True

图片

  • 修改服务化参数

cd /usr/local/Ascend/mindie/latest/mindie-service/
vim conf/config.json

图片图片

  • 拉起服务化

#设置显存比
export NPU_MEMORY_FRACTION=0.95
#拉起服务化
cd /usr/local/Ascend/mindie/latest/mindie-service/ 
./bin/mindieservice_daemon

图片图片

出现“Daemon start success!”,则认为服务成功启动。

相关资讯

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。
2/11/2025 5:58:54 PM
归泷(实习)

华为发布昇腾大模型:无GPU训练高数大题仅需2秒!

最近,华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。 而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。 在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。
5/30/2025 4:00:54 PM
AI在线

华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝

AI在线 7 月 28 日消息,2025 世界人工智能大会(WAIC)于 7 月 26 日在上海世博中心启幕。 本次 WAIC,华为首次线下展出昇腾 384 超节点 Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。 据华为中国官方消息,昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝,其主要有以下 3 大优势:① 超大带宽超节点内任意两个 AI 处理器之间通信带宽,相较于传统架构提升 15 倍,超节点内单跳时延降低 10 倍。
7/28/2025 11:20:37 AM
归泷
  • 1