昇腾

SGLang原生支持昇腾，新模型一键拉起无需改代码

SGLang原生支持昇腾，新模型一键拉起无需改代码

当Agent在应用侧不断加速，推理系统能否承受随之而来的真实负载，正在成为行业关注的焦点。这是12月20日在杭州收官的SGLang AI 金融 π 对上，被反复提及的一个背景。在这场聚焦大模型推理效率的“π对”上——.

12/22/2025 10:36:28 AM 量子位的朋友们

上海 AI 实验室发布 XTuner V1 训练引擎大模型训练效率暴涨20%

上海 AI 实验室发布 XTuner V1 训练引擎大模型训练效率暴涨20%

近日，上海人工智能实验室（上海 AI 实验室）在其微信公众号上宣布开源了一款全新的大模型训练引擎 ——XTuner V1。该引擎的发布，标志着 AI 模型训练技术的又一次飞跃，尤其是在提升训练效率和性能方面。据上海AI实验室官方消息，XTuner V1 是该实验室最新研发的大模型训练引擎，专门针对当前AI训练中的效率瓶颈问题而设计。

9/9/2025 11:15:23 AM AI在线

华为首次线下展出昇腾 384 超节点：业界最大规模 384 卡高速总线互联

华为首次线下展出昇腾 384 超节点：业界最大规模 384 卡高速总线互联

AI在线 7 月 26 日消息，2025 世界人工智能大会（WAIC）于今日在上海世博中心启幕。本次 WAIC，华为首次线下展出昇腾 384 超节点，即 Atlas 900 A3 SuperPoD，该产品基于超节点架构，通过总线技术实现 384 个 NPU 之间的大带宽低时延互联，解决集群内计算、存储等各资源之间的通信瓶颈。通过系统工程的优化，实现资源的高效调度，让超节点像一台计算机一样工作。

7/26/2025 4:02:47 PM 汪淼

华为发布盘古大模型5.5：五大基础模型升级深度思考模型将上线

华为发布盘古大模型5.5：五大基础模型升级深度思考模型将上线

在今日下午举行的华为开发者大会HDC2025主题演讲中，华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5，标志着自然语言处理（NLP）、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。盘古自然语言处理NLP大模型方面，全新的718B深度思考模型作为由256个专家组成的MoE大模型，在知识推理、工具调用、数学等领域的能力实现大幅提升，处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成，彰显了昇腾架构打造世界一流大模型的实力。

6/20/2025 5:01:01 PM AI在线

华为发布昇腾大模型：无GPU训练高数大题仅需2秒！

华为发布昇腾大模型：无GPU训练高数大题仅需2秒！

最近，华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现，显示出华为在自主可控的国产算力和模型训练方面的强大能力。在技术层面，华为的团队成功提升了训练系统的整体性能，通过智能选择并行策略和优化计算通信，大幅提高了集群的训练效率。

5/30/2025 4:00:54 PM AI在线

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为技术有限公司今日宣布，MindSpeed 支持 DeepSeek V3 预训练、微调，同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。

2/11/2025 5:58:54 PM 归泷（实习）

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

据华为官方公众号，2 月 4 日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区，支持一键获取 DeepSeek 系列模型，支持昇腾硬件平台上开箱即用，推理快速部署。

2/5/2025 3:40:10 PM 清源

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

在AI技术日新月异的今天，大型语言模型已成为推动AI发展的重要力量。 2024年12月26日，DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。这款开源模型采用了高达6710亿参数的混合专家（MoE）架构，每秒能够处理60个token，比V2快了3倍。

1/3/2025 7:38:33 PM 张诚

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉