华为

MoE那么大，几段代码就能稳稳推理 | 开源

混合专家网络模型架构（MoE）已经成为当前大模型的一个主流架构选择，以最近开源的盘古Pro MoE为例，其基于MoGE架构构建的混合专家架构，总参数量达720亿，激活参数量为160亿，专门针对昇腾硬件优化，在性能与效率上表现突出。盘古还实现了在推理时做到又快又稳。在技术特性上，盘古模型引入 “快思考” 和 “慢思考” 双系统，可根据问题复杂度自动切换响应模式，并在推理性能上实现突破——在昇腾800I A2上单卡推理吞吐性能达1148 tokens/s，经投机加速技术可提升至1528 tokens/s，显著优于同等规模稠密模型。

7/2/2025 5:56:09 PM

十三

携手华为，上海瑞金医院开源 RuiPath 病理模型

上海瑞金医院与华为合作开源RuiPath病理模型，覆盖肺癌、结直肠癌等7大高发癌种，可提升诊断效率。该模型在医学考试场景的图文问答任务中准确率处于国内外领先水平。#医疗AI##癌症诊断#

6/30/2025 6:00:43 PM

潞源（实习）

南钢集团联合华为发布“元冶・钢铁大模型”，实现全流程、全产业链数据贯通与智能升级

据华为官方消息，6 月 21 日，由中国钢铁工业协会、江苏省工业和信息化厅、江苏省数据局指导，南京钢铁集团有限公司、华为技术有限公司联合主办的人工智能赋能新型工业化供需对接深度行（钢铁行业）上，南钢集团与华为联合研发的“元冶・钢铁大模型”正式发布。同时，双方共同设立的“钢铁智能制造联创中心”暨“AI + 工业复合型人才培训基地”揭牌。

6/23/2025 11:46:27 PM

归泷

华为云发布盘古 5.5：三元组编码架构引领预测大模型新潮流！

在刚刚结束的华为开发者大会2025（HDC2025）上，华为常务董事兼华为云计算 CEO 张平安重磅推出了盘古大模型5.5，这一新版本带来了令人振奋的技术升级。张平安表示，此次发布的核心亮点在于采用了华为首创的 “Triplet Transformer” 统一预训练架构。这项新架构的神奇之处在于它能够将来自不同行业的多种数据类型进行统一处理。

6/20/2025 6:01:01 PM

AI在线

华为云发布盘古大模型 5.5：自然语言处理等五大基础模型全面升级

在今日下午的华为开发者大会 HDC 2025 主题演讲中，华为常务董事、华为云计算 CEO 张平安正式发布盘古大模型 5.5，自然语言处理（NLP）、计算机视觉（CV）、多模态、预测、科学计算五大基础模型全面升级。#华为开发者大会2025##HDC2025#

6/20/2025 4:26:59 PM

浩渺

华为汪涛：预计 2030 年全球将有近 30 亿 AI 机器人进入工厂、家庭

汪涛表示，今年，全球将有超过50张5G-A网络规模商用，覆盖超300个城市。同时，5G-A终端全面成熟，涵盖手机、CPE、物联设备等多样化的终端类型。5G-A的加速发展，也给个人和行业带来新的价值。

6/18/2025 2:18:45 PM

清源

华为发布昇腾大模型：无GPU训练高数大题仅需2秒！

最近，华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现，显示出华为在自主可控的国产算力和模型训练方面的强大能力。在技术层面，华为的团队成功提升了训练系统的整体性能，通过智能选择并行策略和优化计算通信，大幅提高了集群的训练效率。

5/30/2025 4:00:54 PM

AI在线

三大巨头携手，中国石油推出3000亿参数昆仑大模型

中国石油近日正式发布了其最新的昆仑大模型，参数高达3000亿。这一里程碑式的进展标志着中国石油在 AI 领域迈出了关键的一步。该大模型的研发由中国石油、中国移动、华为和科大讯飞四大巨头联合打造，预计在2024年8月完成正式备案，成为中国能源化工行业首个获得备案的大模型。

5/29/2025 10:01:21 AM

AI在线

告别卡脖子，华为黑科技破局！昇腾推理加速1.6倍打破LLM降智魔咒

LLM发展到今天，下一步该往哪个方向探索？显然，如今最明显的一个问题就是，大模型的参数规模还是太大了——DeepSeek-V3的参数为671B，Llama 3.1系列最大为405B，GPT-4o为200B，Claude 3.5 Sonnet为175B。参数规模在不断增长，高昂的计算成本和推理延迟，该怎么破？

5/28/2025 8:51:00 AM

华为、中国移动、联通等宣布 openFuyao 开源发布，将致力于提供多样化算力集群软件生态

鲲鹏昇腾开发者大会 2025 期间，华为公共开发部总裁陆海鸥、华为鲲鹏计算业务总裁李义、华为鲲鹏计算业务副总裁熊伟与 openFuyao 开源社区筹备委员会 —— 来自华为技术有限公司、某国有大行、中国移动云能力中心、联通数字科技有限公司、四川华鲲振宇智能科技有限责任公司、江苏博云科技股份有限公司六家成员单位共同宣布 openFuyao 开源发布。

5/26/2025 8:57:06 PM

归泷

华为推出昇腾超节点技术，成功实现业界最大规模 384 卡高速总线互联

IT之家从华为中国官方获悉，此次推出的昇腾 384 超节点，由 12 个计算柜和 4 个总线柜构成，是目前业界规模最大的超节点。依托华为在 ICT 领域深厚的技术与工程经验，通过最佳负载均衡组网方案，该超节点可进一步扩展为包含数万卡的 Atlas 900 SuperCluster 超节点集群，为未来更大规模的模型演进提供支撑。

5/25/2025 2:40:16 PM

归泷

华为FlashComm技术助力大模型推理提速80%

在全球人工智能发展的浪潮中，模型推理的速度和效率愈发成为焦点。近期，华为的数学团队在 DeepSeek 开源周期间推出了名为 FlashComm 的新技术，旨在通过三项创新措施，大幅提升大模型推理的性能，最高可达80% 的速度提升。首先，FlashComm 技术重点优化了 AllReduce 通信操作。

5/22/2025 4:00:55 PM

AI在线

帮大模型提速80%，华为拿出昇腾推理杀手锏FlashComm，三招搞定通算瓶颈

在今年 2 月的 DeepSeek 开源周中，大模型推理过程中并行策略和通信效率的深度优化成为重点之一。近日，华为数学家出手，祭出 FlashComm，三箭齐发，解决大模型推理通算难题：FlashComm1: 大模型推理中的 AllReduce 通信优化技术。将 AllReduce 基于通信原理进行拆解，并结合后续计算模块进行协同优化，推理性能提升 26%。

5/22/2025 1:40:21 PM

万兴科技与华为云携手推进 AI 大模型技术创新

近日，万兴科技集团股份有限公司（以下简称 “万兴科技”）与华为云计算技术有限公司(以下简称 “华为云”)在深圳签署了战略合作协议。此次合作旨在结合双方的优势，共同推动 AI 大模型的技术和应用创新，进一步开拓数字创意领域的潜力。根据协议，万兴科技将充分发挥其在音视频大模型和 AI 应用方面的专业能力，而华为云则将利用其强大的云基础设施和市场拓展优势，建立深度合作关系。

4/30/2025 10:00:50 AM

AI在线

突破封锁！华为将发布大量AI芯片，平替英伟达H100

今天凌晨2点，路透社独家消息，华为最早将于5月份发布大量910C AI芯片，部分出货已完成。华为此次发布产品主要是针对美国对国内AI芯片的封锁，帮助国内企业解决AI芯片短缺的难题。因为美国政府本月要求英伟达销售H20需出口许可证。

4/22/2025 9:47:07 AM

AIGC开放社区

不用英伟达GPU！华为盘古Ultra来了：昇腾原生、135B稠密通用大模型

终于，华为盘古大模型系列上新了，而且是昇腾原生的通用千亿级语言大模型。我们知道，如今各大科技公司纷纷发布百亿、千亿级模型。但这些大部分模型训练主要依赖英伟达的 GPU。

4/13/2025 3:16:00 PM

机器之心

ILLUME+：华为诺亚探索新GPT-4o架构，理解生成一体模型，昇腾可训！

近年来，基于大语言模型（LLM）的多模态任务处理能力取得了显著进展，特别是在将视觉信息融入语言模型方面。像 QwenVL 和 InternVL 这样的模型已经展示了在视觉理解方面的卓越表现，而以扩散模型为代表的文本到图像生成技术也不断突破，推动了统一多模态大语言模型（MLLM）的发展。这些技术的进步使得视觉理解和生成能力的无缝集成成为可能，进一步推进了视觉和语义深度融合下的人工通用智能（AGI）的探索。

4/7/2025 12:59:00 PM

机器之心

独家｜华为诺亚方舟实验室主任换帅，90 后王云鹤接班姚骏

作者丨朱可轩编辑丨陈彩娴AI 科技评论独家获悉：近日华为诺亚方舟实验室进行了人事调整，原主任姚骏已内部转岗，实验室主任一职由王云鹤接任。据知情人士称，在此番接棒后，华为诺亚方舟实验室或将有组织架构的调整。公开资料介绍，姚骏本硕就读于清华，博士毕业于日本京都大学，2009 年至 2014 担任日本奈良先端科学技术大学院准教授，从事面向深度学习等算法的 AI 异构系统的研究。

3/31/2025 3:39:00 PM

朱可轩

资讯热榜

Bilibili开源动漫视频生成模型AniSora V3版，一键生成多种风格动漫视频镜头 xAI控制台新增Grok4及Grok4Code引用，标志着下一代AI模型即将发布 OpenAI 启动高端企业 AI 咨询服务客户收费至少 1000 万美元 X平台启用AI生成 “社区笔记”，未来社交媒体内容或将大变样 2025年软件开发者必备的十大AI智能体框架全解析智谱AI开源GLM-4.1V-Thinking:多模态推理模型再突破第一波！2025年7月精选实用设计干货合集开源端到端语音大模型Step-Audio-AQAA：听懂音频直接生成自然语音

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 用户智能开源微软 Meta GPT 学习图像技术 Gemini AI创作马斯克论文代码 Anthropic 英伟达算法 Stable Diffusion 芯片智能体训练开发者生成式腾讯蛋白质苹果 AI新词神经网络 3D 研究生成 Claude LLM 机器学习计算 Sora AI设计 GPU AI for Science AI视频人形机器人 xAI 华为百度搜索大语言模型场景 Agent 字节跳动预测深度学习伟达工具大型语言模型 Transformer 视觉 RAG 神器推荐具身智能模态 Copilot 亚马逊 LLaMA 文本算力驾驶 AGI