昇腾
上海 AI 实验室发布 XTuner V1 训练引擎 大模型训练效率暴涨20%
近日,上海人工智能实验室(上海 AI 实验室)在其微信公众号上宣布开源了一款全新的大模型训练引擎 ——XTuner V1。 该引擎的发布,标志着 AI 模型训练技术的又一次飞跃,尤其是在提升训练效率和性能方面。 据上海AI实验室官方消息,XTuner V1 是该实验室最新研发的大模型训练引擎,专门针对当前AI训练中的效率瓶颈问题而设计。
9/9/2025 11:15:23 AM
AI在线
华为首次线下展出昇腾 384 超节点:业界最大规模 384 卡高速总线互联
AI在线 7 月 26 日消息,2025 世界人工智能大会(WAIC)于今日在上海世博中心启幕。 本次 WAIC,华为首次线下展出昇腾 384 超节点,即 Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。 通过系统工程的优化,实现资源的高效调度,让超节点像一台计算机一样工作。
7/26/2025 4:02:47 PM
汪淼
华为发布盘古大模型5.5:五大基础模型升级 深度思考模型将上线
在今日下午举行的华为开发者大会HDC2025主题演讲中,华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5,标志着自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。 盘古自然语言处理NLP大模型方面,全新的718B深度思考模型作为由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域的能力实现大幅提升,处于行业领先地位。 盘古大模型基于昇腾云的全栈软硬件训练而成,彰显了昇腾架构打造世界一流大模型的实力。
6/20/2025 5:01:01 PM
AI在线
华为发布昇腾大模型:无GPU训练高数大题仅需2秒!
最近,华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。 而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。 在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。
5/30/2025 4:00:54 PM
AI在线
华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1
华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。
2/11/2025 5:58:54 PM
归泷(实习)
DeepSeek 系列新模型上线华为昇腾社区:一键获取,开箱即用
据华为官方公众号,2 月 4 日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区,支持一键获取 DeepSeek 系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
2/5/2025 3:40:10 PM
清源
从DeepSeek-V3发布谈大模型的技术突破与未来机遇
在AI技术日新月异的今天,大型语言模型已成为推动AI发展的重要力量。 2024年12月26日,DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。 这款开源模型采用了高达6710亿参数的混合专家(MoE)架构,每秒能够处理60个token,比V2快了3倍。
1/3/2025 7:38:33 PM
张诚
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型