上海 AI 实验室发布 XTuner V1 训练引擎大模型训练效率暴涨20%

作者：AI在线 2025-09-09 11:15

近日，上海人工智能实验室（上海 AI 实验室）在其微信公众号上宣布开源了一款全新的大模型训练引擎 ——XTuner V1。该引擎的发布，标志着 AI 模型训练技术的又一次飞跃，尤其是在提升训练效率和性能方面。据上海AI实验室官方消息，XTuner V1 是该实验室最新研发的大模型训练引擎，专门针对当前AI训练中的效率瓶颈问题而设计。

近日，上海人工智能实验室（上海 AI 实验室）在其微信公众号上宣布开源了一款全新的大模型训练引擎 ——XTuner V1。该引擎的发布，标志着 AI 模型训练技术的又一次飞跃，尤其是在提升训练效率和性能方面。

据上海AI实验室官方消息，XTuner V1 是该实验室最新研发的大模型训练引擎，专门针对当前AI训练中的效率瓶颈问题而设计。该引擎采用了多项创新技术，在保证训练质量的同时大幅提升了训练速度和资源利用率。

技术测试数据显示，XTuner V1 的性能表现令人瞩目。在与昇腾团队的联合优化过程中，该引擎在昇腾 384 超节点平台上完成了深度适配，最终实现了训练吞吐量超过5%的提升。更为突出的是，模型计算利用率MFU获得了超过20%的大幅增长，这一指标的提升直接关系到计算资源的有效利用和训练成本的降低。

上海AI实验室相关负责人表示，XTuner V1 的开发历经多个月的技术攻关，团队在算法优化、系统架构、硬件适配等多个层面进行了深入研究。与昇腾团队的合作为这款引擎的性能优化提供了重要支持，双方在Atlas 900 A3 SuperPoD平台上进行的联合测试验证了技术方案的可行性和先进性。

值得注意的是，上海AI实验室选择了开源策略，将XTuner V1 免费向全球开发者和研究机构开放。这一决定旨在推动整个AI行业的技术进步，让更多团队能够受益于这项技术成果。业内专家认为，开源模式将加速XTuner V1 的应用推广，同时也有利于技术的持续改进和完善。

从应用前景来看，XTuner V1 的发布将为AI行业带来实际价值。当前，大模型训练面临着计算资源消耗巨大、训练周期漫长等挑战，XTuner V1 的效率提升能够有效缓解这些问题，为企业和研究机构降低AI应用的开发成本和时间投入。

据了解，上海AI实验室将在近期发布XTuner V1 的详细技术报告，全面介绍该引擎的技术架构、创新要点和应用指南。这份技术文档将为开发者提供完整的使用指导，帮助他们更好地理解和应用这项技术。

行业分析人士指出，XTuner V1 的推出体现了中国AI技术研发的最新进展，也展现了上海在人工智能领域的创新实力。随着这款训练引擎的广泛应用，预计将推动更多高效AI解决方案的出现，为各行各业的智能化升级提供有力支撑。

华为发布盘古大模型5.5：五大基础模型升级深度思考模型将上线

在今日下午举行的华为开发者大会HDC2025主题演讲中，华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5，标志着自然语言处理（NLP）、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。盘古自然语言处理NLP大模型方面，全新的718B深度思考模型作为由256个专家组成的MoE大模型，在知识推理、工具调用、数学等领域的能力实现大幅提升，处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成，彰显了昇腾架构打造世界一流大模型的实力。

6/20/2025 5:01:01 PM AI在线

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

据华为官方公众号，2 月 4 日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区，支持一键获取 DeepSeek 系列模型，支持昇腾硬件平台上开箱即用，推理快速部署。

2/5/2025 3:40:10 PM 清源

上海 AI 实验室发布 XTuner V1 训练引擎大模型训练效率暴涨20%

相关资讯

华为发布盘古大模型5.5：五大基础模型升级深度思考模型将上线

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

上海 AI 实验室发布 XTuner V1 训练引擎 大模型训练效率暴涨20%

相关资讯

华为发布盘古大模型5.5：五大基础模型升级 深度思考模型将上线

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

上海 AI 实验室发布 XTuner V1 训练引擎大模型训练效率暴涨20%

华为发布盘古大模型5.5：五大基础模型升级深度思考模型将上线