AI在线 AI在线

上海 AI 实验室发布 XTuner V1 训练引擎 大模型训练效率暴涨20%

近日,上海人工智能实验室(上海 AI 实验室)在其微信公众号上宣布开源了一款全新的大模型训练引擎 ——XTuner V1。 该引擎的发布,标志着 AI 模型训练技术的又一次飞跃,尤其是在提升训练效率和性能方面。 据上海AI实验室官方消息,XTuner V1 是该实验室最新研发的大模型训练引擎,专门针对当前AI训练中的效率瓶颈问题而设计。

近日,上海人工智能实验室(上海 AI 实验室)在其微信公众号上宣布开源了一款全新的大模型训练引擎 ——XTuner V1。该引擎的发布,标志着 AI 模型训练技术的又一次飞跃,尤其是在提升训练效率和性能方面。

据上海AI实验室官方消息,XTuner V1 是该实验室最新研发的大模型训练引擎,专门针对当前AI训练中的效率瓶颈问题而设计。该引擎采用了多项创新技术,在保证训练质量的同时大幅提升了训练速度和资源利用率。

技术测试数据显示,XTuner V1 的性能表现令人瞩目。在与昇腾团队的联合优化过程中,该引擎在昇腾 384 超节点平台上完成了深度适配,最终实现了训练吞吐量超过5%的提升。更为突出的是,模型计算利用率MFU获得了超过20%的大幅增长,这一指标的提升直接关系到计算资源的有效利用和训练成本的降低。

上海AI实验室相关负责人表示,XTuner V1 的开发历经多个月的技术攻关,团队在算法优化、系统架构、硬件适配等多个层面进行了深入研究。与昇腾团队的合作为这款引擎的性能优化提供了重要支持,双方在Atlas 900 A3 SuperPoD平台上进行的联合测试验证了技术方案的可行性和先进性。

值得注意的是,上海AI实验室选择了开源策略,将XTuner V1 免费向全球开发者和研究机构开放。这一决定旨在推动整个AI行业的技术进步,让更多团队能够受益于这项技术成果。业内专家认为,开源模式将加速XTuner V1 的应用推广,同时也有利于技术的持续改进和完善。

从应用前景来看,XTuner V1 的发布将为AI行业带来实际价值。当前,大模型训练面临着计算资源消耗巨大、训练周期漫长等挑战,XTuner V1 的效率提升能够有效缓解这些问题,为企业和研究机构降低AI应用的开发成本和时间投入。

据了解,上海AI实验室将在近期发布XTuner V1 的详细技术报告,全面介绍该引擎的技术架构、创新要点和应用指南。这份技术文档将为开发者提供完整的使用指导,帮助他们更好地理解和应用这项技术。

行业分析人士指出,XTuner V1 的推出体现了中国AI技术研发的最新进展,也展现了上海在人工智能领域的创新实力。随着这款训练引擎的广泛应用,预计将推动更多高效AI解决方案的出现,为各行各业的智能化升级提供有力支撑。

相关资讯

华为发布盘古大模型5.5:五大基础模型升级 深度思考模型将上线

在今日下午举行的华为开发者大会HDC2025主题演讲中,华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5,标志着自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。 盘古自然语言处理NLP大模型方面,全新的718B深度思考模型作为由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域的能力实现大幅提升,处于行业领先地位。 盘古大模型基于昇腾云的全栈软硬件训练而成,彰显了昇腾架构打造世界一流大模型的实力。
6/20/2025 5:01:01 PM
AI在线

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。
2/11/2025 5:58:54 PM
归泷(实习)

DeepSeek 系列新模型上线华为昇腾社区:一键获取,开箱即用

据华为官方公众号,2 月 4 日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区,支持一键获取 DeepSeek 系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
2/5/2025 3:40:10 PM
清源
  • 1