AI在线 AI在线

我国科学家发明混合并行新算法,训练 AI 速度近乎翻倍

中国科学报今天(5 月 29 日)报道,我国科学家联合发明混合并行新算法 GroPipe,首次融合流水线模型并行与数据并行,训练 AI 速度近乎实现翻倍。

中国科学报今天(5 月 29 日)报道,我国科学家联合发明混合并行新算法 GroPipe,首次融合流水线模型并行与数据并行,训练 AI 速度近乎实现翻倍。

AI在线援引博文介绍,该算法由西北农林科技大学信息工程学院智能计算与农业信息系统团队刘斌教授带领,携手美国纽约州立大学和云南大学,相关论文联合发表在国际计算机体系结构领域权威期刊《IEEE Transactions on Computers》(TC,CCF A 类期刊)上。

西北农林科技大学信息工程学院教授刘斌担任第一作者,纪泽宇老师与云南大学副教授何臻力共同担任通讯作者,纽约州立大学教授李克勤(欧洲科学院院士,并行与分布式计算领域公认的顶尖学者,国家特聘教授)作为重要合作者。

研究指出,在训练大型深度卷积神经网络(DCNNs)方面,使用越来越大的数据集来提高模型精度已变得非常耗时,数据并行(DP)和流水线模型并行(PMP)等分布式训练方法虽然提供了可行解决方案,但面临负载不平衡和显著的通信开销等挑战。

为此团队提出了 GroPipe 算法架构,协同整合 PMP 和 DP,采用了基于性能预测技术的自动模型分割算法,确保负载平衡并便于在 PMP 中进行定量性能评估。

我国科学家发明混合并行新算法,训练 AI 速度近乎翻倍

GroPipe 方法整体框架图。西北农林科技大学供图

该方法首次将流水线模型并行与数据并行相融合,构建“组内流水线 + 组间数据并行”的分层训练架构,并通过自动模型划分算法(AMPA)实现计算负载的动态均衡调度,大幅提升 GPU 资源利用率。

在一台 8-GPU 服务器上广泛测试后,发现在 ImageNet 数据集上,GroPipe 方法相较于主流方案(如 DP、Torchgpipe、DAPPLE 和 DeepSpeed)表现出卓越优势:ResNet 系列平均加速比达 42.2%,VGG 系列达 79.2%;在 BERT-base 模型训练中,性能提升最高可达 51%。

AI在线附上参考地址

  • AI 训练速度翻倍!我国科学家发明混合并行新算法

  • GroPipe: A Grouped Pipeline Hybrid Parallel Method for Accelerating DCNNs Training

相关资讯

OpenAI开源客户服务代理框架 加速企业级AI应用落地

人工智能研究机构OpenAI于6月18日正式开源其客户服务代理框架,标志着该公司在企业级AI解决方案布局上迈出重要一步。 该框架通过提供透明工具链和清晰实施案例,旨在推动智能代理系统从实验室走向实际商业应用。 技术细节与核心优势.
6/19/2025 2:01:33 PM
AI在线

专家揭示构建稳健AI编排层的最佳实践

随着企业加速采用人工智能技术,如何有效管理复杂的AI工作流程成为关键挑战。 最新行业分析指出,建立稳健的AI编排层是解决"提示词混乱"问题的有效方案。 AI编排框架的选择困境.
6/19/2025 2:01:28 PM
AI在线

2025年VentureBeat女性AI大奖入围名单正式公布

2025年6月18日,科技媒体VentureBeat正式公布了2025年度女性AI大奖的最终入围名单。 该奖项旨在表彰人工智能领域做出杰出贡献的女性从业者,推动行业多元化发展。 奖项背景与意义VentureBeat女性AI大奖创立于2020年,已成为AI行业最具影响力的女性专项荣誉之一。
6/19/2025 2:01:33 PM
AI在线
  • 1