AI在线 AI在线

京东云JoyBuilder支持GR00T N1. 5 千卡训练,引领具身智能迈向规模化落地

近日,京东云JoyBuilder模型开发平台迎来关键升级,成功支撑业界顶尖模型GR00T N1.5完成了千卡级训练。 此举使JoyBuilder成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台,并且在训练效率上实现了巨大飞跃,较开源社区版本提升了3.5倍。 基于软硬件的深度调优和算法层面的突破,JoyBuilder平台大幅提升了模型训练效率与稳定性,使得原本需要15小时完成的1亿多数据千卡训练,现在仅需22分钟,显著加速了具身智能迈向规模化落地的进程。

 近日,京东云JoyBuilder模型开发平台迎来关键升级,成功支撑业界顶尖模型GR00T N1.5完成了千卡级训练。

此举使JoyBuilder成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台,并且在训练效率上实现了巨大飞跃,较开源社区版本提升了3.5倍。基于软硬件的深度调优和算法层面的突破,JoyBuilder平台大幅提升了模型训练效率与稳定性,使得原本需要15小时完成的1亿多数据千卡训练,现在仅需22分钟,显著加速了具身智能迈向规模化落地的进程。

人工智能,机器人

为了实现这一效率提升,京东云AI Infra及相关团队围绕具身智能模型训练,对JoyBuilder进行了全栈优化。在具身数据链路优化方面,平台重构了数据预处理与加载流程,实现了CPU数据处理与GPU计算的异步执行,有效减少等待时间;针对海量具身小数据文件,自研的高性能并行文件系统云海JPFS通过分布式元数据管理与智能预取,在1024卡集群上提供了超过400GB/s的读取带宽,保障数据持续高速供给。

在具身模型计算优化方面,团队针对主流的VLA(视觉-语言-动作)模型的计算特点,从Attention层、Token裁剪和训练后量化等多方面进行极致优化。此外,在具身模型基础设施上,平台搭建了3.2T RDMA后端网络,基于多轨道优化、拓扑感知调度与智能震荡抑制,确保千卡间集合通信的高吞吐与低延迟,支持长周期训练稳定运行,并通过云原生的AI数据湖优化了数据调度与流水线,提升端到端处理效率。

通过全链路的优化,JoyBuilder平台支持业界当前最主流的LeRobot训练数据最新协议,确立了其在具身智能AI开发平台领域的领先地位。

相关资讯

构建人形机器人需要的三种电脑,英伟达都提供

在未来的 5 到 10 年里,我们即将见证 AI 从虚拟世界走向现实。
1/18/2025 9:07:00 PM
李泽南

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

具身智能创业如火如荼,技术路线是否收敛、以及数据来源的选择,都是大家一直关心的问题。 最近清华北大的团队密集发布了很多研究成果,我们或许可以从中分析出一些趋势。 23 年初成立的银河通用背后是前如布科技联创尹方鸣和姚腾洲、科学家是北大助理教授王鹤。
1/21/2025 11:00:00 AM
新闻助手

大摩具身智能机器人报告:35 家中国企业杀进全球人形机器人 100 强

金融机构摩根士丹利最新发布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》(人形机器人 100:绘制人形机器人价值链图谱)报告,就对行业深度解析,并罗列了全球人形机器人百强股票名单。
2/15/2025 5:37:11 PM
清源