俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练对象：大幅晋升 GPU 利用率，对 Llama 3 可实现 26% 加速

俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练对象 ——YaFSDP，号称与现有对象相比速率最高可晋升 26%。据介绍，YaFSDP 在训练速率方面优于传统的 FSDP 方法，尤其适用于大型模型。在预训练 LLM 方面，YaFSDP 速率提高了 20%，并且在高内存压力条件下表现更佳。例如，YaFSDP 对具有 700 亿参数的 Llama 2 可以实现 21% 的效益晋升，对具有同级参数的 Llama 3 也实现了 26% 的效益晋升。IT之家附官方数据一览：模型gpu-countseq-lenn

俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练对象 ——YaFSDP，号称与现有对象相比速率最高可晋升 26%。

据介绍，YaFSDP 在训练速率方面优于传统的 FSDP 方法，尤其适用于大型模型。在预训练 LLM 方面，YaFSDP 速率提高了 20%，并且在高内存压力条件下表现更佳。

例如，YaFSDP 对具有 700 亿参数的 Llama 2 可以实现 21% 的效益晋升，对具有同级参数的 Llama 3 也实现了 26% 的效益晋升。IT之家附官方数据一览：

模型gpu-countseq-lennum-ckpt-layersspeedupLlama 2 7B64204809.92%Llama 2 7B64409603.43%Llama 2 7B64819202.68%Llama 2 7B128204809.57%Llama 2 7B128409602.42%Llama 2 7B128819202.32%Llama 2 13B1282048012.10%Llama 2 13B128409603.49%Llama 2 34B1282048020.70%Llama 2 34B2562048021.99%Llama 2 34B256409658.35%Llama 2 70B25620481021.48%Llama 2 70B2564096507.17%Llama 3 8B642048011.91%Llama 3 8B64409607.86%Llama 3 70B25620482026.60%

Yandex 表示，通过优化 GPU 使用率，YaFSDP 可以为开发者和公司浪费大量资金 —— 每月可能浪费数十万美元。

Yandex 的资深开发人员、YaFSDP 团队成员之一 Mikhail Khruschev 还提到，“目前，我们正在积极尝试各种模型架构和参数大小，以扩展 YaFSDP 的通用性” 。

参考资料：

《Яндекс открывает YaFSDP — инструмент для ускорения обучения больших языковых моделей и сокращения расходов на GPU / Хабр》

《GitHub – yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel》

{{userData.name}}已认证

俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练对象：大幅晋升 GPU 利用率，对 Llama 3 可实现 26% 加速

视觉说话模型导论：这篇论文能成为你进军VLM的第一步

苹果高管：正努力将“Apple Intelligence”引入中国商场

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1/47

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

Meta 用 AI 生成北极光图片，遭网友怒喷

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

字节跳动清华AIR成立联合研究中心推动大模型产学研合作

化学诺奖为何颁给「AI+生物」，凭什么Baker独占一半？

{{userData.name}}已认证

视觉说话模型导论：这篇论文能成为你进军VLM的第一步

苹果高管：正努力将“Apple Intelligence”引入中国商场

AI 架构 Transformer 再进化：谷歌新方法突破长文本处理，注意力模块内存需求可降至 1/47

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

Meta 用 AI 生成北极光图片，遭网友怒喷

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

字节跳动清华AIR成立联合研究中心 推动大模型产学研合作

化学诺奖为何颁给「AI+生物」，凭什么Baker独占一半？

字节跳动清华AIR成立联合研究中心推动大模型产学研合作