DeepEP

DeepSeek公开致谢腾讯技术团队助力DeepSeek通信框架提速100%

DeepSeek近日发文公开致谢腾讯技术团队，称其对DeepSeek开源通信框架DeepEP的优化是一项“huge speedup”级别的代码贡献。此次优化聚焦于在多种网络环境下提升通信性能。经测试，优化后的DeepEP在RoCE网络环境下性能提升高达100%，在IB（InfiniBand）网络环境下提升约30%，显著增强了通信效率，为AI大模型训练提供了更稳定、高效的底层支撑。

5/8/2025 10:00:55 AM

AI在线

DeepSeek 致谢腾讯技术团队，DeepEP 开源通信框架性能显著提升

经测试，优化后的通信框架性能在 RoCE 网络环境提升 100%，IB 网络环境提升 30%，为企业开展 AI 大模型训练提供更高效的解决方案。

5/7/2025 7:55:10 PM

汪淼

分析一下EP并行和DeepSeek开源的DeepEP代码

被好几个团队的人追着要渣B来分析一下DeepEP的工作, 公司内外的团队都有...简单的一句话说, 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提出的建议要结合在一起看就会更清楚了. 我们还是由浅入深来谈谈EP并行, 并进一步分析一下这份出色的工作.

2/27/2025 9:06:34 AM

渣B

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

上周五，DeepSeek 发推说本周将是开源周（OpenSourceWeek），并将连续开源五个软件库。昨天，他们开源了第一个代码库 ——FlashMLA。这是一款用于 Hopper GPU 的高效型 MLA 解码核，仅用了 24 小时就达到了接近 8k 的 star 量（详情请参见《刚刚，DeepSeek 开源 FlashMLA，推理加速核心技术，Star 量飞涨中》）。

2/25/2025 11:39:00 AM

机器之心