腾讯助力DeepSeek：网络通信性能大幅提升，AI训练更高效

作者：AI在线 2025-05-08 07:00

近日，腾讯技术团队对 DeepSeek 开源的 DeepEP 通信框架进行了深度优化，显著提升了其在多种网络环境下的性能。经过测试，优化后的通信框架在 RoCE 网络环境下的性能提升达到了惊人的100%，而在 IB 网络环境中则提升了30%。这一成果不仅为企业的 AI 大模型训练提供了更高效的解决方案，还为相关技术的进一步发展奠定了基础。

DeepSeek 是一个专注于 AI 大模型训练的开源项目，其 DeepEP 通信框架旨在提高数据传输效率，确保在复杂的网络环境中实现流畅的计算过程。腾讯团队的优化工作，解决了深度学习训练过程中常见的通信瓶颈，提升了数据交换的速度，使得训练过程更加高效。

DeepSeek

图源备注：图片由AI生成，图片授权服务商Midjourney

值得一提的是，这次优化成果得到了 DeepSeek 的公开致谢，称此次贡献为 “huge speedup” 代码贡献。优化后的框架能够有效减少训练模型所需的时间，从而让企业能够更快地部署和应用 AI 技术。这对 AI 产业的发展无疑是一个积极的推动。

随着 AI 技术的迅猛发展，企业对高效计算和数据传输的需求也日益增长。此次优化不仅提升了 DeepEP 框架的性能，也展示了腾讯在技术创新和合作方面的实力。未来，随着更多技术的融合与发展，企业将在 AI 领域获得更大的竞争优势。

腾讯技术团队的努力为 AI 大模型的训练开辟了新的可能性，让企业在数字化转型的道路上走得更稳、更快。

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

「21 世纪什么最贵？人才！」二十年前的黎叔语录，现在听来也不过时。这两年，大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发，期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本，并受到了研究员、工程师和投资人们的广泛关注与深刻讨论：为什么是 OpenAI？它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金，更重要的是一批顶尖 AI 研究人员的聚集。我们能看到，在 ChatGPT、Sora、GPT-4o 等划时代产品的背后，有一长串名单的核心贡献者，一家科技公司想要持续「伟大」，

6/21/2024 3:37:00 PM

机器之心

无需人工标注！AI自生成训练数据，靠「演绎-归纳-溯因」解锁推理能力

当AI试图破解数学、编程与科学的难题时，它常常像一位灵感乍现的天才，却又难以稳定发挥。新加坡国立大学、清华大学和Salesforce AI Research的研究者，提出了一种革命性的训练框架——元能力对齐，赋予模型稳健的推理能力，让顿悟成为常态。论文链接：，能够高效地系统化培养大模型的数学，编程和科学问题上的基本推理能力。

6/3/2025 9:05:00 AM

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

近年来，链式推理和强化学习已经被广泛应用于大语言模型，让大语言模型的推理能力得到了显著提升。然而，在图像生成模型中，这种成功经验尚未得到充分探索。图像生成模型往往直接依据给定文本生成图像，缺乏类似人类创作过程中的推理，导致生成的图像在语义遵循上仍有一定局限。

6/17/2025 8:47:00 AM

腾讯助力DeepSeek：网络通信性能大幅提升，AI训练更高效

相关资讯

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

无需人工标注！AI自生成训练数据，靠「演绎-归纳-溯因」解锁推理能力

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？