AI在线 AI在线

腾讯助力DeepSeek:网络通信性能大幅提升,AI训练更高效

近日,腾讯技术团队对 DeepSeek 开源的 DeepEP 通信框架进行了深度优化,显著提升了其在多种网络环境下的性能。 经过测试,优化后的通信框架在 RoCE 网络环境下的性能提升达到了惊人的100%,而在 IB 网络环境中则提升了30%。 这一成果不仅为企业的 AI 大模型训练提供了更高效的解决方案,还为相关技术的进一步发展奠定了基础。

近日,腾讯技术团队对 DeepSeek 开源的 DeepEP 通信框架进行了深度优化,显著提升了其在多种网络环境下的性能。经过测试,优化后的通信框架在 RoCE 网络环境下的性能提升达到了惊人的100%,而在 IB 网络环境中则提升了30%。这一成果不仅为企业的 AI 大模型训练提供了更高效的解决方案,还为相关技术的进一步发展奠定了基础。

DeepSeek 是一个专注于 AI 大模型训练的开源项目,其 DeepEP 通信框架旨在提高数据传输效率,确保在复杂的网络环境中实现流畅的计算过程。腾讯团队的优化工作,解决了深度学习训练过程中常见的通信瓶颈,提升了数据交换的速度,使得训练过程更加高效。

DeepSeek

图源备注:图片由AI生成,图片授权服务商Midjourney

值得一提的是,这次优化成果得到了 DeepSeek 的公开致谢,称此次贡献为 “huge speedup” 代码贡献。优化后的框架能够有效减少训练模型所需的时间,从而让企业能够更快地部署和应用 AI 技术。这对 AI 产业的发展无疑是一个积极的推动。

随着 AI 技术的迅猛发展,企业对高效计算和数据传输的需求也日益增长。此次优化不仅提升了 DeepEP 框架的性能,也展示了腾讯在技术创新和合作方面的实力。未来,随着更多技术的融合与发展,企业将在 AI 领域获得更大的竞争优势。

腾讯技术团队的努力为 AI 大模型的训练开辟了新的可能性,让企业在数字化转型的道路上走得更稳、更快。

相关资讯

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

「21 世纪什么最贵?人才!」二十年前的黎叔语录,现在听来也不过时。这两年,大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发,期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本,并受到了研究员、工程师和投资人们的广泛关注与深刻讨论:为什么是 OpenAI?它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金,更重要的是一批顶尖 AI 研究人员的聚集。我们能看到,在 ChatGPT、Sora、GPT-4o 等划时代产品的背后,有一长串名单的核心贡献者,一家科技公司想要持续「伟大」,
6/21/2024 3:37:00 PM
机器之心

无需人工标注!AI自生成训练数据,靠「演绎-归纳-溯因」解锁推理能力

当AI试图破解数学、编程与科学的难题时,它常常像一位灵感乍现的天才,却又难以稳定发挥。 新加坡国立大学、清华大学和Salesforce AI Research的研究者,提出了一种革命性的训练框架——元能力对齐,赋予模型稳健的推理能力,让顿悟成为常态。 论文链接:,能够高效地系统化培养大模型的数学,编程和科学问题上的基本推理能力。
6/3/2025 9:05:00 AM

SFT+RL双管齐下:ReasonGen-R1如何破解文生图「指令不遵」难题?

近年来,链式推理和强化学习已经被广泛应用于大语言模型,让大语言模型的推理能力得到了显著提升。 然而,在图像生成模型中,这种成功经验尚未得到充分探索。 图像生成模型往往直接依据给定文本生成图像,缺乏类似人类创作过程中的推理,导致生成的图像在语义遵循上仍有一定局限。
6/17/2025 8:47:00 AM
  • 1