AI在线 AI在线

中国联通发布全球最长距离大模型异构混训成果:超 1500 公里跨域,仅损失不到 5% 算力

AI在线 7 月 20 日消息,在 2025 中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于 7 月 19 日正式发布了全球最长距离大模型异构混训试验成果。 随着人工智能技术的高速发展和大模型时代的加速来临,模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。 然而,当前算力资源呈现出异构化和多中心化的格局,面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。

AI在线 7 月 20 日消息,在 2025 中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于 7 月 19 日正式发布了全球最长距离大模型异构混训试验成果

中国联通发布全球最长距离大模型异构混训成果:超 1500 公里跨域,仅损失不到 5% 算力

随着人工智能技术的高速发展和大模型时代的加速来临,模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。然而,当前算力资源呈现出异构化和多中心化的格局,面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战

在此背景下,中国联通联合上海人工智能实验室,阿里云、浪潮、基流科技、加佳科技等行业合作伙伴,面向国产异构 GPU 环境,针对超大模型跨域训练和碎片化算力整合需求,依托“算力智联网 AINet”长距无损传输技术优势,结合上海人工智能实验室“DeepLink”超大规模跨域混训技术方案,在上海临港和山东济南鲍山数据中心间构建长度超 1500 公里的跨域异构混训系统。

AI在线从大会获悉,通过自动调整多种并行策略和跨域收敛比下 MoE 模型和 Dense 模型的参数配置,联合团队完成了 1500 公里跨域的千亿参数 AI 大模型异构混训试验经验证等效算力可达单芯片单集群等效算力的 95% 以上

  • 在算力互联层面,采用联通自研内置长距 RDMA 协议栈的 RoCE 交换机,兼顾 DC 内和 DC 间高性能网络需求;

  • 在算力调度与资源管理层面,通过联通“智驭”平台实现对跨域网络和集群的统一管控及任务调度;

  • 在算力协同层面,基于 DeepLink 在训练加速、异构通信、并行策略等核心技术,实现千亿参数大模型在超长距离异构 GPU 环境下的高效训练。

中国联通发布全球最长距离大模型异构混训成果:超 1500 公里跨域,仅损失不到 5% 算力

中国联通表示,上述成果标志着中国联通在算力基础设施跨域协同调度、异构资源融合与高性能分布式训练等关键领域实现了实质性技术突破,为下一代互联网产业发展奠定基础。

相关资讯

中国联通发布元景思维链大模型:性能超越GPT-4o 比肩OpenAI o1

今日,中国联通宣布,其旗下联通数据智能有限公司正式发布了元景思维链大模型。 这一创新成果已在GitHub、魔搭、始智等多个社区全面开源,标志着中国联通在人工智能领域迈出了重要一步。 元景思维链大模型作为中国联通推出的业界首款央企开源通用思维链大模型,展现了强大的慢思考能力和多学科、多场景的通用推理能力。
1/24/2025 1:59:00 PM
AI在线

中国联通业界首次提出大模型能力边界量化基准,避免“高射炮打蚊子”情况

相关研究成果以 <What is the Best Model? Application-Driven Evaluation for Large Language Models> 为题发表在自然语言处理权威会议 NLPCC 2024 上,相应的评估基准已向业界开源。
12/27/2024 9:43:47 PM
汪淼

中国联通针对急需紧缺高层次 AI 人才采用年薪制、协议工资制,上不封顶

中国联通执行董事王俊治分享了在 AI 人才方面的布局。激励上,针对急需紧缺高层次人才支持基于市场对标采用年薪制、协议工资制,实行契约化管理、差异化兑现,上不封顶,对所需工资总额予以单列。
3/18/2025 11:25:01 PM
-
  • 1