AI在线 AI在线

国产 scaleX 万卡超集群真机首次亮相,中科曙光打造

AI在线 12 月 18 日消息,在江苏昆山举行的光合组织 2025 人工智能创新大会(HAIC2025)上,中科曙光今日发布并展出了大规模智能计算系统 —— scaleX 万卡超集群,这也是国产万卡级 AI 集群系统首次以真机形式亮相。 中科曙光高级副总裁李斌介绍,scaleX 万卡超集群是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案。 面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求,scaleX 万卡超集群在超节点架构、高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力已超越海外同类产品研发路线图的 2027 年 NVL576 里程节点。

AI在线 12 月 18 日消息,在江苏昆山举行的光合组织 2025 人工智能创新大会(HAIC2025)上,中科曙光今日发布并展出了大规模智能计算系统 —— scaleX 万卡超集群,这也是国产万卡级 AI 集群系统首次以真机形式亮相。

国产 scaleX 万卡超集群真机首次亮相,中科曙光打造

中科曙光高级副总裁李斌介绍,scaleX 万卡超集群是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案。面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求,scaleX 万卡超集群在超节点架构、高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力已超越海外同类产品研发路线图的 2027 年 NVL576 里程节点

AI在线附 scaleX 万卡超集群的核心技术优势如下:

  • 优势 1:全球首创单机柜级 640 卡超节点。scaleX 万卡超集群由 16 个曙光 scaleX640 超节点通过 scaleFabric 高速网络互连而成,可实现 10240 块 AI 加速卡部署,总算力规模超 5EFlops。作为世界首个单机柜级 640 卡超节点,scaleX640 采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升 20 倍,PUE 值低至 1.04。

  • 优势 2:自主研发原生 RDMA 高速网络。曙光 scaleFabric 网络,基于国内首款 400G 类 InfiniBand 的原生 RDMA 网卡与交换芯片,可实现 400Gb/s 超高带宽、低于 1 微秒端侧通信延迟,超节点间的通信性能达到业内领先水平,充分释放万卡超集群算力,并可将超集群规模轻松扩展至 10 万卡以上,相比传统 IB 网络提升 2.33 倍,同时网络总体成本降低 30%。

  • 优势 3:存、算、传紧耦合深度优化。通过“超级隧道”、AI 数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,使存力平台高效应对大模型训练时万卡并发读写带宽极致需求挑战,提升高通量 AI 推理时的响应速度与结果精准度,并可将 AI 加速卡资源利用率提高 55%。

  • 优势 4:超集群数字孪生与智能调度。通过物理集群数字孪生,实现故障定位、修复等全流程可视化智能管理;智能化运维平台可支撑集群长期可用性达 99.99%;智能调度引擎可管理万级节点、服务十万级用户,支持每秒万级作业调度。

scaleX 万卡超集群可支持多品牌加速卡以及主流计算生态,并实现 400+ 主流大模型、世界模型等适配优化。在实际应用中,该超集群可覆盖大模型训练、金融风控、地质能源勘探及科学智能等多元场景。

相关资讯

国产AI视觉模型"橘洲"V1.5发布:首个基于国产算力的全生态端侧大模型落地长沙

中科曙光与湖南汇视威智能科技近日在长沙联合发布了"橘洲"V1.5端侧版及其应用场景。 这是国内首个基于国产算力训练的预训练视觉基座大模型的重要升级版本,标志着国产AI视觉技术在端侧部署领域取得新突破。 相比初代版本,"橘洲"V1.5完成了从"单系统"向"全生态"的战略转型。
10/15/2025 11:06:02 AM
AI在线

Meta 新建两座数据中心集群:内含超 4.9 万块英伟达 H100 GPU,专门训练 Llama3

感谢Meta 公司当地时间 12 日通过官方新闻稿公布了两座新的数据中心集群,该公司正希望通过英伟达的 GPU,在以 AI 为重点的开发中脱颖而出。据悉,这两座数据中心的唯一目的,是在消费者特定应用领域(IT之家注:包含声音或图像识别)中进行 AI 研究和大语言模型的开发,每个集群都包含了 24576 块英伟达 H100 AI GPU,将用于自家大语言模型 Llama 3 的训练。两座新建的数据中心集群都具有 400Gbps 互联功能,其中一个集群采用了 Meta 基于 Arista 7800 自主开发的 Fabr
3/13/2024 5:51:30 PM
清源

重庆两江新区与吉利汽车集团、旷视科技签署战略合作协议,共建 AI 智行开放平台

感谢据吉利控股集团今日消息,7 月 23 日下午,重庆两江新区与吉利汽车集团、AI 公司旷视科技签署战略合作协议。根据合作协议,三方将依托重庆制造业基础和产业优势,结合旷视科技在人工智能领域关键核心技术,以及吉利汽车整车研发、制造优势,共同建设 AI 智行开放平台,构建“AI 车 机器人”产业创新发展模式。AI在线注意到,重庆目前正着力打造“33618”现代制造业集群体系,具体来说,包括两个“3”、1 个“6”、1 个“18”:两个“3”,分别是 3 大万亿级主导产业集群,包括智能网联新能源汽车、新一代电子
7/24/2024 10:43:14 AM
汪淼