单芯片处理器走到尽头?苹果&英伟达倾心多芯片封装,互连技能最关键

当单芯片处理器已达到极限,苹果和英伟达相继公布的芯片证明多芯片封装或许才是未来发展方向,但互连技能仍是一大难题和巨擘角逐的主战场。

3 月 10 日,苹果在 2022 年春季公布会上 M1 Max 芯片的升级版 ——M1 Ultra,创新性地采用了封装架构 UltraFusion,将两个 M1 Max 芯片的管芯相连,创造出了具有前所未有功能和功能的片上系统(SoC)。

3 月 23 日,英伟达在 GTC 2022 大会上公布了类似的新闻。黄仁勋宣布推出首款面向 AI 基础设施和高功能计算的数据中心专属 CPU,其中新的 Grace Hopper 可以在同一块主板上两块并联,形成了一个 144 核的 Grace CPU 超级芯片,内存带宽为 1TB/s。

两家公司的芯片具有不同的目标市场。苹果瞄准消费者和专业工作站市场,而英伟达力图在高功能计算市场掀起风云。然而,目标的不同只会凸显快速结束单芯片安排时代面临的广泛挑战。

图片

图源:top10.digital

芯片巨擘纷纷入场

多芯片安排不是什么新概念,但直到最近五年才越来越受青睐。AMD、苹果、英特尔和英伟达等芯片巨擘都不同程度地涉足其中。

AMD 通过自身的 EPYC 和 RYZEN 处理器在小芯片(chiplet)安排领域展开探索。英特尔在 2021 年架构日活动上公布了下一代英特尔至强可扩展处理器 Sapphire Rapids,这款面向服务器市场的架构使用小芯片「tiles」构建而成。

现在,苹果和英伟达也加入了多芯片安排的行列,尽管面向的目标市场截然不同。应该看到,向多芯片安排的转变是由现代芯片创造中的挑战所驱动的。晶体管小型化的速度已经变慢,但前沿安排中晶体管数量的增长仍未见放缓的迹象。

以苹果 M1 Ultra 芯片为例,它的晶体管数量为 1140 亿,是个人计算机芯片中有史以来最多的,为 M1 的 7 倍。单个 M1 Max 的芯片面积为 432 平方毫米,由此推知,M1 Ultra 的面积约为 860 平方毫米(官方数字未知)。

图片

M1 Ultra 示意图。

英伟达 Grace CPU 的晶体管数量处于保密状态,但与它一起公布的 Hopper H100 GPU 拥有 800 亿个晶体管,20 块即可承载全球流量。2019 年,AMD 公布的 64 核 EYPC Rome 处理器拥有 395 亿个晶体管。

图片

英伟达 Grace CPU 超级芯片。

市场研究公司 Counterpoint Research 的研究分析师 Akshara Bassi 表示,「随着芯片面积变得越来越大以及晶圆成品率问题越来越重要,多芯片模块封装安排能够实现比单芯片安排更佳的功耗和功能表现。」

目前,除了致力于造出单个完整硅晶圆的 AI 芯片创业公司 Cerebras 之外,芯片行业似乎达成了一致意见,即单芯片安排变得越来越「得不偿失」。

图片

2021 年 4 月,Cerebras 公布了 2.6 万亿晶体管、比 ipad 还大的巨无霸芯片 WSE 2。

此外,行业转向小芯片与芯片创造商的支持是同步进行的。2020 年 8 月,全球最大芯片代工厂台积电推出了 3DFabric 先进封装技能系列,包含了前端 3D 硅堆栈和后端封装技能。

AMD 在其 EPYC 和 RYZEN 处理器安排中使用了属于 3DFabric 的技能,并且几乎可以肯定苹果 M1 Ultra 芯片也使用了台积电相关封装技能(虽然苹果尚未给予确认,但 M1 Ultra 是由台积电创造的)。

其他芯片巨擘如英特尔,它有自己的封装技能,如 EMIB 和 Foveros。尽管最开始意在自己使用,但随着英特尔代工服务的开展,该公司的芯片创造技能正变得与更广泛的行业息息相关。

多芯片安排的前景如何?

另一家市场研究公司 Hyperion Research 的一位高级分析师 Mark Nossokoff 认为,「围绕基础半导体安排、创造和封装的生态已经发展到了能够支持『安排节点经济可靠生成小芯片解决方案』的程度。无缝集成多样化小芯片功能的软件安排工具也已经成熟到可以优化目标解决方案的功能了。」

小芯片将继续存在,但就目前而言,该领域是一个孤岛。AMD、苹果、英特尔和英伟达正在将自研的互连安排方案应用于特定的封装技能中。

今年 3 月 2 日,英特尔、AMD、Arm、高通、台积电、三星、日月光、谷歌云、Meta、微软等十大巨擘宣布成立 Chiplet 尺度联盟,推出了通用小芯片互连尺度(Universal Chiplet Interconnection Express, UCIe),希望将行业聚合起来。该尺度提供了一个面针对成本效益功能的「尺度」2D 包和面向前沿安排的「高级」包。 

UCIe 还支持通过 PCIe 和 CXL 进行封装之外(off-package)的连接,从而为高功能计算环境中跨多台机器连接多个芯片提供了可能。

图片

UCIe 白皮书中 UCIe 封装方案示例。

UCIe 尺度是一个开始,它的未来仍有待观察。Nossokoff 对此表示,最初发起 UCIe 的创始成员代表了众多技能安排和创造领域的杰出贡献者,但很多主要组织并没有加入进来,包括苹果、AWS、博通、IBM、英伟达以及其他硅代工厂和内存芯片供应商。

Bassi 指出,英伟达可能特别不愿意加入 UCIe 联盟。英伟达已经为定制硅集成开放了自研的 NVLink-C2C 互连技能,使其成为了 UCIe 的潜在竞争对手。

虽然 UCIe 和 NVLink-C2C 等芯片互连技能的命运决定了行业游戏规则,但它们不太可能改变行业现有局面。

原文链接:https://spectrum.ieee.org/single-chip-processors-have-reached-their-limits

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/dan-xin-pian-chu-li-qi-zou-dao-jin-tou-ping-guo-ying-wei-da/

(0)
上一篇 2022年 4月 10日 下午12:37
下一篇 2022年 4月 10日 下午12:45

相关推荐

  • AI自动化系统可以赶快找到新的电池化学成分,比人工尝试要快得多

    编辑 | 萝卜皮开发高能高效电池技术是推进交通和航空电气化的关键方面。然而,电池创新能够需要数年时间才能实现。在非水电池电解质溶液的情况下,选择多种溶剂、盐及其相对比例的许多计划变量使得电解质优化既费时又费力。为了克服这些问题,卡内基梅隆大学(Carnegie Mellon University)的钻研团队提出了一种尝试计划,将呆板人技术(一个名为「Clio」的定制自动化尝试)与呆板学习(一个名为「Dragonfly」的基于贝叶斯优化的尝试计划器)结合起来。在单盐和三元溶剂计划空间内对电解质电导率进行自主优化,在两

    2022年 10月 13日
  • 2021美国迷信天赋奖出炉:高中生瓜分180万奖金

    2021 年的美国迷信天赋奖被颁给了一群钻研无限婚配算法、机器学习、评测新药和饮用水过滤的高中生。

    2021年 3月 26日
  • 海内视频天生爆发前夕,我们组织了一场核心玩家都参与的分享调换会

    近几个月来,视频天生范畴连续公布了新技巧、新模型和新工具,AI 天生的视频效果也得到了肉眼可见的提升和颠覆。很多人认为,人工智能范畴接下来公认的主战场,毋庸置疑是视频天生技巧。图 1:2023 年 AI 视频工具概览  图片来源:https://twitter.com/venturetwins/status/1741147864498397328随着一夜爆火的 Pika 1.0 全面开放、Runway 公布的 Gen-2 开始商业化探索、Meta、Moonvalley 和 Stability AI 等公司

    2024年 1月 8日
  • 为国打造世界一流的芯片人材,清华大学成立集成电路学院

    刚刚,清华大学集成电路学院揭牌成立,拉开中国造就一流芯片人材的序幕。

    2021年 4月 22日
  • TOG 2020 | 基于骨骼一致性的单目视频人体静止重建

    本文是对 2020 年 9 月发表于计算机图形学顶级期刊 ACM Transactions on Graphics(ToG)的论文《基于骨骼一致性的单目视频人体静止重建(MotioNet: 3D Human Motion Reconstruction from Monocular Video with Skeleton Consistency)》的解读。
    该论文由北京大学与山东大学、北京电影学院、以色列特拉维夫与耶路撒冷大学合作,针对从单目视频中提取人体静止的问题,区别于直接回归枢纽坐标的法子,作者在神经搜集中利用正向静止学,猜测出时序一致的人体骨架及所对应的枢纽扭转,减小了搜集猜测的空间搜索范围,搜集输出的结果也能直接运用于角色动画的驱动。

    2022年 7月 18日
  • google研究科学家Kevin P. Murphy几率机械进修典范教材再版,PDF免费下载

    google研究科学家 Kevin P. Murphy 的几率机械进修册本即将发行第二版了。经历了近十年的发展之后,这本人工智能畛域典范册本的实质丰富了不少(从页数上也能看出来)。

    2021年 1月 3日
  • 用什么tricks能让模型训练得更快?先了解下这个问题的第一性原理

    深度学习是门玄学?也不完全是。

    2022年 3月 22日
  • 1600米深海沉船如何索求?斯坦福人形机器人实现远程人机交互下潜

    深海里面藏着许多秘密,沉船,坠机,数不尽的金银珠宝和历史记忆都埋藏在深海中。从前索求这些遗址的方法多为整体打捞,许多证据难以保存。近日,斯坦福大学的机器人团队研发出名为 OceanOneK 的水下人机交互机器人,通过远程操控,让人形机器人以最接近真人潜水的方式在水下 1600 米实现索求,最大程度地实现了人机交互,也最大程度地保护了遗址的完整性。

    2022年 7月 29日
  • 亚马逊资深首席科学家李沐:工作这五年

    自CMU机器学习博士毕业至今,亚马逊资深首席科学家李沐的业界之路已经走过了五年空儿。期间,李沐博士对技巧、产物、管理、升职加薪等工作中的方方面面都有了更深的感悟。「专一于最有代价的工作」是他对过往五年工作历程的最好总结。

    2021年 5月 25日
  • 为什么要纯C说话手搓GPT-2,Karpathy回应网友质疑

    Karpathy:for fun.几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实行 GPT-2 训练的项目「llm.c」。llm.c 旨在让大模型(LM)训练变得简单 —— 使用纯 C 说话 / CUDA,不需求 245MB 的 PyTorch 或 107MB 的 cPython。例如,训练 GPT-2(CPU、fp32)仅需求单个文献中的大约 1000 行干净代码(clean

    2024年 4月 11日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注