单芯片处理器走到尽头?苹果&英伟达倾心多芯片封装,互连技能最关键

当单芯片处理器已达到极限,苹果和英伟达相继公布的芯片证明多芯片封装或许才是未来发展方向,但互连技能仍是一大难题和巨擘角逐的主战场。

3 月 10 日,苹果在 2022 年春季公布会上 M1 Max 芯片的升级版 ——M1 Ultra,创新性地采用了封装架构 UltraFusion,将两个 M1 Max 芯片的管芯相连,创造出了具有前所未有功能和功能的片上系统(SoC)。

3 月 23 日,英伟达在 GTC 2022 大会上公布了类似的新闻。黄仁勋宣布推出首款面向 AI 基础设施和高功能计算的数据中心专属 CPU,其中新的 Grace Hopper 可以在同一块主板上两块并联,形成了一个 144 核的 Grace CPU 超级芯片,内存带宽为 1TB/s。

两家公司的芯片具有不同的目标市场。苹果瞄准消费者和专业工作站市场,而英伟达力图在高功能计算市场掀起风云。然而,目标的不同只会凸显快速结束单芯片安排时代面临的广泛挑战。

图片

图源:top10.digital

芯片巨擘纷纷入场

多芯片安排不是什么新概念,但直到最近五年才越来越受青睐。AMD、苹果、英特尔和英伟达等芯片巨擘都不同程度地涉足其中。

AMD 通过自身的 EPYC 和 RYZEN 处理器在小芯片(chiplet)安排领域展开探索。英特尔在 2021 年架构日活动上公布了下一代英特尔至强可扩展处理器 Sapphire Rapids,这款面向服务器市场的架构使用小芯片「tiles」构建而成。

现在,苹果和英伟达也加入了多芯片安排的行列,尽管面向的目标市场截然不同。应该看到,向多芯片安排的转变是由现代芯片创造中的挑战所驱动的。晶体管小型化的速度已经变慢,但前沿安排中晶体管数量的增长仍未见放缓的迹象。

以苹果 M1 Ultra 芯片为例,它的晶体管数量为 1140 亿,是个人计算机芯片中有史以来最多的,为 M1 的 7 倍。单个 M1 Max 的芯片面积为 432 平方毫米,由此推知,M1 Ultra 的面积约为 860 平方毫米(官方数字未知)。

图片

M1 Ultra 示意图。

英伟达 Grace CPU 的晶体管数量处于保密状态,但与它一起公布的 Hopper H100 GPU 拥有 800 亿个晶体管,20 块即可承载全球流量。2019 年,AMD 公布的 64 核 EYPC Rome 处理器拥有 395 亿个晶体管。

图片

英伟达 Grace CPU 超级芯片。

市场研究公司 Counterpoint Research 的研究分析师 Akshara Bassi 表示,「随着芯片面积变得越来越大以及晶圆成品率问题越来越重要,多芯片模块封装安排能够实现比单芯片安排更佳的功耗和功能表现。」

目前,除了致力于造出单个完整硅晶圆的 AI 芯片创业公司 Cerebras 之外,芯片行业似乎达成了一致意见,即单芯片安排变得越来越「得不偿失」。

图片

2021 年 4 月,Cerebras 公布了 2.6 万亿晶体管、比 ipad 还大的巨无霸芯片 WSE 2。

此外,行业转向小芯片与芯片创造商的支持是同步进行的。2020 年 8 月,全球最大芯片代工厂台积电推出了 3DFabric 先进封装技能系列,包含了前端 3D 硅堆栈和后端封装技能。

AMD 在其 EPYC 和 RYZEN 处理器安排中使用了属于 3DFabric 的技能,并且几乎可以肯定苹果 M1 Ultra 芯片也使用了台积电相关封装技能(虽然苹果尚未给予确认,但 M1 Ultra 是由台积电创造的)。

其他芯片巨擘如英特尔,它有自己的封装技能,如 EMIB 和 Foveros。尽管最开始意在自己使用,但随着英特尔代工服务的开展,该公司的芯片创造技能正变得与更广泛的行业息息相关。

多芯片安排的前景如何?

另一家市场研究公司 Hyperion Research 的一位高级分析师 Mark Nossokoff 认为,「围绕基础半导体安排、创造和封装的生态已经发展到了能够支持『安排节点经济可靠生成小芯片解决方案』的程度。无缝集成多样化小芯片功能的软件安排工具也已经成熟到可以优化目标解决方案的功能了。」

小芯片将继续存在,但就目前而言,该领域是一个孤岛。AMD、苹果、英特尔和英伟达正在将自研的互连安排方案应用于特定的封装技能中。

今年 3 月 2 日,英特尔、AMD、Arm、高通、台积电、三星、日月光、谷歌云、Meta、微软等十大巨擘宣布成立 Chiplet 尺度联盟,推出了通用小芯片互连尺度(Universal Chiplet Interconnection Express, UCIe),希望将行业聚合起来。该尺度提供了一个面针对成本效益功能的「尺度」2D 包和面向前沿安排的「高级」包。 

UCIe 还支持通过 PCIe 和 CXL 进行封装之外(off-package)的连接,从而为高功能计算环境中跨多台机器连接多个芯片提供了可能。

图片

UCIe 白皮书中 UCIe 封装方案示例。

UCIe 尺度是一个开始,它的未来仍有待观察。Nossokoff 对此表示,最初发起 UCIe 的创始成员代表了众多技能安排和创造领域的杰出贡献者,但很多主要组织并没有加入进来,包括苹果、AWS、博通、IBM、英伟达以及其他硅代工厂和内存芯片供应商。

Bassi 指出,英伟达可能特别不愿意加入 UCIe 联盟。英伟达已经为定制硅集成开放了自研的 NVLink-C2C 互连技能,使其成为了 UCIe 的潜在竞争对手。

虽然 UCIe 和 NVLink-C2C 等芯片互连技能的命运决定了行业游戏规则,但它们不太可能改变行业现有局面。

原文链接:https://spectrum.ieee.org/single-chip-processors-have-reached-their-limits

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/dan-xin-pian-chu-li-qi-zou-dao-jin-tou-ping-guo-ying-wei-da/

(0)
上一篇 2022年 4月 10日 下午12:37
下一篇 2022年 4月 10日 下午12:45

相关推荐

  • 中原基金与澜舟科技成立金融NLP联合实验室,共促金融科技立异

    近日,境内头部基金公司中原基金与NLP/AI范畴领先者北京澜舟科技签署战略协作协议,成立金融NLP(自然语言处置惩罚)联合实验室,协作探索自然语言处置惩罚技巧在金融范畴的使用;协作建立鉴于中原基金投资研究逻辑的舆情NLP本领;协作打造鉴于深度学习和预训练模型的金融行业搜索引擎,同时计划在其他数字化建立、立异技巧协作、交易使用等方面展开协作。中原基金首席数据官陈一昕,澜舟科技创始人兼首席执行官周明博士分别代表双方在北京签约。中原基金首席数据官陈一昕表示,科技立异是发展数字经济的核心源动力。金融行业如何促进科技与金融交易场景的

    2022年 6月 6日
  • 详解AI加速器(三):架构基础离不开ISA、可重构处置惩罚器……

    在上一篇文章中,前苹果工程师、普林斯顿大学博士 Adi Fuchs 解释了为什么现在是 AI 加速器的黄金时代。在这篇文章中,我们将聚焦 AI 加速器的秘密基石——指令集架构 ISA、可重构处置惩罚器等。

    2022年 2月 13日
  • 还未入职,这位将来的博导为学生规划了一条高效进修之路

    学无止境,但合理规划进修和钻研将助力你提高博士生涯的进修成效。

    2022年 10月 21日
  • M1芯片搞数据科学好使吗?5种基准尝试给你答案

    最近 M1 芯片爆火,它是否适用于数据科学?在常用基准上尝试一下就知道了。

    2021年 2月 10日
  • 94岁诺奖得主希格斯去世,曾预言「上帝粒子」的消失

    一名用诗意的语言揭示宇宙秘密的人。一名 94 岁巨大科学家的逝世,引发了人们广泛的哀思。4 月 10 日消息,诺贝尔物理学奖得主、著名物理学家彼得・希格斯(Peter Higgs)于周一去世,享年 94 岁。希格斯因提出希格斯玻色子也被称为「上帝粒子」而闻名。根据爱丁堡大学的一份声明我们得知(彼得・希格斯是该校的光荣退休传授),希格斯经历短暂的生病后,于 4 月 8 日星期一在家中安静的离开。对于老爷子的去世,爱丁堡大黉舍长 Peter Mathieson 沉重的表示:「彼得・希格斯是一名杰出的科学家 &mdash

    2024年 4月 10日
  • 「小破站」真顶流,CMU说话手艺研究所登陆B站:这是学术圈的新时尚?

    小破站真是出息了。当年发迹于二次元的「小破站」,俨然时代顶流了。继加拿大滑铁卢大学老师在 B 站开设《差分隐私》课程之后,现在又有国外机构来小破站开课了!😏1 月 20 日,一个名为「LTIatCMU」(卡耐基梅隆大学说话手艺研究所)的账号,悄悄在 B 站上传了 9 个视频。CMU 副老师 Graham Neubig 发推表示,这些讲座集结了说话手艺研究所(LTI)成员与客座讲师,在 YouTube 和 B 站均有资源。「我们的中国朋友也可以观看 bilibili:https://space.bilibili.c

    2021年 2月 4日
  • 279位佳宾、19个论坛议程全公开,第五届未来调理100强大会亮点抢先看!

    从个人健全到群体卫生,从调理服务机构及其家当链到全球调理健全家当生态,调理健全领域正在经历一场前所未有的数字化浪潮,随着生物技术、信息技术、新材料与智能制造三大技术的不断突破翻新与融合,个体的生命健全如何重新理解?纷繁复杂生物世界如何被捕捉、解读、计算?2021年4月16日-18日,第五届未来调理100强大会将以“生命的计算”为主题,在姑苏吴江与大家会面。大会时间:2021年4月16-18日(周五-周日)大会地点:姑苏·吴江·艾美酒店主办单位:动脉网、VB100、

    2021年 4月 6日
  • 京东云发布618十大手艺,意在带动行业的新一轮变革

    6月15日,以“解码京东618:京东云发布十大手艺使用趋向”为主题的媒体沙龙在京东举办,这也是京东团体统合云、零卖、物流多方618手艺团队首次全面解密亿级消费洪峰、全供应链最复杂场景背面的手艺图景。活动现场,京东零卖逐层揭开了库存周转31.2天,这一世界级数字背面的奥秘,并由京东物流“接力”分享了如何通过一体化供应链完成全国超200座城市分钟级投递的过程,展示了商品从零卖到物流,最后送至消费者手中的全链路过程。与此同时,作为京东618的手艺基石,京东云全面展现了在面对

    2021年 6月 16日
  • 「导师要我的论文和别人协同一作」,Nature揭露论文签名乱象:没奉献为啥要签名?

    在科研界,论文签名以及按次一直是钻研职员非常重视的题目。由于各种原因,签名排序过程中难免会出现分歧与争议。近日,《Nature》 对论文签名题目从事了查询拜访,指出了一些不好的现象,并希望能够创建一个公正的论文个人奉献评价系统。

    2021年 6月 15日
  • Creator 面对面 | 昇腾异构盘算架构 CANN 的技巧进展和未来展望

    在 2021 年的最后一个季度, CANN 5.0 版本正式发布。昇腾 CANN 作为平台级的异构盘算架构,已经经过了 3 年多的优化,迭代了 4 个大版本,CANN 5.0 在性能方面,AI 模型训练/推理性能大幅提升,用时更短;在功能方面:推理引擎 ATC Suite1.0 首次发布,AI 模型推理性能更高、功能更全面;在便捷性方面:代码开发和调试进一步简化,包括支持混合编程等,使用门槛更低。在性能上,无论是训练规模大小、场景类型,还是推理效率,均有较大提升。实验数据显示,原本需要 6.25 分训练的 BERT 模型,在 CANN 5.0 的加持下缩短了一倍多,只需2.69分钟就能完成训练;至于在 3.0 版本上需要 28 秒训练的 ResNet ,5.0 版本则是“再进化”到 16 秒。

    2022年 7月 15日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注