崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

2021 年英特尔架构日上,英特尔发布一系列重大技术架构的改变和创新:两款崭新的 x86 内核架构(能效核与机能核)、代号为 Alder Lake 的首个机能混合架构、英特尔硬件线程调剂器、专为数据中心设计的下一代英特尔至强可扩大处理器 Sapphire Rapids 以及基础设施处理器(IPU)等内容。

8 月 20 日,2021 年英特尔架构日如约而至!会上,英特尔公司高级副总裁兼加速计较系统和图形事业部总经理 Raja Koduri 携手多位英特尔架构师,全面介绍了英特尔在 CPU、GPU 及 IPU 架构方面的重大进展。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

英特尔公布了一系列重大的改变与创新,总结如下:

首个机能混合架构 Alder Lake,以及其搭载的两款崭新的 x86 内核框架——能效核和机能核,以及英特尔硬件线程调剂器;

崭新的独立游戏图形处理器(GPU)架构 X^e HPG 微架构,这将是英特尔首款鉴于台积电 N6 工艺的 GPU;

专为数据中心打造的下一代英特尔至强可扩大处理器 Sapphire Rapids;

鉴于 X^e HPC 微架构的数据中心 GPU 架构 Ponte Vecchio;

崭新的基础设施处理器(IPU);

oneAPI 工具包:供应一个开放、规范、跨架构和跨厂商的统一软件栈,让开发者能够摆脱专有语言和编程模型的束缚。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

两款崭新 X86 内核能效核(Efficient Core)能效核曾用代号「Gracemont」,是一个高能效的 x86 微架构,旨在面向当今多任务场景,提高吞吐量效率并供应可扩大多线程机能。该架构致力于通过低电压能效核降低整体功率消耗,为更高频率运行供应功率热空间。同时能效核的机能也得到了提升,将能满足更多动态任务负载。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

能效核可以在不耗费处理器功率的情况下对工作负载进行优先级排序,并通过每周期指令数(IPC)改进一些功能以提高机能,包括:

拥有 5000 个条目的分支目标缓存区,实现更准确的分支预测;

64KB 指令缓存,在不耗费内存子系统功率的情况下保存可用指令;

英特尔的首款按需指令长度解码器,可生成预解码信息;

英特尔的簇乱序执行解码器,可在保持能效的同时,每周期解码多达 6 条指令;

后端宽度(Wide Back End)具备 5 组宽度分配(Five-wide allocation)和 8 组宽度引退、256 个乱序窗口入口和 17 个执行端口;

支撑英特尔控制流强制技术和英特尔虚拟化技术重定向保护等功能;

实现了 AVX 指令集以及支撑整数人工智能操作的新扩大。

相比于英特尔最多产的 CPU 内核 Skylake,在单线程机能下,能效核能够在相同的功耗下实现 40% 的机能提升,或在功耗不到 40% 的情况下供应同等机能。与运行四个线程的两个 Skylake 内核相比,四个能效核所供应的吞吐量机能,能够在功耗更低的情况下带来 80% 的机能提升,而在供应相同吞吐量机能的情况下,功耗将减少 80%。机能核(Performance Core)工作负载的代码体积正在不断增长,需要更强的执行能力。数据集也随着数据带宽的需求提升而大幅增加。英特尔崭新机能核微架构旨在提高速度,突破低时延和单线程应用程序机能的限制,曾用代号「Golden Cove」。该架构在带来显著增速的同时,能够更好地支撑代码体积较大的应用程序。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

机能核是英特尔有史以来构建的机能最高的 CPU 内核,并通过以下功能突破了低时延和单线程应用程序机能的极限:

相比于目前的第 11 代英特尔酷睿处理器架构(Cypress Cove),在通用机能的 ISO 频率下,针对大范围的工作负载实现了平均约 19% 的改进;

呈现出更高的并行性;

搭载英特尔高级矩形扩大(AMX),内置下一代 AI 加速提升技术,用于学习推理和训练。AMX 包括专用硬件和新指令集架构,以显著加速矩阵乘法运算;

减少时延,对大型数据和代码体积较大的应用程序供应更好的支撑。

英特尔硬件线程调剂器(Intel Thread Director)为了让机能核和能效核与操作系统无缝协作,英特尔开发了一种改进版的调剂技术,称为「英特尔硬件线程调剂器(Intel Thread Director)」。 

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

该调剂器直接内置于硬件中,可供应对内核状态和线程指令混合比的低级遥测,让操作系统能够在恰当的时间将合适的线程放置在合适的内核上。硬件线程调剂器具有动态性和自适应性——它会根据实时的计较需求调整调剂决策——而非一种简单的、鉴于规则的静态方法。目前,英特尔正在优化 Thread Director,以在微软即将推出的 Windows 11 操作系统上获得最佳机能。鉴于 Intel 7 制程的首个混合架构 Alder Lake英特尔公布了首款集成能效核和机能核、并搭载崭新英特尔硬件线程调剂器的混合架构「Alder Lake」,它鉴于 Intel 7 制程工艺打造而成,并采用了单一、高度可扩大的 SoC 架构,支撑最新内存和最快 I/O。该架构适用于从移动端到台式机的产品,并且鉴于 Alder Lake 的产品将在今年开始出货。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

Alder Lake 将供应惊人的机能,支撑从超便携式笔记本到发烧级再到商用台式机的所有客户端设备,它供应了以下三类产品设计形态:

高机能、双芯片、插座式的台式机处理器 ,具有领先机能和能效。支撑高规格的内存和 I/O;

高机能笔记本处理器,采用 BGA 封装,并加入图像单位,更大的 X^e 显卡和 Thunderbolt 4 连接;

轻薄、低功耗的笔记本处理器,采用高密度的封装,配置优化的 I/O 和电能传输。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

构建如此高度可扩大架构的挑战,需要在不影响功率的情况下满足计较和 I/O 代理对带宽超乎寻常的需求。为了解决这一挑战,英特尔设计了三种独立的内部总线,每一种都采用鉴于需求的实时启发式后处理方式

 计较内部总线可支撑高达 1000GBps——即每个内核或每集群 100GBps,通过最后一级缓存将内核和显卡连接到内存;

I/O 内部总线支撑可高达 64GBps,连接不同类型的 I/O 和内部设备,能在不干扰设备正常运行的情况下无缝改变速度,选择内部总线速度来匹配所需的数据传输量;

内存结构可供应高达 204GBps 的数据,并动态扩大其总线宽度和速度,以支撑高带宽、低时延或低功耗的多个操作点。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

英特尔还公布了台式机处理器的 I/O 信息,从下图可以看到,拥有最高 8 个机能核、8 个能效核、24 线程以及 30M 的 Non-inclusive LL 缓存

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

独立游戏显卡微架构 X^eHPG 及 Alchemist 系列 SoCX^e HPG 是一款崭新的独立显卡微架构,专为游戏和创作工作负载供应发烧级的高机能。X^e HPG 微架构为 Alchemist 系列 SoC 供应动力,首批相关产品将于 2022 年第一季度上市,并采用新的品牌名——英特尔锐炫 Arc。X^e HPG 微架构采用崭新的 X^e 内核,是一款聚焦计较、可编程且可扩大的元件。英特尔公布了鉴于 X^e HPG 架构的客户端显卡路线图——Alchemist(此前称之为 DG2)、Battlemage、Celestial 和 Druid SoC。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

其中,鉴于 X^e HPG 微架构的 Alchemist SoC 产品能够供应出色的可扩大性和计较效率,并拥有以下关键架构特征:

使用台积电的 N6 制程节点上进行制造;

多达 8 个具有固定功能的渲染切片,专为 DirectX 12 Ultimate 设计;

崭新 X^e 内核,拥有 16 个矢量引擎和 16 个矩阵引擎(被称为 XMX,即 X^e Matrix eXtension)、高速缓存和共享内部显存;

支撑 DirectX Raytracing(DXR)和 Vulkan Ray Tracing 的新光线追踪单位;

通过架构、逻辑设计、电路设计、制程工艺技术和软件优化,相比 X^e LP 微架构实现 1.5 倍的频率提升和 1.5 倍的每瓦机能提升。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

 英特尔分享了试产阶段 Alchemist SoC 的真实游戏展示(虚幻引擎 5 测试良好),以及崭新的鉴于神经网络的超取样技术 X^e SS 等。

X^ e SS是一种利用Alchemist的内置XMX AI加速、实现高机能和高保真视觉的崭新升频技术。该技术使用深度学习来合成非常接近原生高分辨率渲染质量的图像。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

目前,多家早期的游戏开发商已开始使用X^SS, 本月将向独立软件供应商(ISV)供应XMX初始版本的SDK,DP4a版本将于今年晚些时候推出。

专为数据中心打造的下一代英特尔至强可扩大处理器 Sapphire RapidsSapphire Rapids 处理器鉴于 Intel 7 制程工艺技术,采用崭新的机能核微架构,旨在提高速度 / 突破低时延和单线程应用机能的极限。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

Sapphire Rapids 的核心是一个分区块、模块化的 SoC 架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,在保持单晶片 CPU 接口优势的同时,具有显著的可扩大性。Sapphire Rapids 供应了一个单一、平衡的统一内存访问架构,每个线程均可完全访问缓存、内存和 I/O 等所有单位上的全部资源,由此实现整个 SoC 具有一致的低时延和高横向带宽。该处理器的主要构建块如下图所示:

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

此外,Sapphire Rapids 供应业界广泛的数据中心相关加速器,包括新的指令集架构和集成 IP,以在各种客户工作负载和使用中提升机能。通过无缝集成的加速器引擎赋能常见模式任务的卸载,提升内核效率。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

新的内置加速器包括:

英特尔加速器接口架构指令集(AIA)——支撑对加速器和设备的有效调剂、同步和信号传递;

英特尔高级矩阵扩大(AMX)——Sapphire Rapids 中引入的新加速引擎,可为深度学习算法核心的 Tensor 处理供应大幅加速。其可以在每个周期内进行 2000 次 INT8 运算和 1000 次 BFP16 运算,实现计较能力的大幅提升;

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

 英特尔数据流加速器(DSA)——旨在卸载导致数据中心规模部署开销的最常见数据移动任务。DSA 改进了对这些开销任务的处理,供应了更高的整体工作负载机能,并可以在 CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。总之,这些架构上的改进使得 Sapphire Rapids 能够为云、数据中心、网络和智能边缘中广泛的工作负载和部署模式供应开箱即用的机能。英特尔迄今最复杂、千亿晶体管的 SoC英特尔发布了迄今为止最复杂的 SoC Ponte Vecchio,它拥有 1000 多亿个晶体管,供应业界领先的每秒浮点运算次数和计较密度,以加速 AI、HPC 和高级分析工作负载。据悉,Ponte Vecchio 已走下生产线进行上电验证,并已开始向客户供应限量样品。Ponte Vecchio 预计将于 2022 年面向 HPC 和 AI 市场发布。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

英特尔称,早期的 Ponte Vecchio 芯片展示了领先的机能,在流行的 AI 基准测试中创造了推理和训练吞吐量的行业记录。其中,英特尔 A0 芯片机能供应高于 45 TFLOPS 的 FP32 吞吐量、高于 5 TBps 的内存结构带宽,以及高于 2 TBps 的连接带宽。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

Ponte Vecchio 鉴于 X^e-HPC 微架构,由多个复杂的设计组成,这些设计以单位形式呈现,然后通过嵌入式多芯片互连桥接(EMIB)单位进行组装,实现单位之间的低功耗、高速连接。这些设计均被集成于 Foveros 封装中,为提高功率和互连密度形成有源芯片的 3D 堆叠。高速 MDFI 互连允许 1 到 2 个堆栈的扩大。Ponte Vecchio 的核心是计较单位(Compute Tile)——一个密集的多 X^e 内核。计较单位鉴于台积电先进的 N5 制程工艺,包含 8 个 X^e 内核和 4MB 一级缓存。此外,计较单位具有极其紧凑的 36 微米凸点间距,可与 Foveros 进行 3D 堆叠。英特尔也已经通过设计基础设施设置和工具流程以及方法,为测试和验证该节点的单位铺平了道路。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

基础单位是 Ponte Vecchio 的连接组织。它是鉴于 Intel 7 制程工艺的大型芯片,针对 Foveros 技术进行了优化。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

最后是 X^e 链路单位(X^e Link Tile),它供应了 GPU 之间的连接,支撑每单位 8 个链路。该单位对 HPC 和 AI 计较的扩大至关重要,旨在旨在实现支撑高达 90G 的更高速 SerDes,并且已被添加到「极光」(Aurora)百亿亿次级超级计较机的扩大解决方案中。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

崭新基础设施处理器(IPU)IPU 设计旨在使云和通信服务供应商减少在中央处理器(CPU)方面的开销,并充分释放机能价值。Mount Evans 是英特尔的第一个 ASIC IPU,旨在解决多样化和分散的数据中心的复杂性。Oak Springs Canyon 是一个 IPU 参考平台,采用 Intel Xeon D 处理器和 Intel Agilex  FPGA。Intel N6000 加速开发平台专为鉴于 Xeon 的服务器设计。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

Mount Evans。

崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

Oak Springs Canyon。参考链接:https://mp.weixin.qq.com/s/2i2SDY9jD-TVFtemX9GlzQhttps://www.intel.com/content/www/us/en/newsroom/resources/press-kit-architecture-day-2021.html

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/zhan-xin-x86-nei-he-jia-gou-xess-shen-jing-wang-luo-chao/

(0)
上一篇 2021年 8月 19日 下午2:18
下一篇 2021年 8月 22日 下午12:09

相关推荐

  • 海内视频天生爆发前夕,我们组织了一场核心玩家都参与的分享调换会

    近几个月来,视频天生范畴连续公布了新技巧、新模型和新工具,AI 天生的视频效果也得到了肉眼可见的提升和颠覆。很多人认为,人工智能范畴接下来公认的主战场,毋庸置疑是视频天生技巧。图 1:2023 年 AI 视频工具概览  图片来源:https://twitter.com/venturetwins/status/1741147864498397328随着一夜爆火的 Pika 1.0 全面开放、Runway 公布的 Gen-2 开始商业化探索、Meta、Moonvalley 和 Stability AI 等公司

    2024年 1月 8日
  • 百分点科技杜晓梦:数据迷信的下一片“战场”

    编者按:如今在科技领域,越来越多的女性从业者成为行业中坚力量,“她智慧”不同视⻆的思维方式,以及她们对事物的敏感度和包容性,使得这些女性领导者在企业治理过程中具有敏锐的洞察力、缜密的思辨力和透彻而深入的阐发能力。2021年,数字商业期间联合中国网开展了2021年度专题策划:科技创新中的“她观点”,以女性的视角专业解读科技创新源动力,百分点科技首席数据迷信家杜晓梦受邀接受采访,以独特的视角解读了何为数据迷信,它的下一片“战场”在哪里?每秒超过1.

    2021年 5月 14日
  • 这场较量,让上百个AI智能体「卷起来了」

    过去数年,随着神经网络、基于加强进修的自我博弈、多智能体进修和模仿进修等通用机器进修理论的突破,AI 智能体的计划才智实现了飞跃式发展。可以看到,不管是谷歌、微软、IBM 等全球科技巨头,还是国内一众 AI 龙头企业,在学术研究和产业落地上,它们的关注焦点都在从智能感知向智能计划过渡。「计划 AI」成了领域内的必争之地。今年 5 月,谷歌旗下的机构 DeepMind 发布 Gato,这款全新的 AI 智能体能够在「广泛的情况中」完成 604 项不同的任务。Gato 的诞生,再次刷新了单智能体的才智上限。当然,关于

    2022年 8月 19日
  • 现在入行CV还有前途吗?来听AI年青学者怎么说

    为了推动 AI 技能的运用创新,促进人工智能范畴的学术交流、人才培养,打造人工智能的人才交流平台与产业生态圈,中国人工智能学会联合杭州市余杭区人民政府联合发起了首届全球人工智能技能创新大赛,并得到了阿里云、OPPO 等头部科技企业的积极参与和支持。阿里云天池平台为本次大赛提供平台和算力支撑。AI年青说是大赛主办方为提升年青开发者对 AI 的认识而主办的系列运动,该运动邀请知名年青学者,探讨理论研讨与运用实践中的热点话题。4月29日,AI年青说将迎来第三期直播运动,中心为「将来五年的计算机视觉」。2012 年,Ale

    2021年 4月 28日
  • 影响众多编程语言、引发供应链袭击,剑桥大学发布「木马源」缝隙

    最近,剑桥大学的研讨者公布了一种名为 Trojan-Source 缝隙,可能危及软件和第一手供应链。

    2021年 11月 23日
  • 知乎李大海对话阿里云贾扬清:透视AI使用难题与将来趋势

    “AI行业接下来可能有哪些落后?” “一线从业者如何看待其中的机会?”知乎合伙人、CTO李大海与阿里巴巴副总裁、阿里云智能高级研究员贾扬清亮相知乎直播,与网友分享了他们对AI时代下行业趋势、手艺使用、个人成长等多个层面的洞察和思考。

    2021年 8月 11日
  • 通过赞美随机化发现多智能体游玩中多样性政策行为,清华、UC伯克利等研究者提出全新算法RPG

    在这篇论文中,研究者提出了一个在 reward-space 进行摸索的新算法 RPG(Reward-Randomized Policy Gradient),并且在存在多个纳什均衡 (Nash Equilibrium, NE) 的挑战性的多智能恣意中进行了实验验证,实验结果表明,RPG 的表现显著优于经典的 policy/action-space 摸索的算法,并且发现了很多有趣的、人类可以理解的智能体行为政策。除此之外,论文进一步提出了 RPG 算法的扩展:利用 RR 失掉的多样性政策池训练一个新的具备自适应能力的策

    2021年 3月 11日
  • 可对药物份子举行表征的若干深度进修

    编辑 | 萝卜皮若干深度进修(GDL)基于包罗和处理对称信息的神经网络架构。GDL 为依赖于具有不同对称性和抽象级别的份子体现的份子建模利用程序带来了希望。苏黎世联邦理工学院的研讨人员对份子 GDL 举行了结构化和统一概述,重点介绍了其在药物发现、化学合成猜测和量子化学中的利用。它包罗对 GDL 原理的介绍,以及相关的份子体现,例如份子图、网格、曲面和字符串,以及它们各自的属性。讨论了份子科学中 GDL 当前面临的挑战,并尝试猜测未来的机会。该综述以「Geometric deep learning on molec

    2021年 12月 27日
  • CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

    本文是对发表于计算机视觉和模式识别领域的顶级会议 CVPR 2021的论文“Causal Hidden Markov Model for Time Series Disease Forecasting(工夫序列疾病展望的因果隐马尔可夫模型)”的解读。
    该论文由北京大学王亦洲课题组与深睿医疗等单位合作,针对工夫序列疾病展望的问题,提出了因果隐马尔可夫模型描述疾病的动态发展过程,并使用基于 VAE 的变分框架举行学习。通过对图象隐空间举行解耦,去除疾病有关因子与疾病展望的伪相关关系,从而提高展望的准确率和鲁棒性。

    2022年 7月 18日
  • DataWorks赋能企业一站式数据开发处置本领

    简介: 企业大数据技术发展至今,历经了两次演变。第一次演变从最初的“小作坊”解决大数据问题,到后来企业用各种大数据技术搭建起属于自己的“大平台”,通过平台化的本领实现数据生产力的升级。 第二次演变让大数据从“大平台”向“矫捷制造”的开发范式演进。在2021阿里云峰会上,阿里巴巴集团副总裁、阿里云智能算计平台事业部高级研究员贾扬清发布基于DataWorks的一站式大数据开发处置的平台,就是这个演变最好的佐证。

    2021年 9月 29日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注