几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

「同样是移植一个新的技术库,如果利用人力,我们须要一个 10 人左右的团队工作大半年,但借助 AI,我们只须要花几天光阴运转几个 GPU 就能完成大部分工作。」

近几年,芯片安排成为 AI 落地的一个重要领域,谷歌、英伟达、三星、西门子等多家公司都已经计划或开始尝试在芯片安排中利用 AI。其中,同时在芯片安排和 AI 领域深耕多年的英伟达有着得天独厚的优势。在前段光阴的 GTC 大会上,英伟达首席科学家、计算机架构大师 Bill Dally 介绍了他们在这方面取得的进展以及所利用的 AI 东西。

以下是 Bill Dally 在 GTC 大会上的介绍原文。

预计电压降

作为 AI 专家,我们自然希望利用 AI 来安排更好的芯片。我们有几种不同的方法:一是利用现有的计算机辅助安排东西(并融入 AI),例如我们有一个可以绘制 GPU 中用电位置的地图,它还可以预计电压网下降多少——电流乘以电阻压降,被称为 IR 压降。在传统的 CAD 东西上运转该流程须要三个小时。

这是一个迭代的过程,所以从事起来有点麻烦。我们想训练一个 AI 模型来处理相同的数据。我们做了一系列的安排来从事这样的操作,然后就可以输入电源图了,最后推断光阴只需三秒。当然,如果算上特征提取的光阴,我们要花 18 分钟,很快就能得到结果。

我们没有利用卷积神经网络,而是用到了图神经网络,这是为了估计电路中不同节点的开关频率。同样,我们能够比传统东西更快地获得特别很是准确的功率估计,并且只需很少的光阴。

几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

预计寄生参数(parasitics)

我特别喜欢的一项工作是用图神经网络预计寄生参数。之前这项工作要花费大量光阴,因为以前的电路安排是一个迭代的过程,你要画一个原理图,就像左边这张图。但你不知道它的性能如何,直到安排师采用该原理图从事 layout,提取寄生参数,再运转电路仿真,才会发现安排可能不符合规格,才能知道电路的性能。

几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

接下来,安排师就要修改原理图,并再次通过 layout 来验证电路的有效性。这是一个特别很是漫长、反复甚至不人道的劳动密集型工作。

现在,我们可以训练图神经网络来预计寄生参数,而无需从事 layout。因此,电路安排人员可以特别很是快速地从事迭代,而无需手动执行 layout 步骤。事实表明:我们的神经网络对寄生参数的预计特别很是准确。

规划、布线挑战

我们的神经网络还可以预计布线堵塞(routing congestion),这对于芯片 layout 至关重要。在传统的流程中,我们须要制作一个网表(net list),运转规划和布线过程,这可能特别很是耗时,通常须要几天的光阴。但如果不这么做,我们就无法得到实际的布线堵塞并发现最初规划的缺陷。我们须要对其从事重构并以不同的方式规划 macro 以避免出现下图所示的红色区域(穿过该区域的电线过多,类似于交通堵塞)。

几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

现在借助神经网络,无需运转规划和布线,我们就可以获取这些网表并利用图神经网络大致预计堵塞的位置,准确率也特别很是高。这种方法暂时还不完美,但它能够显示出存在问题的区域,然后我们就能采取行动并特别很是快速地从事迭代,而无需从事完整的规划和布线。

自动化标准单位迁移

以上方法都是在用 AI 评价人类已经完成的安排,但实际上更令人兴奋的是用 AI 来实际安排芯片。

我来举两个例子。第一个是我们称之为 NV cell 的系统,它利用模拟退火和加强学习来安排我们的标准单位库(标准单位库是底层电子逻辑功能的集合,例如 AND、OR、INVERT、触发器、锁存器和缓冲器 )。所以在每次技术迭代的时候,比如从 7 纳米迁移到 5 纳米,我们都会拥有一个单位库。我们实际上有成千上万个这样的库,它们必须用新技术重新安排,有一套特别很是复杂的安排端正。

我们借助加强学习来放置晶体管,但随之而来的可能是一堆安排端正搭档,而这正是加强学习所擅长的。安排芯片就像一个雅达利游戏,但它是一个在标准单位中修复安排端正搭档的游戏。通过加强学习检查和修复这些安排端正搭档,我们基本上能够完成标准单位的安排。

下图显示的是该东西完成度为 92% 的单位库,没有安排端正或电气端正搭档。这些单位中的 12% 比人类安排的单位要小。总的来说,在单位复杂性方面,该东西做得和人类安排的单位一样好,甚至比人类的还好。

这对我们有两大好处。一是节约大量劳动力。同样是移植一个新的技术库,如果利用人力,我们须要一个 10 人左右的团队工作大半年,但借助 AI,我们只须要花几天光阴运转几个 GPU 就能完成大部分可以自动化的工作(92%),然后再由人来完成剩下的 8%。很多时候我们都能拿到更好的安排,所以这个方式不光节省人力,效果也比人类手工的结果好。

几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效安排芯片

原文链接:https://www.hpcwire.com/2022/04/18/nvidia-rd-chief-on-how-ai-is-improving-chip-design/

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/30661

(0)
上一篇 2022年4月19日 下午2:12
下一篇 2022年4月21日 下午5:07

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注