微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

近日,一个关于图注意力网络可视化的项目吸引了大批研究人员的兴趣,上线仅仅一天,收获 200+ 星。该项目是关于用 PyTorch 实现的图注意力网络(GAT),包括易于理解的可视化。

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

项目地址:https://github.com/gordicaleksa/pytorch-GAT在正式介绍项目之前,先提一下图神经网络(GNN)。GNN 是一类基于深度进修的处理图域信息的步骤。由于其较好的性能和可解释性,GNN 最近已成为一种广泛应用的图分析步骤。现已广泛应用于计算生物学、计算药理学、推荐系统等。GNN 把深度进修应用到图结构 (Graph) 中,其中的图卷积网络 GCN 可以在 Graph 上进行卷积操作,但是 GCN 存在一些缺陷。因此,Bengio 团队在三年前提出了图注意力网络(GAT,Graph Attention Network) ,旨在解决 GCN 存在的问题。GAT 是空间(卷积)GNN 的代表。由于 CNNs 在计算机视觉领域取得了巨大的成功,研究人员决定将其推广到图形上,因此 GAT 应运而生。现在,有人用 PyTorch 实现了 GAT 可视化。我们来看看该项目是如何实现的。

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

可视化Cora 可视化说到 GNN,就不得不介绍一下 Cora 数据集。Cora 数据集由许多机械进修论文组成,是近年来图深度进修很喜欢使用的数据集。Cora 中的节点代表研究论文,链接是这些论文之间的引用。项目作者增加了一个用于可视化 Cora 和进行基本网络分析的实用程序。Cora 如下图所示:

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

节点大小对应于其等第(即进出边的数量)。边的粗细大致对应于边的「popular」或「连接」程度。以下是显示 Cora 上等第(进出边的数量)分布的图:

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

进和出的等第图是一样的,因为处理的是无向图。在底部的图(等第分布)上,我们可以看到一个有趣的峰值发生在 [2,4] 范围内。这意味着多数节点有少量的边,但是有 1 个节点有 169 条边(绿色大节点)。注意力可视化有了一个训练好的 GAT 模型以后,我们就可以将某些节点所学的注意力可视化。节点利用注意力来决定如何聚合周围的节点,如下图所示:

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

这是 Cora 节点中边数最多的节点之一(引用)。颜色表示同一类的节点。熵直方图另一种理解 GAT 没有在 Cora 上进修注意力模式 (即它在进修常量注意力) 的步骤是,将节点邻域的注意力权重视为概率分布,计算熵,并在每个节点邻域积累信息。我们希望 GAT 的注意力分布有偏差。你可以看到橙色的直方图是理想均匀分布的样子,而浅蓝色的是进修后的分布,它们是完全一样的。

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

分析 Cora 嵌入空间 (t-SNE)GAT 的输出张量为 shape=(2708,7),其中 2708 是 Cora 中的节点数,7 是类数。用 t-SNE 把这些 7 维向量投影成 2D,得到:

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

使用步骤步骤 1:Jupyter Notebook只需从 Anaconda 控制台运转 Jupyter Notebook,它将在你的默认浏览器中打开 session。打开 The Annotated GAT.ipynb 即可开始。注意,如果你得到了 DLL load failed while importing win32api: The specified module could not be found,只需要 pip uninstall pywin32,或者 pip install pywin32、onda install pywin32。步骤 2:使用你选择的 IDE如果使用自己选择的 IDE,只需要将 Python 环境和设置部分连接起来。训练 GAT在 Cora 上训练 GAT 所需的一切都已经设置好了,运转时只需调用 python training_script.py此外,你还可以:

增加 –should_visualize – 以可视化你的图形数据

在数据的测试部分增加 –should_test – 以评估 GAT

增加 –enable_tensorboard – 开始保存襟怀标准(准确率、损失)

代码部分的注释很完善,因此你可以了解到训练本身是如何运转的。该脚本将:

将 checkpoint* .pth 模型转储到 models/checkpoints/

将 final* .pth 模型转储到 models/binaries/

将襟怀标准保存到中 runs/,只需 tensorboard –logdir=runs 在 Anaconda 中运转即可将其可视化

定期将一些训练元数据写入控制台

通过 tensorboard –logdir=runs 在控制台中调用,并将 http://localhost:6006/URL 粘贴到浏览器中,可以在训练过程中将襟怀标准可视化:

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

可视化工具如果要可视化 t-SNE 嵌入,请注意或嵌入该 visualize_gat_properties 函数的注释,并设置 visualization_type 为:

VisualizationType.ATTENTION – 如果希望可视化节点附近的注意力

VisualizationType.EMBEDDING – 如果希望可视化嵌入(通过 t-SNE)

VisualizationType.ENTROPY – 如果想可视化熵直方图

然后,你就得到了一张优秀的可视化效果图(VisualizationType.ATTENTION 可选):

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

硬件需求GAT 不需要那种很强的硬件资源,尤其是如果你只想运转 Cora 的话,有 2GB 以上的 GPU 就可以了。

在 RTX 2080 GPU 上训练 GAT 大约需要 10 秒;

保留 1.5 GB 的 VRAM 内存(PyTorch 的缓存开销,为实际张量分配的内存少得多);

模型本身只有 365 KB。

如果你想了解更多关于 GAT 的内容,请点击下方视频:

项目作者介绍

微软工程师用PyTorch实现图注意力网络,可视化效果惊艳

该项目作者 AleksaGordić 是一位微软的软件和机械进修工程师,研究兴趣包括计算机视觉、机械进修和数字图像处理领域。他在塞尔维亚的贝尔格莱德获得了电气工程硕士学位,业余时间是一个机械进修项目、 Android / 网页 app、树莓派项目的创造爱好者。在他的 GitHub 主页,你还能看到更多有关 Pytorch 实现的项目。

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/wei-ruan-gong-cheng-shi-yong-pytorch-shi-xian-tu-zhu-yi-li/

(0)
上一篇 2021年 2月 2日 下午2:28
下一篇 2021年 2月 3日 下午3:13

相关推荐

  • 机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

    ​作为国际最受关注的自然谈话处理顶级会议,每年的 ACL 都吸引了大量华人学者投稿、参会。今年的 ACL 大会已是第 60 届,于 5 月 22-5 月 27 日期间举办。

    2022年 5月 27日
  • 数据驱动核保风控,AI促进健壮管制,健壮险市场迎来万亿蓝海

    健壮险作为我国调理保障体系的补充,同时也是缓解调理保障支付压力的重要组成部分。自国务院在2014年发布《关于加快发展商业健壮险的若干意见》,一系列政策密集发布,促进保障行业监管降级,并推动健壮险企业发展立异。伴随近年来大数据手艺与人工智能手艺的逐步成熟,健壮险行业开始走向数字化转型,进而实现智能化降级。其中调理大数据公司与保障公司开始合作,通过构建智能风控模型辅助保障机构走向数字化风控;健壮管制企业则通过开发智能利用,通过AIoT手艺、智能硬件、云计算等利用模式培养用户健壮管制习惯, 从多个维度降低理赔危害。此外,

    2021年 6月 25日
  • 无代码生产力对象赋能数字化供应链新发展

    「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动将来的AI技术」与「重塑财产的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、财产专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI财产的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与财产科技融合趋势。

    2022年 8月 1日
  • 学费全免还有补贴:在邢波熏陶任校长的MBZUAI上课是什么体验?

    建校仅仅三年,MBZUAI 已经跻身全球人工智能研究前沿。

    2022年 9月 28日
  • 应用深度进修,通过一个片断润色进行份子优化

    编辑 | 萝卜皮份子优化是药物开发中的关键步骤,可通过化学润色改善候选药物的预期特征。来自俄亥俄州立大学(The Ohio State University)的研讨人员,在份子图上开发了一种新颖的深度天生模型 Modof,用于份子优化。Modof 通过猜测份子处的单个断开位点以及在该位点去除和/或添加片断来润色给定的份子。在 Modof-pipe 中实现了多个相同 Modof 模型的管道,以窜改多个断开位置的输入份子。研讨人员表明 Modof-pipe 能够保留主要的份子支架,允许控制中间优化步骤并更好地约束份子相

    2022年 1月 17日
  • 吴恩达那场十万人观察的讲座,如今有了专项课程

    如果你看过那个一小时的演讲,而且觉得意犹未尽,这门课程可能适合你。

    2021年 5月 14日
  • 为什么要纯C说话手搓GPT-2,Karpathy回应网友质疑

    Karpathy:for fun.几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实行 GPT-2 训练的项目「llm.c」。llm.c 旨在让大模型(LM)训练变得简单 —— 使用纯 C 说话 / CUDA,不需求 245MB 的 PyTorch 或 107MB 的 cPython。例如,训练 GPT-2(CPU、fp32)仅需求单个文献中的大约 1000 行干净代码(clean

    2024年 4月 11日
  • 斯坦福学者让太阳能电池在夜间发电,功率可达50毫瓦/平方米

    研究者表示,他们计划的光伏电池装配可以为 LED 灯或者手机充电。

    2022年 4月 17日
  • “中关村智用人工智能同伴设计”报名已开放,八大效劳助力AI落地

    中关村智用人工智能同伴设计”(简称设计)报名已于2021年3月1日正式开放(报名链接:http://aizgc.org.cn/#/zhiyong/friend),并得到了人工智能财产各界的关注。某AI企业结合创始人李先生谈起同伴设计来满脸兴奋,据他介绍:同伴设计给他的创业带来了新的曙光,此前他的公司虽然拥有先进的手艺,但在寻找落地场景的道路上却一直坎坷,人脸识别等常识性使用场景已经是一片红海,想寻找手艺落地的蓝海场景,却又因为团队成员大都是信息手艺出身,对其他行业了解不多,既不知道哪些行业可能是潜在用户,即使知道,

    2021年 3月 29日
  • 1.5K star量,上古老番变4K,B站开源超分辨率算法

    这是 B 站 AI 实验室的最新成果。

    2022年 2月 15日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注