图深度进修是目前AI领域最热门的目标之一,目前PyG和DGL等主流图深度进修框架大多是完成图深度进修的基本操作与模型,很难应对繁杂图深度进修研讨恣意。近日,来自德州农工大学的姬水旺教授团队开发了首个面向繁杂研讨恣意的可扩大型图深度进修工具包,包含图天生,图自监视进修,图神经网络可解释性以及3D图深度进修恣意,旨在帮助研讨者在繁杂图深度进修恣意的算法开发上能够轻松使用常用数据集和评价目标与通用基准进行比较。
图深度进修已经展示了其在进修丰富的图结构数据上的有效性。并且在许多问题上取得了重大进展, 例如药物发现、社交网络、物理仿真等。许多图深度进修框架(如 PyG,DGL 等)主要关注完成基本的图深度进修模块和基础恣意,比如节点分类与图分类等。但对于繁杂的恣意,比如图天生和图神经网络的可解释性,研讨职员仍然需要花费巨大精力完成算法并与基准模型进行比较。为了解决这一问题,德州农工大学姬水旺教授领导的 DIVE(Data Integration, Visualization and Exploration)实验室开源了首个面向繁杂研讨恣意的图深度进修工具包 DIG(Dive into Graphs)。该工具包由实验室 16 人团队(14 个博士生,1 个本科生,1 个指导老师)历时 1 年努力完成。与 PyG 和 DGL 等图神经网络框架不同的是,DIG 聚焦于为目前热门的繁杂图深度进修研讨恣意供应更易用、更快速并且可扩大的算法开发与对比研讨平台。目前,DIG 工具包支持 4 个研讨目标:图天生、图自监视进修、图神经网络可解释性以及 3D 图深度进修。对于每个领域,DIG 都供应了通用、可扩大的数据接口、常用算法与评价标准完成。总之,DIG 极大地方便了研讨职员的算法开发以及与基准模型进行实验比较。
论文地址:https://arxiv.org/abs/2103.12608
项目地址:https://github.com/divelab/DIG
目前,DIG 涵盖 4 个研讨目标的 18 个算法、33 个数据集、7 类评价目标。基于通用与可扩大的完成,未来可以将更多的目标和算法集成到 DIG 中。工具包整体结构如下图所示:
DIG 涵盖的四大目标。图天生: 图天生算法研讨的是如何基于给定的一组图数据天生新的图。图天生恣意对于药物和材料开发有潜在的重要作用。因此,DIG 主要考虑可以天生份子图的深度进修算法。同时,DIG 中也完成了用以评价随机天生、份子性质优化和有约束的份子性质优化的相关目标。图自监视进修:自监视进修的研讨最近已扩大到图数据,利用特定的自监视恣意可以帮助模型获得更有效的图特征表示。目前 DIG 中主要完成了常见的基于对比进修的图自监视算法,供应了针对节点分类和图分类的数据接口和评价目标。图神经网络可解释性:由于图神经网络已经被越来越多地部署在真实世界的应用中,为了更好地理解模型,对图神经网络的可解释性研讨变得至关重要。DIG 中完成了常见的图神经网络解释算法。除了常用基准数据集和评价目标外,DIG 的开发职员还针对可解释性恣意从文本数据中构建了易于人类理解的图数据集,极大地方便了后续图神经网络可解释性的研讨。3D 图深度进修:3D 图网络是指节点具有三维位置信息的图网络结构。例如份子中每个原子都有其相对的 3D 位置。考虑到图结构中 3D 位置信息对于提升图网络表达能力具有重要作用。DIG 中将三种最新 3D 图深度进修算法整合为一个 3DGN 框架,供应了统一的完成。也完成了常见的 3D 份子数据集的统一接口和评价目标。关键设计准则通用完成:DIG 对于每个研讨目标的数据接口和评价方法都有通用的完成。这使得 DIG 能够充当标准化的测试平台。另外,对于可以从一个角度统一的算法,DIG 也会供应通用的算法完成。比如针对 3D 图深度进修的 3DGN 框架和针对图自监视进修的对比模型框架。可扩大性和可定制化:借助于通用的完成,研讨职员可以方便地集成新的数据集、算法与评价标准。而且用户可以灵活地选取数据接口和评价方法来定制化实验。因此 DIG 可以用作研讨职员完成新的算法和与基准算法进行实验比较的平台。
原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/35472