图神经网络精确预计有机化合物性质,加速静态电池的设计

编辑/绿萝大规模从头较量争论与布局预计的进步相结合,在有机功能资料的发觉中发挥了重要作用。目前,在有机资料的广阔化学空间中,只发觉了一小部分。实验和较量争论研讨职员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研讨职员展示了一种可以精确预计有机化合物性质的机械进修方法。展示了基态(GS)和更高能量布局的平衡训练数据集,对使用通用图神经网络(GNN)架构精确预计总能量的重要性。该研讨可加速静态电池的设计。该研讨以「Predicting energy and stabi

编辑/绿萝

大规模从头较量争论与布局预计的进步相结合,在有机功能资料的发觉中发挥了重要作用。目前,在有机资料的广阔化学空间中,只发觉了一小部分。实验和较量争论研讨职员都需要加速探索未知的化学空间。

来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研讨职员展示了一种可以精确预计有机化合物性质的机械进修方法。展示了基态(GS)和更高能量布局的平衡训练数据集,对使用通用图神经网络(GNN)架构精确预计总能量的重要性。该研讨可加速静态电池的设计。

该研讨以「Predicting energy and stability of known and hypothetical crystals using graph neural network」为题,发表在《Patterns》杂志上。

图神经网络精确预计有机化合物性质,加速静态电池的设计

晶体内部布局中的原子有规则地在三维空间呈周期性重复排列。测量这些晶体布局宁静性的一种方法是较量争论它们的总能量——较低的总能量转化为较高的宁静性。单一化合物可以具有许多不同的晶体布局。为了找到能量最低的布局:基态布局。研讨职员依赖于较量争论成本高昂的高保真数值模拟。

如果在电极和电解质之间的界面形成竞争相,静态电池会失去容量和电压。寻找相容的资料,确保资料不会分解。但候选的领域很广:估计表明有数百万甚至数十亿种似是而非的静态化合物等待被发觉。

「你无法对这个潜在晶体布局空间的大片区域进行这些非常详细的模拟。」NREL 研讨员 Peter St. John说。「每一个都是非常密集的较量争论,在大型较量争论机上需要几分钟到几小时。」 然后,人类必须梳理所得数据,以手动识别新的预期资料。

为了加速这一过程,研讨职员使用了一种称为图神经网络的机械进修形式。图神经网络是一种经过训练可以检测和突出显示数据模式的算法。在这里,「图」本质上是每一个晶体布局的图。该算法分析每一个晶体布局,然后预计其总能量。

对于基准测试,研讨职员在来自 NREL 资料数据库 (NRELMatDB) 的 ICSD(有机晶体布局数据库) 布局的 DFT 总能量上训练 CGCNN 模型。该模型在 15,500 个晶体布局上进行了训练,每一个布局都保留了 其中 500 个用于验证和测试。

图神经网络精确预计有机化合物性质,加速静态电池的设计

GNN 模型架构。

然而,任何神经网络的成功都取决于其用来进修的数据。科学家们已经确定了超过 200,000 种有机晶体布局,但还有很多的可能性。一些晶体布局起初看起来很宁静——直到与较低能量的化合物进行比较才会发觉并非如此。研讨职员提出了假设的、更高能量的晶体,可以帮助机械进修模型提高分辨看似宁静的布局和实际宁静布局的能力。

「要训练一个能够正确预计布局是否宁静的模型,你不能只给它提供我们已经知道的基态布局。你必须给它这些假设的高能布局,这样模型才能区分这两者,」St. John说。

为了训练他们的图神经网络,研讨职员创建了基于量子力学较量争论而不是自然的理论示例。通过在训练数据中同时包含基态和高能晶体,与仅在基态布局上训练的模型相比,研讨职员能够获得更精确的结果。研讨职员模型的平均误差比对比案例低五倍。

具体而言,研讨职员使用 Kendall 等级相关系数 (KRCC) 作为度量来比较不同模型和数据集之间预计能量等级的精确性。

当在相同的组合数据集上训练时,GNN 模型、MEGNet 和 CGCNN 模型具有相似的平均 KRCC。与仅在 ICSD 布局上训练相同模型相比,这是 KRCC 的显着改进。因此,训练数据的选择起着更关键的作用,而实际模型架构对模型在布局能量排名中的性能影响较小。

图神经网络精确预计有机化合物性质,加速静态电池的设计

不同数据集和模型的能源排名比较。

这种方法可以彻底改变研讨职员发觉具有宝贵特性的新资料的速度,使他们能够快速地发觉最有前途的晶体布局。科罗拉多矿业学院的研讨教授 Gorai 说,这项工作具有广泛的相关性。

「两种固体相互接触的情况发生在许多不同的应用中——光伏、热电、各种功能设备。」Gorai 说。「一旦该模型成功,它就可以部署在静态电池之外的许多应用中。」

论文链接:https://doi.org/10.1016/j.patter.2021.100361

参考内容:https://techxplore.com/news/2021-12-machine-method-battery-materials.html

原创文章,作者:ScienceAI,如若转载,请注明出处:https://www.iaiol.com/news/tu-shen-jing-wang-luo-jing-que-yu-ji-you-ji-hua-he-wu-xing/

(0)
上一篇 2021年 12月 21日 下午3:15
下一篇 2021年 12月 24日 下午10:26

相关推荐

  • NUS钻研团队开发自动化药物临盆新手艺,「自动化多步分解」成可能

    发现和开发用于治疗的新型小份子化合物需要投入大量的时间、精力和资源。新加坡国立大学(NUS)的钻研团队开发了一种适当药物小份子的自动化临盆办法,为传统化学分解提供了新的思路。该办法可能用于通常通过手动工艺临盆的份子,从而减少所需的人力。取得这一手艺突破的钻研小组由新加坡国立大学化学系助理教授Wu Jie 和新加坡国立大学化学和生物份子工程系副教授Saif A. Khan领导。Liu Chenguang博士(左)和Wu Jie助理教授(右)。(来源:NUS)NUS团队演示了用于癌症治疗的药物份子prexersatib

    2021年 6月 9日
  • CVPR 2021 | 革新奇智首次提出零样本实例联系,助力解决工业场景数据瓶颈难题

    对于数据发现、数据粗筛、辅助标注、模型基本能力探索等方面有巨大的提升。

    2021年 3月 31日
  • 刷题太遭罪怎么办?这个算法基地专为小白量身打造,还带动画

    如何有效地刷算法题?刷题小白最新打卡地。算法很重要,但算法也是学起来最难,最令人生畏的。算法千千万,不知该如何下手?经常看到有人抱怨:刚开始刷题时,自己很迷茫,不知道从何刷起,也看不懂别人写的题解。思绪飞来飞去,有时候以为是这个知识点重要,但有时又认为自己走错了路,结果学了半天,越刷越乱,时间、经历都白白浪费。其实,学算法,刷题蛮干是不行的,需要遵循科学的方法。学习算法可能并不只是拼智商,可以通过后天的学习进行掌握,这就需要讲究技巧。方法找对了,可以起到事半功倍的效果。近日,在 Github 上就有人开源了一个项目

    2021年 3月 25日
  • GitHub代码一键转VS Code:只需+1s

    被微软收购后的 GitHub,正在变得越来越易用,现在又有人把它和「宇宙第一 IDE」VS Code 紧密联系起来了。

    2021年 2月 9日
  • 1.8M超轻量方向检测模型NanoDet,比YOLO跑得快,上线两天Star量超500

    如何把 anchor-free 模型移植到静止端或嵌入式设备?这个项目对单阶段检测模型三大模块(Head、Neck、Backbone)进行轻量化,得到模型大小仅 1.8m、速度超快的轻量级模型 NanoDet-m。

    2020年 11月 24日
  • baidu全新无人挖掘机功课体系登上国际权威期刊《Science Robotics》

    近日,由baidu研究院机器人与自动驾驶实验室(RAL)团队牵头开发的全新无人挖掘机功课体系(AES)这一最新技能成果,登上了国际顶级期刊《Science》子刊《Science Robotics》,并获得了评审专家与期刊编委的高度评价。该研究融合了感知、活动布局和控制体系,可驱动挖掘机自主完成挖装恣意,从事24小时连续无人化功课,并成为全球首个实际落地的、可长时间功课的无人挖掘机体系,在工程机械自动化、无人化功课领域具有重要价值和影响。随着新型基础设施建设的大力推进,工程机械行业乘风而上,并不断向数字化、智能化方向演进。

    2021年 7月 2日
  • 对话极盾科技CEO丁杨:始创企业,所有客户都是创始人

         十几年前的丁杨是一名工科大学生,在校期间,他最喜欢的事儿就是参加每周的社团活动,这个社团名为东南大学网络宁静联盟(SUS),它还有着一个特殊的称号,即国内最早的高校网络宁静社团。在接受朋湖专访时,说起这段青春往事,丁杨的语调也变得高昂起来,“我们每周六社团的人都会聚在一起做内容分享,风雨无阻。”他讲道,“当然后期来的人也有所减少,但最后留下来的人现在来看,也都选择从事了和网络宁静相关的工作。”丁杨是其中坚持下来的一员。如今,丁杨已是一家网络宁静始创企业创始人,拥有15年宁静和

    2022年 9月 7日
  • TensorFlow 2.4来了:上线对分布式训练和混合精度的新功能反对

    今天,谷歌正式发布了 TensorFlow 2.4,带来了多项新特性和功能改进。

    2020年 12月 15日
  • 可对药物份子举行表征的若干深度进修

    编辑 | 萝卜皮若干深度进修(GDL)基于包罗和处理对称信息的神经网络架构。GDL 为依赖于具有不同对称性和抽象级别的份子体现的份子建模利用程序带来了希望。苏黎世联邦理工学院的研讨人员对份子 GDL 举行了结构化和统一概述,重点介绍了其在药物发现、化学合成猜测和量子化学中的利用。它包罗对 GDL 原理的介绍,以及相关的份子体现,例如份子图、网格、曲面和字符串,以及它们各自的属性。讨论了份子科学中 GDL 当前面临的挑战,并尝试猜测未来的机会。该综述以「Geometric deep learning on molec

    2021年 12月 27日
  • 130亿光年:刚刚,NASA发布了宇宙最深处的影像

    北京光阴 7 月 12 日早晨,美国宇航局(NASA)公布了詹姆斯・韦伯太空千里镜拍摄的第一张全彩图象,这是深空天文台的一次重要时刻,标志着其进入科学研究第一年的开始。

    2022年 7月 12日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注