AI在线 AI在线

Allegro-FM:剑指分子动力学基础模型,零样本预测89种元素及复杂反应

编辑丨%随着模型的不断进化发展,分子动力模拟已经成为了材料科学、化学反应研究等领域的重要工具。 当下 SOTA 的训练基于数百万个参数,虽然看起来很多,但面对日益复杂的材料系统和化学反应,如何获得保质保量的模拟结果依旧是个难题。 为了解决传统方法对特定任务与数量的依赖等问题,美国南加州大学(University of Southern California)提出了 Allegro-FM,基于 E(3) 等变网络架构,它可以自动捕捉原子间的空间关系,在需要模拟百万到十亿原子的材料模拟方面具有巨大潜力。
图片

编辑丨%

随着模型的不断进化发展,分子动力模拟已经成为了材料科学、化学反应研究等领域的重要工具。当下 SOTA 的训练基于数百万个参数,虽然看起来很多,但面对日益复杂的材料系统和化学反应,如何获得保质保量的模拟结果依旧是个难题。

为了解决传统方法对特定任务与数量的依赖等问题,美国南加州大学(University of Southern California)提出了 Allegro-FM,基于 E(3) 等变网络架构,它可以自动捕捉原子间的空间关系,在需要模拟百万到十亿原子的材料模拟方面具有巨大潜力。

该研究以「Allegro-FM: Toward an Equivariant Foundation Model for Exascale Molecular Dynamics Simulations」为题,于 2025 年 7 月 20 日刊登在《The Journal of Physical Chemistry Letters》。

图片

论文链接:https://pubs.acs.org/doi/10.1021/acs.jpclett.5c00605

精准预测与零样本学习

Allegro-FM 的核心优势在于其卓越的零样本学习能力,即无需大量任务特定的训练数据,便能准确预测新的材料系统和化学反应。

在碳酸分解反应的模拟中,研究团队充分证明了这一点。Allegro-FM 对过渡态的适应性良好,并且成功计算出了反应的过渡态能量。与高水平理论 ωB97M-D3(BJ)相比,误差仅在 0.3kcal/mol。

图片

图示:碳酸分解为水与二氧化碳的反应坐标与活化能。

该模型不仅能够精准捕捉单一步骤反应的能量变化,还能够在多步骤反应路径预测中表现出色。研究人员通过将多个反应路径联合建模,Allegro-FM 能够有效预测反应中间体的能量,且与实验和理论结果高度一致。这一突破表明,Allegro-FM在面对复杂的化学反应时,能够提供可靠的预测,极大地加速了反应路径的研究。

这一点在静态结构与力学性质的预测上也同样奏效。

在对托贝莫来石(T11,硅酸钙水合物的典型结构)的模拟中,从 Allegro-FM 获得的 T11 的状态方程,获得的 2.44g/cm³的计算密度与实验值(2.46 g/cm³)接近,体模量(60 GPa)与 DFT 计算结果(52.7–60.8 GPa)吻合,证明对无机晶体结构的精准描述。

高效计算与大规模扩展

Allegro-FM 不仅具备高精度的预测能力,还展示了超高的计算效率。在使用 Aurora 超算时,Allegro-FM 能够处理多达 40 亿原子的系统,并展现出高达 97.5% 的并行效率。这一计算能力远超传统分子动力学模拟方法,为大规模分子系统的模拟提供了前所未有的支持。

Allegro-FM 的另一个进步之处在于其高效的数据微调能力。与传统方法需要从头开始训练每一个新材料系统不同,Allegro-FM 仅需少量的额外数据进行微调,即可适应新任务。

这一特点极大地节省了计算时间和资源,使其在实际应用中更加灵活高效。科研人员不再需要为每个新材料构建庞大的数据集,Allegro-FM 能够快速生成准确的模拟结果,显著提高了材料设计的效率。

在原始数据集之外,Allegro-FM 同样可以执行多种任务,活化能模拟、拉伸试验和 TNP 反应就是例证。它对地球化学循环和水泥化学中重要的反应表现出强大的可预测性和通用性,这表明 Allegro-FM 即使不进行微调也具备这种能力。

团队的初步研究结果表明,Allegro-FM 可以有效地微调至与 TEA 框架一致的新数据集,而不会影响原始精度。额外训练集大约只有原始训练数据的 10%,所需资源要少得多。例如,初始训练在 8 个英伟达 A100 GPU 上需要 3 天,而在单个 A100 上进行微调仅需 24 小时。

表 1:每个 Allegro-FM 模型的超参数设置和可训练参数总数。

图片

小结

Allegro-FM 在新材料设计碳捕集矿化、以及催化剂设计等领域都有着巨大潜力。通过精确模拟分子反应路径,它能够帮助科学家们设计更加高效的材料,推动清洁能源、环境保护等技术的发展。

该模型的潜力远非数十亿或者数百亿,研究者对它的期望是百亿亿级的。Allegro-FM 适用于多种下游任务,涵盖训练集中的 89 种元素。

AllegroFM 具备强大的可预测性、泛化性、计算效率和算法可扩展性,在不牺牲原子细节的情况下,在微米空间尺度和微秒时间尺度的动力学模拟方面具有巨大潜力。在材料学、能源等领域,相信都会有其发挥实力的机会。

相关资讯

菲尔兹奖得主深度参与,WAIC全方位探讨「AI for Math」

2025 年 7 月 26 日,上海世博展览馆迎来一场聚焦 "人工智能的数学边界与基础重构" 的高端论坛。 作为世界人工智能大会(WAIC)的重要组成部分,这场由上海市普陀区人民政府与菲数中国主办、上海市人工智能行业协会和上海东浩兰生威客引力信息科技有限公司联合承办的盛会,正成为全球关注的焦点。 当 AI 技术与数学研究进入深度交织的新阶段,2025 WAIC 的召开恰如一场及时雨,为二者的协同发展搭建了关键对话平台。
7/27/2025 10:48:00 PM
ScienceAI

智能科学实验室加速未来科学发现,首版仿真智驱实验室LabUtopia发布

编辑丨ScienceAI打破家庭场景「内卷」,机器人不仅能下厨,还要上实验台! LabUtopia把「智能科学实验室」搬进虚拟仿真器。 智能科学实验室新范式当前「AI 科学家」侧重虚拟推理、自动化实验室侧重机械执行,二者各擅其长却难以贯通。
7/14/2025 2:04:00 PM
ScienceAI

精确捕捉疾病进程中细胞动力学变化,生成式平台UNAGI准确模拟药物扰动

编辑丨ScienceAI复杂疾病就像一场错综复杂的谜局:基因与环境因素在体内交织,导致细胞状态千变万化,也让我们难以看透病程背后的真相,进而影响了新药的研发。 虽然单细胞测序技术能为每个细胞「拍照留念」,现有的分析方式却往往只能看到零散的瞬间,无法还原疾病发展过程中细胞状态的连续变化。 更麻烦的是,现有的计算模型难以从这些数据中自动找出关键的基因调控网络,也无法精准锁定那些加剧病情的「元凶」基因和通路。
7/15/2025 2:17:00 PM
ScienceAI
  • 1