AI在线 AI在线

AI驱动的自主酶工程平台,底物偏好提升90倍,伊利诺伊大学新研究登Nature子刊

编辑丨&蛋白质是生命中的分子机器,在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。 但即使如此,为了实际应用而对蛋白质进行工程改造,仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。 美国伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)提出了一个通用的自主酶工程平台,集成了大型语言模型与生物制造自动化,为医药、生物技术等多个行业带来了快速进步的新范式。
图片

编辑丨&

蛋白质是生命中的分子机器,在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。但即使如此,为了实际应用而对蛋白质进行工程改造,仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。

美国伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)提出了一个通用的自主酶工程平台,集成了大型语言模型与生物制造自动化,为医药、生物技术等多个行业带来了快速进步的新范式。

该研究以「A generalized platform for artificial intelligence-powered autonomous enzyme engineering」为题,于 2025 年 7 月 1 日刊登在《Nature Communications》。

图片

论文链接:https://www.nature.com/articles/s41467-025-61209-y

自主工程平台

传统的实验室效率取决于实验人员的经验高低,而手动实验任务更是劳心劳力,也容易出现可重复性问题,难以扩展,并且在处理大量数据集和高通量实验时会变得越来越复杂。

而 AI 驱动的系统可以比传统计算技术更有效地探索庞大的多维空间,而机器人技术和自动化则可以更快、更可靠地执行实验,具有更好的可扩展性和更高的通量。

在生物学中,自主实验尚不成熟,许多自主实验平台都处在起步阶段,通用平台的扩展性与适应性让其成为优先发展的目标。本次研究的实验团队就希望以蛋白质工程为例,推动合成生物学的创新。

在本次实验中,团队以酶为主要研究方向,通过迭代的设计、构建、测试和学习(DBTL)循环,酶可以变得更加稳定、选择性更强或效率更高。

图片

图 1:自主蛋白质工程通用平台的概述。(来源:论文)

团队介绍了一个由伊利诺伊生物制造工厂(iBioFAB)、机器学习(ML)和大型语言模型(LLMs)支持的通用自主酶工程平台。由于该平台只需要蛋白质序列和量化适应度数据,因此它可以应用于广泛的蛋白质。

作为概念验证,实验者分别将拟南芥卤化物甲基转移酶(AtHMT)和鼠疫耶尔森菌植酸酶(YmPhytase)的变体工程化,在 4 周内重复了 4 轮工程,处理后的活性分别比野生型酶高约 16 倍和 26 倍,每种酶仅需构建和表征不到 500 个变体。

实验设计与新见解

在基于机器学习的蛋白质工程中,通过定点突变(SDM)生成的突变体的测序与验证往往会导致流程延迟。故而,团队设计了一种以 HiFi 组装为基础的突变方法,消除过程中途进行序列验证的需要,实现不间断的工作流程。

图片

图 2:自动化蛋白质工程工作流。(来源:论文)

模块内的实验步骤完全自动化,几乎不需要人工干预。每个模块都单独编程到 iBioFAB 平台上,并仔细优化。工作流自动化了所有蛋白质工程步骤,包括突变 PCR、DNA 组装等。

以两种不同的酶——AtHMT 和 YmPhytase 为例,团队展示了平台的通用性。

59.6%的 AtHMT 变体和 55%的 YmPhytase 变体在性能上超过了野生型基线,其中 50%和 23%的变体分别表现得更为显著。无监督模型预测的最佳突变体分别是 AtHMT 的 V140T,性能提高了 2.1 倍,以及 YmPhytase 的 V141M,性能提高了 2.6 倍。

在验证中,团队观察到一个有趣的现象:ML 驱动的实验往往会产生令人惊讶的结果和意想不到的方向。

尽管 S99T/V140T 是第二轮中最好的双突变体,但含有 S99T/V140T 的三重突变体中没有一个进入前 100 名。于是团队对此进行了实验验证,试图找出 ML 模型是否能够识别突变之间的协同效应。

图片

图 3:AI 驱动的自主工程化 AtHMT 和 YmPhytase 酶的结果。(来源:论文)

在 AtHMT 改造中,人类直觉倾向于组合已知高活性突变,但 AI 预测的非直觉组合活性更优 ——82% 的 AI 预测 triple 突变体呈现出更好的活性,占比也远高出第二轮突变体的 11%。

实验观察到,目标变体的活性在整个四个工程周期中都有所增加,且适应度都优于野生型。

对于 AtHMT,每一轮表现最好的变体在粗裂解物测定中分别比 wtHMT 好 2.1 倍、3 倍、4.3 倍和 5.1 倍;对于 YmPhytase,每一轮表现最好的变体在粗裂解物测定中分别比 wtPhy 好 2.6 倍、7.5 倍、9 倍和 11.1 倍。

值得一提的是,有两种 AtHMT 变体,前者在乙基转移酶活性方面比 wtHMT 提高了约 16 倍,后者对乙基碘化物的偏好比对甲基碘化物的偏好提高了约 90 倍。

这些夸张的数据无不表明了这种自主方法的工程应用价值。

小结

「对于用户界面,我们的动机是让不同背景的人能够使用这个工具。」论文的共同作者 Tianhao Yu 表示。

研发团队开发了一个基于自然语言的用户界面,以协助没有编程技能的用户与蛋白质工程平台进行交互。利用 OpenAI 的助手 API 和自定义功能,小白也可以用简单的命令设计初始库。

这个平台的意义并不只在于其对实验效率的提升,而是透过酶工程表示了自主实验平台的发展潜力。

平台仍存在一些局限,譬如并非适用于所有蛋白质等。但随着未来技术更深入的探索,自主实验平台也会集成更多有力的模块,待到那时,一个完整泛用的框架将会是整个工程试验的坚实基础。

相关资讯

与一支由虚拟科学家组成的 AI 团队共事是怎样的体验?

编辑丨%4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一生中最超现实的会议之一。 在一个名为 Virtual Lab 的系统的在线测试界面中,Montine 构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。 他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。
7/7/2025 10:11:00 AM
ScienceAI

智能科学实验室加速未来科学发现,首版仿真智驱实验室LabUtopia发布

编辑丨ScienceAI打破家庭场景「内卷」,机器人不仅能下厨,还要上实验台! LabUtopia把「智能科学实验室」搬进虚拟仿真器。 智能科学实验室新范式当前「AI 科学家」侧重虚拟推理、自动化实验室侧重机械执行,二者各擅其长却难以贯通。
7/14/2025 2:04:00 PM
ScienceAI

DeepAllo:首次使用蛋白质语言模型和多任务学习进行变构位点预测

编辑 | 白菜叶变构效应是指一个位点的结合会扰乱远处位点的过程,由于其对蛋白质功能有显著的影响,正成为药物开发领域的一个重点研究领域。 识别变构口袋(位点)是一项极具挑战性的任务,目前已开发出多种技术,包括利用静态和口袋特征预测变构口袋的机器学习技术。 土耳其科奇大学(Koç University)的研究人员开发了 DeepAllo,是首个将微调蛋白质语言模型 (pLM) 与 FPocket 特征相结合的研究,目的是提高识别变构口袋相关技术的准确性。
7/17/2025 5:28:00 PM
ScienceAI
  • 1