AI在线 AI在线

AI取代实验室的「最后一步」:LDBT范式以学习为起点重构生物设计流程

合成生物学定义为设计-构建-测试-学习循环。 最近机器学习的进步正在改变这一格局;因此,我们建议「学习」可以先于「设计」。 编辑丨&在合成生物学实验室中,研究者设计基因序列、构建质粒、转化菌株、验证功能——这一整套流程被称为 DBTL 循环:Design – Build – Test – Learn。
图片

合成生物学定义为设计-构建-测试-学习循环。最近机器学习的进步正在改变这一格局;因此,我们建议「学习」可以先于「设计」。

编辑丨&

在合成生物学实验室中,研究者设计基因序列、构建质粒、转化菌株、验证功能——这一整套流程被称为 DBTL 循环:Design – Build – Test – Learn。这是过去二十年生物工程的金标准。这些循环通过提供一种系统且迭代的工程框架来简化和简化构建生物系统的过程。

机器学习为所需蛋白质和途径提供了新的机会,但碍于蛋白质功能的表征等问题,整体的流程其实并不尽如人意。在整个循环的最后一步「L」,也就是学习中,机器学习方法之所以占据主导地位,并不是因为它们取代了物理学,而是因为当前的生物物理模型在应用于生物分子的复杂性时计算成本高昂且范围有限。

所以不如换个思路——把「L」提到前面来。

图片

图 1:当前 DBTL 工作流程的提议改进。

这就是美国德克萨斯大学奥斯汀分校(University of Texas at Austin)与西北大学(Northwestern University)、斯坦福大学(Stanford University)等共同提出的思路——新的循环 LDBT — Learn → Design → Build → Test

相关的研究内容以「LDBT instead of DBTL: combining machine learning and rapid cell-free testing」为题,于 2025 年 11 月 5 日发布在《Nature Communications》。

图片

论文链接:https://www.nature.com/articles/s41467-025-65281-2

让「学习」成为起点

如 ESM 和 ProGen 这样的蛋白质语言模型是在所有进化树中嵌入蛋白质序列的进化关系上进行训练的,能够完成预测有益突变和推断蛋白质序列功能等任务。

但即使是在诸如零样本设计策略等方面上,有了机器学习的增强,经典的 DBTL 循环仍然需要多次迭代才能获得知识,而循环中的构建-测试部分尤其缓慢。本应在这个阶段进行学习的的数据可能早就训练过了。所以不如效仿零样本预测,通过「LDBT」重新排序循环。

图片

图 2:Learn-design-build-test 代替 design-build-test-learn。

首先,利用深度学习模型(如蛋白语言模型 ESM-2、结构设计模型 ProteinMPNN),AI 可以在无明确模板的情况下生成全新序列或结构预测。

其次,基于模型输出,研究者可选择最具可行性的方案,用结构建模(AlphaFold、RosettaFold)预测折叠稳定性与活性位点分布,这种方式可以将近 10 倍地提高设计成功率。DBTL 范式的进程同样可以借助细胞裂解物等进行体外转录和翻译,这样就无需中间的耗时克隆步骤,表达的蛋白质可以直接使用或进一步纯化。

用 AI 代理进行闭环设计平台进一步扩大了产能。细胞自由表达系统带来了高通量处理能力,为构建用于训练机器学习模型的大数据集和测试计算预测提供了有力工具,这其中也包括解决蛋白质表达问题的数据。

将这些进步扩展到蛋白质工程之外,需要进一步取得进展,比如说把建模扩展到更多分子、途径。在重新构想的 LDBT 循环中,从「所需功能」到「设计序列」再到「工作蛋白质/功能」的承诺有望解锁生物学的完整设计空间。

相关资讯

与一支由虚拟科学家组成的 AI 团队共事是怎样的体验?

编辑丨%4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一生中最超现实的会议之一。 在一个名为 Virtual Lab 的系统的在线测试界面中,Montine 构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。 他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。
7/7/2025 10:11:00 AM
ScienceAI

智能科学实验室加速未来科学发现,首版仿真智驱实验室LabUtopia发布

编辑丨ScienceAI打破家庭场景「内卷」,机器人不仅能下厨,还要上实验台! LabUtopia把「智能科学实验室」搬进虚拟仿真器。 智能科学实验室新范式当前「AI 科学家」侧重虚拟推理、自动化实验室侧重机械执行,二者各擅其长却难以贯通。
7/14/2025 2:04:00 PM
ScienceAI

AI驱动的自主酶工程平台,底物偏好提升90倍,伊利诺伊大学新研究登Nature子刊

编辑丨&蛋白质是生命中的分子机器,在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。 但即使如此,为了实际应用而对蛋白质进行工程改造,仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。 美国伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)提出了一个通用的自主酶工程平台,集成了大型语言模型与生物制造自动化,为医药、生物技术等多个行业带来了快速进步的新范式。
7/16/2025 2:07:00 PM
ScienceAI