AI在线 AI在线

AlphaFold3不能的,它可以!上交、范德堡团队开发LassoPred:预测套索肽三维结构的工具

编辑 | 萝卜皮套索肽(LaP)以其缠结状活结结构为特征,是一大类核糖体合成和翻译后修饰的肽(RiPP),例如可用作抗生素、酶抑制剂和分子开关。 虽然生物信息学预测了数千个 LaP 序列,但在过去 30 年中,仅有约 50 个不同的 LaP 被表征为结构特征。 现有的计算工具,例如 AlphaFold2、AlphaFold3 和 ESMfold,由于其不规则的骨架结构(例如套索结状折叠和异肽键的存在),无法准确预测 LaP 的结构。
图片

编辑 | 萝卜皮

套索肽(LaP)以其缠结状活结结构为特征,是一大类核糖体合成和翻译后修饰的肽(RiPP),例如可用作抗生素、酶抑制剂和分子开关。

虽然生物信息学预测了数千个 LaP 序列,但在过去 30 年中,仅有约 50 个不同的 LaP 被表征为结构特征。

现有的计算工具,例如 AlphaFold2、AlphaFold3 和 ESMfold,由于其不规则的骨架结构(例如套索结状折叠和异肽键的存在),无法准确预测 LaP 的结构。

为了应对这一挑战,上海交通大学、范德堡大学的研究人员开发了 LassoPred,它设计了一个分类器来注释 LaP 序列的环、圈和尾部,以及一个构造器来构建 3D 结构。

利用 LassoPred,该团队预测了 4749 个独特的 LaP 核心序列的三维结构,创建了迄今为止最大的计算机预测套索肽结构数据库。

该研究以「LassoPred: a tool to predict the 3D structure of lasso peptides」为题,于 2025 年 7 月 1 日发布在《Nature Communications》。

图片

LassoPred 可通过网页界面和命令行工具公开访问,支持未来的结构-功能关系研究,并有助于发现可用于化学和生物医学应用的功能性套索肽。

LassoPred:https://lassopred.accre.vanderbilt.edu/

图片

图示:LassoPred 的设计架构。(来源:论文)

LassoPred 及其相关数据库有望增进人们对套索肽的基础知识,加速新功能肽的发现,并为辅助套索肽设计和工程的新工具的设计提供信息,展现出改变套索肽研究范式的巨大潜力。该数据库将 LaP 结构的数量从 47 个扩展到 4749 个。

研究人员表示,训练数据集仅包含 47 个套索肽,这反映了该领域经实验表征的 LaP 结构相对稀缺。迄今为止,大多数套索肽结构已通过溶液 NMR 技术解析,而通过 X 射线晶体学确定的结构数量较少。无论采用何种技术,确定套索肽结构至少需要数月的实验工作(有时甚至长达数年);并且即便付出了数月或数年的实验工作,也有可能一无所获。

研究人员尝试通过解析一种具有抗菌活性的新型套索肽的核磁共振结构来验证 LassoPred。尽管该肽在异源宿主中表达良好,但在改变溶剂、采集温度和 NOE 混合时间后,二维核磁共振实验未能获得足够高质量的数据来确定其结构。

Lasso 肽结构测定固有的挑战展现了 LassoPred 填补的关键空白,它能够提供超越已知结构范围的大规模计算机结构预测。这些预测结构可用于对接模拟或其他计算机药物研发工作。

这些预测为阐明 LaP 非凡的热稳定性和在水以外的溶剂中的稳定性背后的序列-结构-功能关系提供了基础,启发了开发合理的工程策略来调整套索肽的性质。

通过 LassoPred 构建具有非天然左手缠绕折叠的套索肽,有助于研究人员研究套索肽的折叠景观和套索肽缠绕手性的起源,从而增强对套索肽的基础知识。

图片

图示:套索肽结构的数据库和预测工具。(来源:论文)

LassoPred 可以帮助优先发现新的 LaP,如抗生素和自组装生物材料。同时,LassoPred 数据库还能帮助研究人员找到新型互锁轮烷开关,例如 benenodin-1,以及含半胱氨酸的套索肽 (lasso peptides),这些肽可作为动态共价键合的自组装生物材料,用于医疗和工业用途。

LassoPred 数据库不仅能够促进功能性 LaP 的计算机模拟发现,还包含数千个序列和结构,可用于构建和优化预测机器学习模型,例如 DeepLasso。这些数据还可以促进生成模型的构建,从而实现 Lasso 肽的从头设计。

论文链接:https://www.nature.com/articles/s41467-025-60544-4

相关资讯

图神经网络准确预测无机化合物性质,加速固态电池的设计

编辑/绿萝大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。该研究以「Predicting energy and stabi
12/24/2021 11:19:00 AM
ScienceAI

Protein BLAST会成为过去吗?AlphaFold等对蛋白结构的搜索是否会取代对序列的搜索

编辑 | 白菜叶像 AlphaFold 这样的蛋白质结构搜索工具会用 BLAST 取代蛋白质序列搜索吗?德累斯顿工业大学的研究团队讨论了使用结构搜索进行远程同源性检测的前景,以及为什么蛋白质 BLAST 作为领先的序列搜索工具应努力纳入结构信息。BLAST 广泛用于分子生物学中搜索核苷酸和蛋白质序列。BLAST 推出三十年后,结构预测出现了重大突破,出现了 RoseTTAFold 和 AlphaFold 等工具。因此,主要序列数据库中的每个蛋白质序列现在都带有一个 3D 折叠模型。虽然这不会影响(非编码)核苷酸序列
12/12/2023 11:52:00 AM
ScienceAI

开源!港中文、MIT、复旦提出首个RNA基石模型

本文中 RNA-FM 模型的出现一定程度上缓解了 RNA 带标注数据紧张的现状,为其他研究者提供了访问大批量无标签数据的便捷接口。并且,该模型将以 RNA 领域基础模型的身份,为该领域的各种各样的研究提供强有力的支援与帮助。
7/16/2022 12:06:00 PM
机器之心
  • 1