蛋白质

蛋白质基座的GPT时代来了？AMix用Test-time Scaling让蛋白质设计迈向通用智能

当语言模型涌现出通用智能时，蛋白质模型的通用智能还有多远？在 NLP 领域，语言模型基座经历了从 BERT 到 GPT 的跨时代变化，涌现出了各种超出预期的通用智能，BERT 时代的模型关心具体任务的提升，缺乏对可扩展性、通用性和涌现能力的系统化讨论，而在 GPT 时代，系统化的讨论逐渐显现，通用智能的爆发也因此开始。而在蛋白质基座领域，几乎没有贯彻这条智能涌现的路径，一系列工作同样停留在 BERT 时代，在「预训练任务微调」这一范式下前行，缺乏对可扩展性、通用性和涌现能力的系统化讨论。

7/29/2025 2:07:00 PM ScienceAI

DeepAllo：首次使用蛋白质语言模型和多任务学习进行变构位点预测

编辑 | 白菜叶变构效应是指一个位点的结合会扰乱远处位点的过程，由于其对蛋白质功能有显著的影响，正成为药物开发领域的一个重点研究领域。识别变构口袋（位点）是一项极具挑战性的任务，目前已开发出多种技术，包括利用静态和口袋特征预测变构口袋的机器学习技术。土耳其科奇大学（Koç University）的研究人员开发了 DeepAllo，是首个将微调蛋白质语言模型 (pLM) 与 FPocket 特征相结合的研究，目的是提高识别变构口袋相关技术的准确性。

7/17/2025 5:28:00 PM ScienceAI

AI驱动的自主酶工程平台，底物偏好提升90倍，伊利诺伊大学新研究登Nature子刊

编辑丨&蛋白质是生命中的分子机器，在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。但即使如此，为了实际应用而对蛋白质进行工程改造，仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。美国伊利诺伊大学厄巴纳-香槟分校（University of Illinois Urbana-Champaign）提出了一个通用的自主酶工程平台，集成了大型语言模型与生物制造自动化，为医药、生物技术等多个行业带来了快速进步的新范式。

7/16/2025 2:07:00 PM ScienceAI

不用抗生素也能抗菌！AI设计新型蛋白质抵御细菌耐药性｜Nature子刊

借助AI，新型蛋白质合成周期大幅降低！这些蛋白质还能有效抵抗像大肠杆菌这类抗生素耐药细菌。一项来自澳大利亚的研究发现，像大肠杆菌这类致病菌会通过ChuA蛋白（细菌中的一种外膜蛋白）从宿主血红蛋白中“偷”血红素获取生长所需的铁。

7/14/2025 3:40:21 PM 闻乐

登《Cell》，中科院高彩霞等开发AiCE：一种AI蛋白质工程通用策略

编辑丨&蛋白质工程长期受限于低成功率与高成本，理想的蛋白质工程策略需要以最少的工作量实现最佳性能。当前基于 AI 的蛋白质工程技术通常计算量大，因此迫切需要更易于使用且用户友好的替代方案，这些方案需要保持预测的准确性并在研究社区推广使用。中国科学院高彩霞团队开发的 AiCE（AI-informed constraints for protein engineering）框架通过将结构和进化约束整合到通用反向折叠模型中，实现了快速高效的蛋白质进化，无需专门训练。

7/8/2025 6:23:00 PM ScienceAI

MIT自主科学发现系统SPARKS：已独立发现两条全新蛋白质设计法则

编辑 | 萝卜皮人工智能（AI）的进步有望实现自主科学发现，但大多数系统仍在重复训练数据中潜藏的知识。几个月前，麻省理工学院（MIT）的 Markus J. Buehler 和 Alireza Ghafarollahi 推出了自主科学发现模型 SPARKS。

7/4/2025 4:40:00 PM ScienceAI

量化单个细胞中表达的一半蛋白质组，质谱技术最新进展推动SCP发展

编辑丨coisini单细胞蛋白质组学（single-cell proteomics，SCP）是研究单个细胞内蛋白质表达多样性的研究领域。自 2020 年以来，蛋白质组学在可达到的灵敏度方面实现了超过 100 倍的提升，这一成就得益于质谱仪设计的一系列改进以及结合机器学习的数据处理算法。 SCP 有潜力扩展现有分析工具集，但在吞吐量和蛋白质组深度方面仍受到限制。

4/9/2025 2:15:00 PM ScienceAI

仅输入prompt与序列，准确率超90%，UC伯克利等提出文本生成蛋白质多模态框架

编辑丨coisini机器学习在蛋白质发现领域展现出深远的潜力，相关工具已快速应用于科学流程的辅助与加速。当前，AI 辅助的蛋白质设计主要利用蛋白质的序列和结构信息，而为了描述蛋白质的高级功能，人们以文本形式整理了海量知识，这种文本数据能否助力蛋白质设计任务尚未得到探索。为了填补这一空白，来自加州大学伯克利分校（UC Berkeley）、加州理工学院（California Institute of Technology）等机构的研究者提出了一个利用文本描述进行蛋白质设计的多模态框架 ——ProteinDT。

4/3/2025 2:37:00 PM ScienceAI

53%性能全面提升，Ayu新模型横扫传统工具，分泌蛋白预测效率再翻倍

编辑丨&微生物是驱动元素循环的引擎，它们分泌蛋白质以寻求生活环境。现阶段还缺乏有效的计算方法来研究分泌蛋白。表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。

4/3/2025 2:36:00 PM ScienceAI

比Rosetta快250倍，亲和力提升百倍，David Baker开发原子上下文条件蛋白序列设计新工具

编辑 | 萝卜皮小分子、核苷酸和金属离子条件下的蛋白质序列设计，对于酶和小分子结合剂以及传感器设计至关重要。但是，当前最先进的深度学习序列设计方法无法对非蛋白质原子和分子进行建模。华盛顿大学的 Cameron Glasscock、David Baker 团队提出了一种基于深度学习的蛋白质序列设计方法，称为 LigandMPNN，该方法可以模拟生物分子系统的所有非蛋白质成分。

3/31/2025 2:04:00 PM ScienceAI

活性提升65倍，山大新AI工具定向进化高活性酶，外部数据集验证成功率达80%

编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要，但现有模型面临过拟合导致准确率低或泛化能力差的问题。以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ，并用它来预测转换数（k(cat)）、米歇尔常数（K(m)）和催化效率（k(cat)/K(m))。与以前的基线模型相比，CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。

3/26/2025 2:10:00 PM ScienceAI

生信工具评测方法：基于蛋白质对的计算机预测工具评估

编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。存在多种功能注释方法，而且它们的数量一直在增长，尤其是随着深度学习技术的发展。但是，目前尚不清楚这些工具是否真的具有预测性。

3/21/2025 2:06:00 PM ScienceAI

原子级精确，David Baker团队开发RFdiffusion变体对抗体进行从头设计

编辑 | 萝卜皮抗体在现代医学中发挥着核心作用，但目前还没有完全在计算机中设计与特定表位结合的新型抗体的方法。相反，抗体发现目前依赖于动物免疫或随机文库筛选方法。华盛顿大学 David Baker 团队证明，结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选，可以生成抗体可变重链（VHH）和单链可变片段（scFv），以原子级精度结合用户指定的表位。

3/18/2025 11:58:00 AM ScienceAI

基于药效团与GPT从头生成分子，北大开发TransPharmer助力药物发现

编辑 | 萝卜皮深度生成模型推动了药物发现，但生成的化合物通常结构新颖性有限，限制了药物化学家的灵感。为了解决这个问题，北京大学的研究人员开发了 TransPharmer，这是一种生成模型，它将基于配体的可解释药效团指纹与基于生成预训练 Transformer（GPT）的框架相结合，用于从头生成分子。 TransPharmer 在无条件分布学习、从头生成和药效团约束下的骨架构建方面表现出色。

3/11/2025 12:16:00 PM ScienceAI

90%成功响应率，整合约9000个样本，统合癌症蛋白质组学的LLM驱动平台

编辑丨&功能蛋白质组学为癌症机制提供了关键见解，有助于发现新的生物标志物和治疗靶点。为了充分利用他们整合的将近 500 份高质量抗体的精选组合，美国德克萨斯大学决定采用 LLM 驱动来使资源更高效。他们推出了 DrBioRight 2.0，这是一个由最先进的大型语言模型提供支持的直观生物信息学平台。

3/10/2025 12:52:00 PM ScienceAI

首个强化生成模型AbNovo实现多目标、多约束抗体从头设计，发表于ICLR 2025

编辑 | ScienceAI近期，上海交通大学医学院张海仓课题组联合中原人工智能产业技术研究院与中国科学院计算技术研究所，提出了一项名为AbNovo 的抗体设计新方法。该方法基于强化学习与深度扩散模型，能够在多目标、多约束条件下实现抗体从头设计。该研究以「Multi-objective antibody design with constrained preference optimization」为题发表在国际机器学习顶会ICLR2025上。

3/4/2025 1:00:00 PM ScienceAI

微软 BioEmu-1 推动药物研发：从“单帧画面”到“电影”，AI 精准预测蛋白质结构变化

3/1/2025 10:38:04 AM 故渊

每小时处理80,000个蛋白质，大卫·贝克、微软等发布Seq2Symm，实现蛋白质对称性精准预测

编辑 | 2049在生物系统中，蛋白质很少以单体形式发挥功能，它们通常需要组装成更高级的复合物。这些复合物中，由多个相同蛋白质链通过非共价键相互作用形成的结构被称为同源寡聚体，它们的空间排布形成特定的对称性，这对蛋白质的稳定性、折叠和功能至关重要。然而，从单条序列精确预测蛋白质可能形成的对称结构一直是一项挑战。

2/28/2025 12:32:00 PM ScienceAI

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉