蛋白质
蛋白质基座的GPT时代来了?AMix用Test-time Scaling让蛋白质设计迈向通用智能
当语言模型涌现出通用智能时,蛋白质模型的通用智能还有多远? 在 NLP 领域,语言模型基座经历了从 BERT 到 GPT 的跨时代变化,涌现出了各种超出预期的通用智能,BERT 时代的模型关心具体任务的提升,缺乏对可扩展性、通用性和涌现能力的系统化讨论,而在 GPT 时代,系统化的讨论逐渐显现,通用智能的爆发也因此开始。 而在蛋白质基座领域,几乎没有贯彻这条智能涌现的路径,一系列工作同样停留在 BERT 时代,在「预训练 任务微调」这一范式下前行,缺乏对可扩展性、通用性和涌现能力的系统化讨论。
DeepAllo:首次使用蛋白质语言模型和多任务学习进行变构位点预测
编辑 | 白菜叶变构效应是指一个位点的结合会扰乱远处位点的过程,由于其对蛋白质功能有显著的影响,正成为药物开发领域的一个重点研究领域。 识别变构口袋(位点)是一项极具挑战性的任务,目前已开发出多种技术,包括利用静态和口袋特征预测变构口袋的机器学习技术。 土耳其科奇大学(Koç University)的研究人员开发了 DeepAllo,是首个将微调蛋白质语言模型 (pLM) 与 FPocket 特征相结合的研究,目的是提高识别变构口袋相关技术的准确性。
AI驱动的自主酶工程平台,底物偏好提升90倍,伊利诺伊大学新研究登Nature子刊
编辑丨&蛋白质是生命中的分子机器,在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。 但即使如此,为了实际应用而对蛋白质进行工程改造,仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。 美国伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)提出了一个通用的自主酶工程平台,集成了大型语言模型与生物制造自动化,为医药、生物技术等多个行业带来了快速进步的新范式。
不用抗生素也能抗菌!AI设计新型蛋白质抵御细菌耐药性|Nature子刊
借助AI,新型蛋白质合成周期大幅降低! 这些蛋白质还能有效抵抗像大肠杆菌这类抗生素耐药细菌。 一项来自澳大利亚的研究发现,像大肠杆菌这类致病菌会通过ChuA蛋白 (细菌中的一种外膜蛋白)从宿主血红蛋白中“偷”血红素获取生长所需的铁。
登《Cell》,中科院高彩霞等开发AiCE:一种AI蛋白质工程通用策略
编辑丨&蛋白质工程长期受限于低成功率与高成本,理想的蛋白质工程策略需要以最少的工作量实现最佳性能。 当前基于 AI 的蛋白质工程技术通常计算量大,因此迫切需要更易于使用且用户友好的替代方案,这些方案需要保持预测的准确性并在研究社区推广使用。 中国科学院高彩霞团队开发的 AiCE(AI-informed constraints for protein engineering)框架通过将结构和进化约束整合到通用反向折叠模型中,实现了快速高效的蛋白质进化,无需专门训练。
MIT自主科学发现系统SPARKS:已独立发现两条全新蛋白质设计法则
编辑 | 萝卜皮人工智能(AI)的进步有望实现自主科学发现,但大多数系统仍在重复训练数据中潜藏的知识。 几个月前,麻省理工学院(MIT)的 Markus J. Buehler 和 Alireza Ghafarollahi 推出了自主科学发现模型 SPARKS。
量化单个细胞中表达的一半蛋白质组,质谱技术最新进展推动SCP发展
编辑丨coisini单细胞蛋白质组学(single-cell proteomics,SCP)是研究单个细胞内蛋白质表达多样性的研究领域。 自 2020 年以来,蛋白质组学在可达到的灵敏度方面实现了超过 100 倍的提升,这一成就得益于质谱仪设计的一系列改进以及结合机器学习的数据处理算法。 SCP 有潜力扩展现有分析工具集,但在吞吐量和蛋白质组深度方面仍受到限制。
仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架
编辑丨coisini机器学习在蛋白质发现领域展现出深远的潜力,相关工具已快速应用于科学流程的辅助与加速。 当前,AI 辅助的蛋白质设计主要利用蛋白质的序列和结构信息,而为了描述蛋白质的高级功能,人们以文本形式整理了海量知识,这种文本数据能否助力蛋白质设计任务尚未得到探索。 为了填补这一空白,来自加州大学伯克利分校(UC Berkeley)、加州理工学院(California Institute of Technology)等机构的研究者提出了一个利用文本描述进行蛋白质设计的多模态框架 ——ProteinDT。
53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍
编辑丨&微生物是驱动元素循环的引擎,它们分泌蛋白质以寻求生活环境。 现阶段还缺乏有效的计算方法来研究分泌蛋白。 表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。
比Rosetta快250倍,亲和力提升百倍,David Baker开发原子上下文条件蛋白序列设计新工具
编辑 | 萝卜皮小分子、核苷酸和金属离子条件下的蛋白质序列设计,对于酶和小分子结合剂以及传感器设计至关重要。 但是,当前最先进的深度学习序列设计方法无法对非蛋白质原子和分子进行建模。 华盛顿大学的 Cameron Glasscock、David Baker 团队提出了一种基于深度学习的蛋白质序列设计方法,称为 LigandMPNN,该方法可以模拟生物分子系统的所有非蛋白质成分。
活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%
编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要,但现有模型面临过拟合导致准确率低或泛化能力差的问题。 以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K(m))。 与以前的基线模型相比,CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。
生信工具评测方法:基于蛋白质对的计算机预测工具评估
编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。 存在多种功能注释方法,而且它们的数量一直在增长,尤其是随着深度学习技术的发展。 但是,目前尚不清楚这些工具是否真的具有预测性。
原子级精确,David Baker团队开发RFdiffusion变体对抗体进行从头设计
编辑 | 萝卜皮抗体在现代医学中发挥着核心作用,但目前还没有完全在计算机中设计与特定表位结合的新型抗体的方法。 相反,抗体发现目前依赖于动物免疫或随机文库筛选方法。 华盛顿大学 David Baker 团队证明,结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选,可以生成抗体可变重链(VHH)和单链可变片段(scFv),以原子级精度结合用户指定的表位。
基于药效团与GPT从头生成分子,北大开发TransPharmer助力药物发现
编辑 | 萝卜皮深度生成模型推动了药物发现,但生成的化合物通常结构新颖性有限,限制了药物化学家的灵感。 为了解决这个问题,北京大学的研究人员开发了 TransPharmer,这是一种生成模型,它将基于配体的可解释药效团指纹与基于生成预训练 Transformer(GPT)的框架相结合,用于从头生成分子。 TransPharmer 在无条件分布学习、从头生成和药效团约束下的骨架构建方面表现出色。
90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台
编辑丨&功能蛋白质组学为癌症机制提供了关键见解,有助于发现新的生物标志物和治疗靶点。 为了充分利用他们整合的将近 500 份高质量抗体的精选组合,美国德克萨斯大学决定采用 LLM 驱动来使资源更高效。 他们推出了 DrBioRight 2.0,这是一个由最先进的大型语言模型提供支持的直观生物信息学平台。
首个强化生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025
编辑 | ScienceAI近期,上海交通大学医学院张海仓课题组联合中原人工智能产业技术研究院与中国科学院计算技术研究所,提出了一项名为AbNovo 的抗体设计新方法。 该方法基于强化学习与深度扩散模型,能够在多目标、多约束条件下实现抗体从头设计。 该研究以「Multi-objective antibody design with constrained preference optimization」为题发表在国际机器学习顶会ICLR2025上。
微软 BioEmu-1 推动药物研发:从“单帧画面”到“电影”,AI 精准预测蛋白质结构变化
微软研究院最新推出的AI模型BioEmu-1,能够预测蛋白质的动态变化,为生物医学和药物发现领域带来革命性进展。不同于AlphaFold的静态结构预测,BioEmu-1模拟蛋白质在不同构象间的转换,显著加快研究速度并降低成本。#生物医学# #AI技术#
每小时处理80,000个蛋白质,大卫·贝克、微软等发布Seq2Symm,实现蛋白质对称性精准预测
编辑 | 2049在生物系统中,蛋白质很少以单体形式发挥功能,它们通常需要组装成更高级的复合物。 这些复合物中,由多个相同蛋白质链通过非共价键相互作用形成的结构被称为同源寡聚体,它们的空间排布形成特定的对称性,这对蛋白质的稳定性、折叠和功能至关重要。 然而,从单条序列精确预测蛋白质可能形成的对称结构一直是一项挑战。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉