AI在线 AI在线

西湖大学

西湖大学发布SaprotHub,让生物学家能够轻松训练调用蛋白质语言模型

作者 | 论文团队编辑 | ScienceAI如同人类拥有语言,生命世界也有一套由氨基酸序列构成的「分子语言」—— 蛋白质 。 近年来,人工智能领域的蛋白质语言模型(PLMs)展现出解码这套语言的强大能力,能够精准预测蛋白质的结构与功能。 然而,这些尖端模型的训练与使用,往往需要深厚的机器学习专业知识和编程能力,这在 AI 开发者与广大生物学家之间形成了一道鸿沟。
10/28/2025 2:25:00 PM
ScienceAI

从掩码生成到「再掩码」训练:RemeDi让扩散语言模型学会自我纠正与反思

近期,扩散语言模型备受瞩目,提供了一种不同于自回归模型的文本生成解决方案。 为使模型能够在生成过程中持续修正与优化中间结果,西湖大学 MAPLE 实验室齐国君教授团队成功训练了具有「再掩码」能力的扩散语言模型(Remasking-enabled Diffusion Language Model, RemeDi 9B)。 在扩散去噪的多步过程中,通过进行再掩码 SFT 和 RL 训练,为每个 token 输出一个去掩码置信度,RemeDi 能够从序列中已经生成的内容中识别无法确定的位置进行再掩码(remask),从而修正错误内容并提升文本质量,在各方面都超越了现有的扩散语言模型。
10/16/2025 11:02:00 AM
机器之心

首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%

DeepScientist团队 投稿. 量子位 | 公众号 QbitAI人类科学家三年的工作量,如今AI两周就能轻松搞定! 最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。
10/8/2025 7:24:27 PM
衡宇

无需训练,即插即用:西湖大学发布世界模型WorldForge,让普通视频模型秒变「世界引擎」

自 Sora 亮相以来,AI 视频的真实感突飞猛进,但可控性仍是瓶颈:模型像才华横溢却随性的摄影师,难以精准执行 “导演指令”。 我们能否让 AI 做到:仅凭一张静态照片,就能 “脑补” 出整个 3D 空间,生成一段围绕主体的 360° 环绕视频? 现有的视频能否进行重新运镜,实现推、拉、摇、移等复杂的电影级镜头调度?
9/23/2025 11:25:00 AM
机器之心

AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈

审稿不用再等了,高质量的AI审稿平台来了! 如今,AI生成的论文数量激增,如何从海量的AI “水文”中筛选出真正高质量的研究成果,已经成为学术界必须直面的难题。 为此,西湖大学自然语言处理实验室推出了首个AI生成学术成果的开放预印本平台AiraXiv,以及首个模拟人类专家思考链的AI审稿人系统DeepReview。
9/13/2025 2:10:27 PM
梦晨

精度高,速度快!西湖大学团队开发端到端电子显微镜图像分析深度学习模型

编辑 | 萝卜皮冷冻电镜拍图虽然很高清,但是 AI 解结构却像新手拼乐高——步骤繁琐易跑偏,算力烧钱还挑数据。 为了应对这些挑战,西湖大学与新加坡国立大学的研究人员提出了 end-to-end and efficient CryoFold(E3-CryoFold),这是一种支持端到端训练和一次性推理的深度学习方法。 E3-CryoFold 使用三维和序列 Transformer 从密度图和序列中提取特征,并使用交叉注意力模块整合这两种模态。
7/7/2025 10:19:00 AM
ScienceAI

​西湖大学研发 AI 文本检测模型,助力辨别人工智能创作

近日,西湖大学的研究团队成功研发出一种能够检测人工智能生成文本的新模型。 该团队的负责人张岳教授在接受采访时表示,这一模型采用无监督算法,可以有效判断一篇文章是否由 AI 创作,尤其在人工智能迅速发展的当下显得尤为重要。 张岳教授提到,随着科技的不断进步,AI 在创作领域的应用日益普及。
3/13/2025 5:06:00 PM
AI在线

AI 玩手机越玩越 6,西湖大学发布会自我进化的智能体 AppAgentX

西湖大学 AGI 实验室张驰团队推出了 AppAgentX—— 一款具备自我进化能力的 GUI 代理。它能够在不断执行任务的过程中学习并优化自身的行为模式,实现更加高效的操作。
3/9/2025 1:12:19 PM
汪淼

如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机,每时每秒都在接收、分析和处理来自环境中的不同信息:外界信息通过细胞内高度并行的信号转导途径进行分析和处理,进而以预定义的方式从「存储设备」(即 DNA)中读取信息(基因的表达)或写入指令(DNA 修饰和编辑),指导自身或周围细胞对环境信息做出响应。一直以来,如何有效利用生物体本身的计算能力,通过对生物体进行改造使之能够执行人类给定的计算任务,并由此开发出基于生物系统的新概念计算机都是计算机科学与生物技术领域交叉融合的热点问题。近期,来自国防科技大学、西湖大学、浙
8/1/2024 4:06:00 PM
ScienceAI

首次,西湖大学用蛋白质语言模型定向改造碱基编辑器,登Cell子刊

编辑 | ScienceAI在基因组编辑领域,单碱基编辑器通过将可编程的DNA结合蛋白与碱基修饰酶融合,实现在不引起DNA双链断裂的情况下,对基因组中特定碱基进行精确修改。尽管依赖于胞嘧啶(C)碱基编辑器(CBE)或腺嘌呤(A)碱基编辑器(ABE)介导的脱氨反应,这些编辑器能够实现C到胸腺嘧啶(T)或A到鸟嘌呤(G)的突变,但它们在诱导所有类型的点突变,尤其是颠换突变方面仍存在局限性。近期,西湖大学团队在《Molecular Cell》上发表了一篇题为「Protein language models-assiste
5/7/2024 6:45:00 PM
ScienceAI

4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源

编辑 | ScienceAI蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用Foldseek来处理蛋白质结构,将其编码成一维的离散token,并与传统的氨基酸进行结合,形成了结构感知词表(Structure-aware Vocabulary),以此将结构信息嵌入到模型输入中,增强模型的表征能力。在预训练上,论文使用了目
4/19/2024 3:38:00 PM
ScienceAI
  • 1