AI在线 AI在线

理论

原子级精确,David Baker团队开发RFdiffusion变体对抗体进行从头设计

编辑 | 萝卜皮抗体在现代医学中发挥着核心作用,但目前还没有完全在计算机中设计与特定表位结合的新型抗体的方法。 相反,抗体发现目前依赖于动物免疫或随机文库筛选方法。 华盛顿大学 David Baker 团队证明,结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选,可以生成抗体可变重链(VHH)和单链可变片段(scFv),以原子级精度结合用户指定的表位。
3/18/2025 11:58:00 AM
ScienceAI

导致AI项目失败的11种战略疏忽和错误

企业正在AI工具、服务和内部战略上投入大量资金。 但遗憾的是,大额支出并不能保证成功。 “AI无处不在——正在改变行业,重塑工作流程,并承诺带来无限可能的未来,”技术咨询公司Searce的应用AI副总裁Paul .
3/18/2025 11:05:05 AM
Bob Violino

深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

论文的一些巧思1. 人开车其实并没有最优解,请问如何确定学习时的参考数据呢?开车其实也是多种多样的,然后你模仿学习本质上就是告诉他你只能这样做,你做了别的那个mass loss还会惩罚他。 其实就是我们说的,我们其实就不能通过模仿来做。
3/18/2025 10:29:48 AM
自动驾驶之心

LLM核心损失函数深度剖析——KL散度与交叉熵损失

在深度学习和机器学习领域,损失函数是模型优化的核心工具之一。 它不仅决定了模型的训练方向,还直接影响模型的性能和泛化能力。 随着大语言模型(LLM)的兴起,对损失函数的理解和应用变得更加重要。
3/18/2025 10:28:32 AM
Goldma

ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资

OpenAI 又有重量级员工出走! 这次是后训练负责人、研究副总裁 William Fedus。 今天凌晨,Fedus 在 X 上发表了一则公开离职信,讲述了他离职的原因以及今后的去向。
3/18/2025 9:26:22 AM
机器之心

新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。 它以标准多头注意力(MHA)为基准,对其中的value缓存处理过程进行了调整,实现了更少的内存占用。
3/18/2025 9:23:22 AM
量子位

8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源

超低成本图像生成预训练方案来了——仅需8张GPU训练,就能实现近SOTA的高质量图像生成效果。 划重点:开源。 模型名为LightGen,由港科大Harry Yang团队联合Everlyn AI等机构打造,借助知识蒸馏(KD)和直接偏好优化(DPO)策略,有效压缩了大规模图像生成模型的训练流程。
3/18/2025 9:21:31 AM
量子位

陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目

大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
3/18/2025 9:19:26 AM
量子位

一文读懂:模型上下文协议(MCP)

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型上下文协议(MCP)。 随着人工智能迈向更复杂的应用场景,单一模型的局限性逐渐显现,而多模型协同与上下文感知的需求日益迫切。 从对话系统需要理解用户的历史语境,到跨模态任务要求无缝整合文本、图像等多源数据,AI 的发展正呼唤一种全新的协作范式。
3/18/2025 9:10:00 AM
架构驿站

技术领导者如何利用AI克服十大采购挑战

然而,软件采购决策通常需要三到六个月——甚至更长时间——才能最终确定。 在科技领域,这简直是漫长无比;等到交易签署时,市场条件可能已经改变,新的竞争对手已经出现,或者解决方案本身已经升级。 难怪北美90%的IT高管认为软件采购和供应商选择是一个痛点。
3/18/2025 9:00:00 AM
D1net编译

刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio

OpenAI又痛失一员大将。 刚刚,后训练副总William Fedus官宣离职OpenAI,将创办一家AI发现材料创业公司。 对此OpenAI表示:「OpenAI将会对Fedus新公司进行投资并建立合作伙伴关系」。
3/18/2025 8:58:13 AM
新智元

CAIO正在脱颖而出 不再在CIO帐下听令

2016年,AI领域最著名的研究者之一安德鲁·吴(Andrew Ng)撰写了关于在公司中设立首席AI官角色的好处,以及这一角色应具备的特点和职责的文章。 当时,这一想法似乎有些牵强,认为除了少数特定行业之外,其他企业也需要设立CAIO。 但近年来,随着GenAI的兴起,智能工具的使用量增加,CAIO角色已逐渐成为众多行业关键的技术高管职位。
3/18/2025 8:30:00 AM
Ramos

豆包文生图技术报告发布!数据处理、预训练、RLHF全流程公开

今天,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。 该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。 本文将呈现其中精华内容,报告完整版可通过下方链接获取:技术展示页:: Seedream 2.0 于 2024 年 12 月初在豆包 APP 和即梦上线,已服务上亿 C 端用户,并成为国内许多专业设计师辅助创作的首选模型。
3/18/2025 8:00:00 AM
豆包大模型团队

实战攻略:使用KubeMQ简化多LLM集成流程

译者 | 核子可乐审校 | 重楼将多个大语言模型集成至应用程序当中往往是项艰巨的挑战,各类不同API及通信协议的协同处理,以及如何确保请求路由的复杂性难题往往令人望而生畏。 好在可以使用消息代理与路由机制更优雅地解决此类问题,在解决痛点的同时实现多个关键优势。 本文将向大家介绍具体操作步骤。
3/18/2025 8:00:00 AM
核子可乐

DeepSeek 开源 3FS,一个文件系统而已,有啥值得吹的?

有人说,deepseek一个搞AI的公司,不干正事,开源一个文件系统,有啥值得吹的。 今天来简单聊聊3FS,包懂。 3FS是什么?3FS,Fire-Flyer File System,是一个用C 写的高性能分布式文件系统。
3/18/2025 7:40:00 AM
架构师之路

AAAI 2025|Portcullis —— 面向第三方大型语言模型的可信隐私保护网关

在大模型浪潮的推动下,企业和个人的数据安全面临前所未有的挑战。 抖音集团安全研究团队推出Portcullis ——针对大模型的隐私保护网关,旨在为第三方大型语言模型(LLM)推理服务提供可控可信的隐私防护。 该工作成果 《Portcullis : A Scalable and Verifiable Privacy Gateway for Third-Party LLM Inference》已被人工智能领域的顶级会议AAAI 2025以Oral报告的形式接收。
3/18/2025 7:00:00 AM
安全研究团队

突发!百川智能两位联合创始人出走,一位正在走离职手续

出品 | 51CTO技术栈(微信号:blog51cto)刚刚收到消息,大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。 其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。 另据知情人士称,焦可和陈炜鹏两人都已经分别开始AI领域的创业。
3/17/2025 3:59:19 PM

无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

编辑丨ScienceAI在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。 传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。 然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。
3/17/2025 3:08:00 PM
ScienceAI