理论
分析近六十种科学模型,MIT:基础模型或学得物理现实的共同底层表征,附实验证据
编辑丨coisini人工智能经历了一次范式转变,从定制化的任务专用模型转向了通用型「基础模型」。 模型在大量多样化数据集上进行预训练,因此能够执行诸多未经明确训练的下游任务。 这种涌现能力的关键在于其表征能力:基础模型学习每个输入的紧凑潜在表征,使其在远超训练样本范围的数据上仍能表现出色。
当蛋白质组数据走向大规模计算,Frag’n’Flow给出组学流程的部署与扩展问题的解决方案
编辑丨%在蛋白质组学分析中,已有不少大模型发挥着它们各自的能力。 但基于质谱的大规模复杂数据集常会让桌面计算资源不堪重负,且需要手动配置分析。 FragPipe 是目前应用最广泛的蛋白质组分析平台之一,以速度快、定量准确著称,支持多种采集模式。
超越AlphaFold3,实现模型容量的规模化扩展,字节提出分子结构预测模型SeedFold
编辑丨coisini高精度生物分子结构预测对于结构生物学和药物发现至关重要,而构建基础模型最核心的环节之一在于确定模型规模化的技术方案。 折叠模型利用先验知识,在广泛的应用中展现出多功能性,包括结构生成、结合物设计、构象采样等等。 已有一些研究工作尝试探索折叠模型的规模化特性,但大多数折叠模型仍遵循 AlphaFold 的基本配置。
科研人福音!一键生成PPT和科研绘图,北大开源Paper2Any,全流程可编辑
你是否经历过这样的至暗时刻: 明明实验数据已经跑通,核心逻辑也已梳理完毕,却在面对空白的 PPT 页面时陷入停滞; 明明脑海里有清晰的系统架构,却要在 Visio 或 Illustrator 里跟一根歪歪扭扭的线条较劲半小时; 好不容易用 AI 生成了一张精美的流程图,却发现上面的文字是乱码,或者为了改一个配色不得不重新生成几十次……在内容生产的过程中,“写” 往往只占了一半,而将文字转化为结构图、流程图,再整理成演示用的 PPT,这个过程繁琐、耗时,且极度考验设计感。 为什么我们不能让 AI 像理解文字一样,理解我们的逻辑,并自动帮我们要展示的 “视觉物料” 准备好? 为了解决这一痛点,北京大学 DCAI 课题组 基于自动化数据治理 Agent 框架 DataFlow-Agent,推出了全新的多模态辅助平台 —— Paper2Any。
AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法,让端到端自动驾驶更高效
VLA 模型正被越来越多地应用于端到端自动驾驶系统中。 然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。 但现有的视觉 token 剪枝方法都不是专为自动驾驶设计的,在自动驾驶场景中都具有局限性。
KAN作者刘子鸣:AI还没等到它的「牛顿」
大家新年快乐! 今天和大家分享 KAN 作者刘子鸣最新发布的一篇博客。 过去的一年,我们见证了 Scaling Laws 持续发力,模型能力不断刷新天花板。
系统学习Deep Research,这一篇综述就够了
近年来,大模型的应用正从对话与创意写作,走向更加开放、复杂的研究型问题。 尽管以检索增强生成(RAG)为代表的方法缓解了知识获取瓶颈,但其静态的 “一次检索 一次生成” 范式,难以支撑多步推理与长期研究流程,由此催生了 Deep Research(DR)这一新方向。 然而,随着相关工作的快速涌现,DR的概念也在迅速膨胀并趋于碎片化:不同工作在系统实现、任务假设与评价上差异显著;相似术语的使用进一步模糊了其能力边界。
华北电力大学等开发基于AI的催化设计蓝图,跨材料的电化学通用设计框架
编辑丨%在日常生产中,时常能看到过氧化氢的影子,从消毒剂、医疗灭菌到环境清理和制造。 都有它发挥价值的地方。 但大多数双氧水仍通过需要大量能源的大规模工业工艺生产,仍需寻找相关的替代品。
LSTM提出者点赞,引力波探测高效工具,国内团队开发DCL-xLSTM
编辑丨coisini2015 年 9 月 14 日,人类首次直接探测到双黑洞并合引力波事件 GW150914,标志着引力波天文学迈入了新纪元。 经过十年发展,基于空间的引力波探测器预计将观测到被透镜化的引力波事件,为宇宙学和基础物理学研究提供新机遇。 然而,目前最先进的透镜化引力波识别方法虽然精度较高,但计算成本昂贵。
药物靶标不再停留在器官层级,首次在全身尺度解析药物结合的单细胞图谱
编辑丨&随着科研人员对生物系统的理解达到单细胞和高空间分辨率,药理学方法也必须跟上,以匹配这种精确度,理解药物作用。 目前,常用的临床检测只能显示药物在某个器官里大致浓度,但无法看清药物真正结合在哪些细胞上。 打个比方来说,药物在体内的去向常像被雾霾遮住的景象——一切都处在模糊的感知中,想要精确定位并不简单。
利用AI制作史前电子游戏,在DIY考古视频游戏之中的具身大模型
编辑丨&在当下的博物馆中,常能看到令人惊叹的画面:记载中的生物借助投影、AI 等技术,浮现在史物的表面。 这些音视频和数字解决方案早已成为展示文化遗产的一部分。 但直到现在,制作关于过去的沉浸式数字内容一直非常昂贵,并且需要专业人员。
VLM能否看清「分子世界」?人大联合清华、达摩院等机构发布首个微观空间智能基准MiSI-Bench
作者丨论文团队编辑丨ScienceAI空间智能(Spatial Intelligence)赋予了智能系统感知、解释物理世界并与之交互的能力,是通往通用人工智能(AGI)的重要基石。 尽管当前的视觉语言模型(VLM)在一些宏观视觉任务上展现了潜力,但近期的研究表明,它们在处理三维空间关系、精确数值估计(如距离和尺寸)以及视角转换等任务时仍然面临巨大挑战。 如果说宏观世界的空间推理是 VLM 尚未攻克的「高地」,那么由原子和分子构成的微观世界则是一片完全不同的「盲区」。
模仿人类直觉的AI,化学本体驱动的反应路径搜索新范式,用知识结构替代暴力搜索
编辑丨&化学反应是化学键的断裂和形成,这是创造新技术的基础。 在发现和开发新的化学反应过程中,时间与精力的双重消耗是研究人员不可避免的头疼问题。 一个分子从反应物到产物,中间可能存在数量巨大的反应路径。
打通计算设计与实验执行闭环,微软、北大、上海交大联合提出科学推理模型QFANG
编辑丨coisini有机合成是分子创新的基础引擎,能够创造出多种先进功能分子。 尽管现代算法能够在计算机中设计数百万种新颖分子,但分子的实际合成仍是主要瓶颈。 这一过程通常需要密集的资源投入,并高度依赖于化学家在多年实践中积累的隐性知识与专业直觉。
最火、最全的Agent记忆综述,NUS、人大、复旦、北大等联合出品
在过去两年里,记忆(Memory)几乎从 “可选模块” 迅速变成了 Agent 系统的 “基础设施”:对话型助手需要记住用户习惯与历史偏好;代码 / 软件工程 Agent 需要记住仓库结构、约束与修复策略;深度研究型 Agent 需要记住已阅读的证据链、关键假设与失败路径,没有 memory 的智能体难以跨任务保留有效经验,难以稳定维护用户偏好与身份设定,也难以在长周期协作中保持行为一致、避免反复犯同样的错误。 与此同时 Memory 概念在迅速膨胀、也在迅速碎片化:很多论文都声称自己在做 “agent memory”,但实现方式、目标假设、评价协议差别巨大,多术语并行又进一步模糊了边界。 在这样的背景下,来自新加坡国立大学、中国人民大学、复旦大学、北京大学等顶级学术机构共同撰写并发布了百页综述《Memory in the Age of AI Agents: A Survey》,尝试用统一视角为快速扩张、却日益碎片化的 “Agent Memory” 重新梳理技术路径。
智能体如何学会「想象」?深度解析世界模型嵌入具身系统的三大技术范式
长期以来,具身智能系统主要依赖「感知 - 行动」的反应式回路,缺乏对未来的预测能力。 而世界模型的引入,让智能体拥有了「想象」未来的能力。 具身智能机器人通过世界模型想象抓杯子任务那么关键问题来了:世界模型应该如何「放进」具身系统中?
谷歌、英伟达、OpenAI在列,美国能源部宣布与24家机构达成协议,共同推进「创世纪计划」
编辑丨coisini上个月,美国总统特朗普签署了一项行政命令,启动了「创世纪计划(Genesis Mission)」,该计划指示能源部及其他科学机构积极部署人工智能。 今天,美国能源部宣布与 24 家有意合作的机构达成协议,共同推进「创世纪计划」这一历史性国家项目,利用人工智能的力量加速科学发现。 产业界代表与能源部部长 Chris Wright、能源部科学副部长兼创世纪计划主任 Darío Gil 博士、白宫科技政策办公室主任 Michael Kratsios 在白宫共同启动了人工智能技术公私合作创新伙伴关系,旨在建设可扩展的国家基础设施,以前所未有的速度拓展科学边界,确保全美共享人工智能发展成果。
UniEdit:首个大型开放域大模型知识编辑基准
随着大语言模型(LLM)的广泛应用,它们在医疗、金融、教育等关键行业扮演着愈发重要的角色。 然而,一个被忽视的现实是:大模型的知识并不会自动更新,更不总是准确。 当模型输出过时信息、错误事实甚至自信满满的“胡说八道”时,如何快速、精准、低成本地纠正它?
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉