AI在线 AI在线

基础

AI自主「发现」牛顿第二定律?北大概念驱动型发现系统AI-Newton问世

编辑丨coisini今天谈人工智能(AI)做科研已不再是新鲜事,但如果说 AI 自主「发现」了牛顿第二定律呢? 我们知道,AI 模型擅长识别数据模式并进行预测,但利用数据推导广义科学概念对 AI 来说仍然是一项挑战。 最近,《Nature》报道了一个由北京大学研究团队开发的概念驱动型发现系统 ——AI-Newton,该系统能够从原始数据中自主推导物理定律,无需人工监督或先验物理知识。
11/17/2025 6:06:00 PM
ScienceAI

填补多语言语音幻觉检测空白,CCFQA基准助力评估大模型跨语言与跨模态事实一致性

论文标题:CCFQA: A Benchmark for Cross-Lingual and Cross-Modal Speech and Text Factuality Evaluation(AAAI 2026)论文链接:::(MLLMs)在多语言环境中的日益普及,确保无幻觉的事实准确性变得尤为重要。 然而,现有评估可靠性的基准主要集中在以英语为主的文本或视觉模态,这导致在处理多语言输入(尤其是语音)时存在评估空白。 为弥补这一不足,哈尔滨工业大学社会计算与交互机器人研究中心知识计算组和鹏城实验室数据智能研究所联合发布跨语言跨模态事实性基准(CCFQA),以推动具备更可靠语音理解能力的MLLMs发展。
11/17/2025 3:06:00 PM
新闻资讯

把数学变成谜题:SAT 求解器如何让机器自动写出人类做不到的证明

编辑丨%Marijn Heule 近十年来致力于破解数学难题,倘若将他的工作写成小说,可能更像特工代号:空六边形、舒尔数 5、凯勒猜想、七维。 事实上,这些曾是几何学和组合数学中最顽固的问题之一,困扰了人们 90 年甚至更长时间。 Heule 使用了一种名为可满足性(SAT)的计算方式将它们一一攻克。
11/17/2025 2:05:00 PM
ScienceAI

Koina:开源平台通过机器学习提升蛋白质组学数据分析效率,简化模型集成与应用

编辑丨&近几年来,蛋白质组学可谓是进入了「信息爆炸时代」。 单次实验可能生成上百GB的高维数据,这给传统分析工具带来了巨大压力。 而机器学习,尤其是深度学习技术,本应成为加速分析的利器。
11/14/2025 2:06:00 PM
ScienceAI

在SAIL看AI趋势 SAIL里藏了AI的流行密码

【颁奖图】每年盛夏,上海世博中心的WAIC(世界人工智能大会)总能点燃全球对AI的关注热情,而作为WAIC的核心引擎,SAIL评选则是这场科技盛宴的技术风向标。 自创办以来,SAIL始终聚焦AI领域最具突破性、引领性的技术成果与应用项目,通过对申报项目的筛选与展示,勾勒出AI技术演进的清晰脉络,也为产业界提供了观察未来趋势的重要窗口。 2025年的SAIL申报项目再度扩容,覆盖模型研发、科学智能(AI4S)、具身智能、算力基础、行业应用等五大核心领域,既有快手可灵 AI、通义万相等多模态大模型的最新进展,也有“伏羲”气象大模型、中石油油气勘探大模型等AI4S实践,更不乏人形机器人仿真平台、千万亿级光电 AI 芯片等硬核技术突破。
11/13/2025 6:18:00 PM
新闻资讯

AAAI 2026 | 教会视频扩散模型「理解科学现象」:从初始帧生成整个物理演化

作者 | 论文团队编辑 | ScienceAI近年来,Stable Diffusion、CogVideoX 等视频生成模型在自然场景中表现惊艳,但面对科学现象 —— 如流体模拟或气象过程 —— 却常常「乱画」:如图一所示,生成的流体很容易产生违背物理直觉的现象,比如气旋逆向旋转或整体平移等等。 上述问题的根源在于,这些模型缺乏对科学规律的内在理解。 它们学习到的只是像素分布,而非支配这些分布的动力学方程。
11/12/2025 2:17:00 PM
ScienceAI

AI取代实验室的「最后一步」:LDBT范式以学习为起点重构生物设计流程

合成生物学定义为设计-构建-测试-学习循环。 最近机器学习的进步正在改变这一格局;因此,我们建议「学习」可以先于「设计」。 编辑丨&在合成生物学实验室中,研究者设计基因序列、构建质粒、转化菌株、验证功能——这一整套流程被称为 DBTL 循环:Design – Build – Test – Learn。
11/12/2025 2:16:00 PM
ScienceAI

火山引擎发布豆包编程模型,多项权威评测成绩国内领先

11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。 该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。 同时,豆包编程模型采用分层定价模式与全量透明 Cache 能力,综合使用成本比行业平均水平降低 62.7%。
11/11/2025 5:25:00 PM
新闻助手

江大团队融合对比学习与超图建模,预测1.7万条食物–微生物–疾病关联,AUPR提升8.9%

编辑丨%在零食界,总会有些心照不宣的默契:比如说掉在地上三秒内捡起来就没事的三秒定律,或者说不干不净吃了没病的俗语。 虽然话这么说,但是随着这些食物而进入身体的细菌,真的有在潜移默化地改变我们体内的微生物生态,影响身体健康。 这个被称为「食物–微生物–疾病」(Food–Microbe–Disease, FMD)网络的世界,复杂得远超想象,并且现有的对此预测方法仍然有限。
11/11/2025 2:19:00 PM
ScienceAI

数据效率显著提升,UC伯克利实现预训练机器学习势函数的跨泛函迁移学习

作者 | 论文团队编辑 | ScienceAI原子级模拟为材料性质的预测与虚拟筛选提供了重要手段,其核心在于准确描述体系的势能面(PES)。 相比于传统 PES 的计算所依赖的方法——从头算量子化学方法(如密度泛函理论 DFT)与经验力场而言,机器学习原子间势函数可以更好权衡精度与效率,通过从 DFT 数据中学习原子间相互作用,对 PES 进行准确构建。 近年来,随着数据和模型规模的扩大,基于数百万 DFT 计算训练的基座势能(foundation potentials, FPs)进一步展现出跨化学空间的泛化潜力,已被广泛用于声子谱预测、相图构建、催化筛选与分子动力学模拟等下游任务,为多尺度材料建模奠定了新的基础。
11/11/2025 2:08:00 PM
ScienceAI

UNSW、中科大苏高院等联合发布AtomWorld材料建模基准测试流程,以标准化评估突破大模型原子级空间推理能力瓶颈

作者 | 论文团队编辑 | ScienceAI在材料科学研究中,结构建模是探索材料特性与功能的起点,传统流程依赖研究者基于专业知识手动搭建晶体结构、调整原子排布,不仅耗时耗力,还受限于个人空间认知与操作经验。 当前,大语言模型(LLM)虽在文本理解与基础推理领域展现潜力,开始尝试应用于晶体生成、坐标解析等任务,但由于缺乏标准化评估体系,其对 3D 原子结构的空间推理能力 —— 如按指令精准执行原子添加、旋转、替换等操作 —— 始终无法被系统衡量,难以满足科研场景中自动化建模的实际需求。 为解决这一关键难题,近日,中国科学技术大学苏州高等研究院、澳大利亚新南威尔士大学(UNSW)等机构联合发布了「AtomWorld 材料建模基准测试流程」,以晶体学信息文件(CIF)这一标准格式为核心,首次构建了针对 LLM 晶体学基础技能的标准化评估框架,填补了大模型原子级空间推理能力评测的空白。
11/10/2025 2:16:00 PM
ScienceAI

MPI打造全球首个自动化叶绿体合成平台,模块化高通量系统加速可编程作物设计

编辑丨&俯视一洼碧绿的池塘——这抹绿意来自于其中繁衍兴盛的藻类家族。 其中的叶绿体,植物细胞的「光动力装置」,在默默地生产代谢之外,也吸引到了合成生物学的注意力。 叶绿体合成生物学有望通过改善质体的功能来推进光合作用生物。
11/10/2025 2:15:00 PM
ScienceAI

Nature | 颠覆性突破:大卫·贝克团队等用AI从头开始设计抗体,或将商用

图源:华盛顿大学蛋白质设计研究所编辑丨coisini在疾病的预防和治疗中,抗体药物发挥着至关重要的作用。 作为一种蛋白质治疗剂,全球现有超过 160 种抗体药物获批,其市场价值预计在未来 5 年内将达到 4450 亿美元。 以往,抗体发现主要依赖于免疫接种、随机库筛选或直接从患者体内分离抗体。
11/7/2025 5:59:00 PM
ScienceAI

拷问 MLLM 空间想象力:SpatialViz-Bench 新基准发布,程序化生成防“数据污染”,Gemini-2.5 Pro 也仅答对 44.66%

论文信息:-论文标题:SpatialViz-Bench: An MLLM Benchmark for Spatial Visualization-论文链接::本文是由中科院自动化所张海峰教授团队和伦敦大学学院汪军教授团队合作完成。 第一作者为王斯婷,现就读于中科院自动化所,研究方向是多模态大语言模型、面向物理交互的世界模型,第二作者为裴旻楠,现就读于中科院自动化所,研究方向是三维视觉算法的高性能计算,第三作者为孙罗洋,现就读于中科院自动化所,研究方向是高效大语言模型。 本文的通讯作者为爱丁堡大学博士后邓程,中科院自动化所张海峰教授,伦敦大学学院汪军教授。
11/7/2025 4:26:00 PM
新闻助手

“左右脑互搏”还是“协同作战”? Uni-MMMU评估「理解-生成」双向协同

解几何题时,你是否会先画一条辅助线来帮助思考? 创作一幅画时,你是否需要先理解光影和物理原理? 这种「理解」与「生成」的紧密协同,是人类智能的核心特征。
11/7/2025 2:49:00 PM
新闻资讯

ECAI 2025|基于语义增强的弱语义低资源语言机器翻译:让“难以翻译的文字”被理解

当下的神经机器翻译在主流语言间已接近人类水平,但在“弱语义 低资源”语言(如古文字、象形符号文字等)上仍面临巨大挑战。 此类语言不仅缺乏标准的平行语料,还因符号语义模糊、语境依赖强而极难有效建模,导致传统神经模型翻译在这些场景下表现不稳定、可解释性差。 如何在语义极弱、资源极少的条件下实现高质量翻译,是跨语言智能理解中的长期难题。
11/7/2025 2:37:00 PM
新闻资讯

AI预测细胞「未来命运」:Squidiff模型以扩散算法重建发育与药物响应轨迹

编辑丨&在显微镜下,研究者正在观察某个细胞的状态。 它可能正在分化、受药物作用,或者被辐射轻微损伤。 如果能预测它接下来会发生什么——会凋亡?
11/6/2025 3:26:00 PM
ScienceAI

新一代AI科学家Kosmos问世:一天完成六个月科研工作量,每次分析定价200美元

编辑丨coisini今年 5 月,初创公司 FutureHouse 推出自动化科研多智能体系统 Robin,能够完整实现人工智能驱动的科学发现。 现在,该系统迎来了重大升级,新一代 AI 科学家 Kosmos 正式问世。 技术报告:,FutureHouse 成立了一家新公司 Edison Scientific 来运营管理 Kosmos。
11/6/2025 3:24:00 PM
ScienceAI