AI在线 AI在线

新一代AI科学家Kosmos问世:一天完成六个月科研工作量,每次分析定价200美元

编辑丨coisini今年 5 月,初创公司 FutureHouse 推出自动化科研多智能体系统 Robin,能够完整实现人工智能驱动的科学发现。 现在,该系统迎来了重大升级,新一代 AI 科学家 Kosmos 正式问世。 技术报告:,FutureHouse 成立了一家新公司 Edison Scientific 来运营管理 Kosmos。
图片

编辑丨coisini

今年 5 月,初创公司 FutureHouse 推出自动化科研多智能体系统 Robin,能够完整实现人工智能驱动的科学发现。

现在,该系统迎来了重大升级,新一代 AI 科学家 Kosmos 正式问世。

图片

技术报告:https://arxiv.org/abs/2511.02824

值得注意的是,FutureHouse 成立了一家新公司 Edison Scientific 来运营管理 Kosmos。FutureHouse 表示此举是因为自 Robin 上线以来,提升使用限额的请求应接不暇,需采用营利性资金推进相关事务,同时将非营利资金专用于基础研究。

图片

目前,Kosmos 每次分析定价 200 美元(每次分析消耗 200 积分,1 美元 / 积分),学界用户可享免费额度。

新一代 AI 科学家 Kosmos

早期版本的 AI 科学家(例如 Robin)主要受限于海量信息整合能力。由于语言模型存在上下文长度限制,导致 AI 科学家在推进研究时只能进行有限步数的推演和逻辑跃迁,这制约了其实现科学发现的复杂度。

Kosmos 的核心创新在于采用结构化世界模型,能高效整合数百条智能体轨迹中提取的信息,并在处理数千万 tokens 量级的内容时始终保持特定科研目标的连贯性。

图片

Kosmos 单次运行即可完成 1500 篇论文的解析并执行 42000 行分析代码,其处理规模远超当前已知的任何智能体系统。

图片

因此,Kosmos 能够执行比 Robin 等前代工具复杂得多的分析任务。

测试用户评估称,Kosmos 一天内完成的工作量相当于他们六个月的科研投入,且经验证其 79.4% 的研究结论准确可靠。

Kosmos 还与学术测试伙伴合作,在神经科学、材料科学和统计遗传学等领域取得七项突破性发现。

值得一提的是,Kosmos 能够确保每项结论都能通过平台追溯至启发该结论的特定代码段或文献片段,使研究报告始终具备完全可审计性。

突破性发现

技术报告详述了 Kosmos 实现的七项科学发现,其中有三项 Kosmos 独立复现了人类科学家的既往研究成果:

发现一:通过代谢组学数据,Kosmos 复现了当时尚未正式发表的手稿观点,确认核苷酸代谢是低温处理小鼠大脑中最主要的改变通路。相关预印本在 Kosmos 完成分析后才发布于 BioRxiv。

发现二:在材料科学领域,Kosmos 成功复现了其所有组件大模型训练数据截止期后发布的预印本结论,且运行时未调用该文献。Kosmos 复现了关于热退火(thermal annealing)过程中绝对湿度是钙钛矿太阳能电池效率决定性因素的发现,精准识别出约 60g/m³ 以上导致器件失效的「致命阈值」。

发现三:Kosmos 自主推导出与 Piazza 等人报告的相同的跨物种神经元连接数学规律。需说明的是,尽管系统运行时未检索该预印本,但该文献发布时间早于模型训练数据截止期。

另有四项发现作出了原创贡献:

发现四:通过公开全基因组关联研究(GWAS)和蛋白质数量性状位点(pQTL)数据,Kosmos 进行了孟德尔随机化分析,为循环超氧化物歧化酶 2(SOD2)高水平可能因果性地缩短心肌 T1 时间并减轻心肌纤维化,提供了统计证据。该发现将 SOD2 在心肌纤维化中的作用从小鼠研究推进至人类临床关联层面。

发现五:利用多组学与统计遗传学公开数据,Kosmos 提出了单核苷酸多态性(SNP)降低 II 型糖尿病患病风险的创新分子机制。

发现六:基于阿尔茨海默症患者蛋白质组学数据,Kosmos 开发了创新分析方法,可解析神经元内 tau 蛋白累积的分子事件序列。

发现七:在探索衰老过程中神经元脆弱性机制时,Kosmos 对幼龄与老龄小鼠单核转录组数据进行了大规模无偏探索,发现内嗅皮层神经元(阿尔茨海默症中最早出现 tau 蛋白累积的部位)随年龄增长出现磷脂翻转酶基因表达下调。这种表达下调可能导致细胞表面磷脂酰丝氨酸「eat me」信号暴露增加,从而触发小胶质细胞清除这些脆弱神经元。最关键的是,研究团队在人类阿尔茨海默症单细胞 RNA-seq 数据集中验证了这一发现。

此外,研究团队还发现感知工作量(如六个月的科研投入)与系统分析深度呈线性增长,形成了 AI 科研领域的首个「推理时扩展定律」。

图片

不过,实际经验表明:系统运行时间越长,越容易陷入研究迷宫 —— 追逐虚假的统计相关性,或是「钻进」没有前景的研究路径。研究团队认为,若将扩展定律推至逻辑极致,则可能会发现功效拐点:当分析深度超过某个临界值,Kosmos 的产出价值反而随深度增加而递减。要突破这一局限,可能需要对底层语言模型进行深度改进。

参考内容:https://edisonscientific.com/articles/announcing-kosmos

相关资讯

检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了

这是 AI 智能体在大部分科学研究中超越人类的第一个案例,或许会彻底改变人类与科学文献互动的方式。最近一段时间,有关 AI 科学家的研究越来越多。大语言模型(LLM)有望帮助科学家检索、综合和总结文献,提升人们的工作效率,但在研究工作中使用仍然有很多限制。对于科研来说,事实性至关重要,而大模型会产生幻觉,有时会自信地陈述没有任何现有来源或证据的信息。另外,科学需要极其注重细节,而大模型在面对具有挑战性的推理问题时可能会忽略或误用细节。最后,目前科学文献的检索和推理基准尚不完善。AI 无法参考整篇文献,而是局限于摘要
9/12/2024 2:16:00 PM
机器之心

​前谷歌 CEO 投资的初创公司发布240亿参数化学推理模型,准确率超越多种领先模型

在人工智能领域,大模型的研究不断进展,尤其是在推理能力的提升上。 最近,由前谷歌 CEO 埃里克・施密特投资的初创公司 FutureHouse,开源了一个名为 ether0的化学任务推理模型,参数规模高达240亿。 这一模型在不需要额外领域预训练的情况下,通过后训练技术,展现出强大的化学领域能力,尤其是在数据需求上相比于传统领域专用模型显著减少。
6/17/2025 4:01:40 PM
AI在线

首位“AI 科学家”问世:已独立生成 10 篇学术论文,还顺手搞了 AI 审稿人

史上首位“AI 科学家”,横空出世!一登场就一口气生成了十篇完整学术论文。▲ AI 生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码,到在 GPU 上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI 科学家”自动搞定。每篇论文的成本约为 15 美元(约 107.62 元)。这就是第一个用于自动化科学研究和开放式发现的综合 AI 系统,The AI Scientist。来自 Transformer 作者之一 Llion Jones 的创业公司:Sakana AI。而且!这公司搞的事情
8/13/2024 1:50:21 PM
汪淼
  • 1