AI在线 AI在线

万用科研助手:浙大推出SciToolAgent构建多工具协同科研平台

编辑丨@现代科研离不开智能工具,从分子模拟到数据统计,从文献追踪到实验设计,研究者每天要在不同的软件和平台间来回切换。 然而这些工具往往互不兼容,导致科研工作流程支离破碎。 而且更尴尬的是,即使是最新的 LLMs,在调用多种科研工具时也会频繁出现任务进度卡死,无法顺利完成端到端的复杂任务。
图片

编辑丨@

现代科研离不开智能工具,从分子模拟到数据统计,从文献追踪到实验设计,研究者每天要在不同的软件和平台间来回切换。然而这些工具往往互不兼容,导致科研工作流程支离破碎。

而且更尴尬的是,即使是最新的 LLMs,在调用多种科研工具时也会频繁出现任务进度卡死,无法顺利完成端到端的复杂任务。

在这种背景下,浙江大学提出了一个由大型语言模型驱动的智能体 SciToolAgent,通过基于图谱的检索增强生成来实现智能化的工具选择与执行,可以很好地自动化复杂科学工作流。

这项研究以「SciToolAgent: a knowledge-graph-driven scientific agent for multitool integration」为题,于 2025 年 8 月 20 日发布在《Nature Computational Science》。

图片

论文链接:https://www.nature.com/articles/s43588-025-00849-y

知识图谱驱动的任务

SciToolAgent 的核心是一个 知识图谱(Knowledge Graph, KG),通过基于图谱的检索增强生成来实现智能化的工具选择与执行。

研究者通过知识图谱建立了任务语义与工具功能之间的对应关系,相当于为 AI 配备了「科研语义大脑」。当面对复杂任务时,系统不会盲目尝试工具,而是根据图谱进行合理调度。

图片

图 1:SciToolAgent 概览。

与传统的多智能体架构相比,SciToolAgent 避免了任务割裂和上下文丢失。它不仅能理解「单点指令」,还能维持整个科研任务链条的逻辑一致性。例如,在材料学模拟中,它能先调用数据库检索材料参数,再衔接分子动力学工具,最后输出可供进一步实验的预测结果。

跨领域泛化验证

先前的概述中已提到,即使是最新提出的 LLM,也会面临任务调用时的卡死风险,所以对于 SciToolAgent 来说,性能的评估将会是研究团队最为关注的方面。

SciToolEval 的评估数据集包含 531 个跨领域科学问题,分两级:Level-1(152 题,单工具)和Level-2(379 题,多工具),通过率、工具规划准确率和最终答案准确率被作为评估指标。

与最先进的基线(ReAct, Reflexion, ChemCrow, CACTUS)相比,SciToolAgent 在所有评估指标和级别上均表现更优,在在解决多工具问题时优势尤其显著。

图片

图 2:不同代理和基础模型的比较结果。

为了验证泛化性,团队设计了覆盖物理、化学、材料学、生命科学的测试集。

相比单一 LLM agent,SciToolAgent 在复杂多步骤任务中完成率显著提高。相比单一 LLM agent,SciToolAgent 在复杂多步骤任务中完成率显著提高,这凸显了它在各个领域中的适应性。

举个例子来说,在化学任务中,普通 LLM agent 往往停留在「调用失败」或「缺乏上下文」的状态,而 SciToolAgent 则能完成参数查询、反应路径分析和模拟结果解释的完整流程。这种连贯性,正是知识图谱赋予的优势。

除此之外,研究团队还特意安排了 SciToolAgent 与传统单工具 agent、以及简单的 LLM+API 调用方式进行比较。结果显示,即便加上多智能体协作,仍存在上下文割裂、信息冗余的问题;SciToolAgent 则能在不同场景中维持高稳定性,说明它不只是「能用工具」,而是真正学会了「如何合理组合工具」。

小结

SciToolAgent 的突破点并非「性能暴涨一个数量级」,而是展示了一种新的科研工作模式:智能体能够在跨领域环境中自动泛化,不必依赖繁琐的人工微调。

AI 在科研中不必局限于「单点突破」,而可以成为「工具生态的整合者」。对研究者来说,未来或许只需描述任务目标,AI 就能自动匹配并调用最合适的工具链条。

从更长远的角度看,这类知识图谱驱动的多工具智能体,可能成为科研数字化转型的关键枢纽。它们让 AI 从「擅长单一工具」成长为「懂得选择合适工具的科研助手」。而正是这种跨学科的泛化能力,为下一代科学研究平台打下基础。

相关资讯

与一支由虚拟科学家组成的 AI 团队共事是怎样的体验?

编辑丨%4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一生中最超现实的会议之一。 在一个名为 Virtual Lab 的系统的在线测试界面中,Montine 构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。 他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。
7/7/2025 10:11:00 AM
ScienceAI

智能科学实验室加速未来科学发现,首版仿真智驱实验室LabUtopia发布

编辑丨ScienceAI打破家庭场景「内卷」,机器人不仅能下厨,还要上实验台! LabUtopia把「智能科学实验室」搬进虚拟仿真器。 智能科学实验室新范式当前「AI 科学家」侧重虚拟推理、自动化实验室侧重机械执行,二者各擅其长却难以贯通。
7/14/2025 2:04:00 PM
ScienceAI

AI驱动的自主酶工程平台,底物偏好提升90倍,伊利诺伊大学新研究登Nature子刊

编辑丨&蛋白质是生命中的分子机器,在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。 但即使如此,为了实际应用而对蛋白质进行工程改造,仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。 美国伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)提出了一个通用的自主酶工程平台,集成了大型语言模型与生物制造自动化,为医药、生物技术等多个行业带来了快速进步的新范式。
7/16/2025 2:07:00 PM
ScienceAI
  • 1