智能体

SCIENCEBOARD：构建智能体驱动的科学探索新「环境」

大家好，我是肆〇柒。今天，我们来聊聊 SCIENCEBOARD，这是一个由香港大学、上海人工智能实验室、复旦大学、北京大学、南京大学、华东师范大学和耶鲁大学等，多所知名高校和研究机构共同打造的创新平台。它致力于在多域科学工作流中评估多模态自主智能体，为推动 AI 驱动的科学发现提供了全新的方法和工具。

6/27/2025 7:00:00 AM

肆零柒

一文彻底搞懂智能体Agent基于ReAct的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。它结合了人工智能技术（如机器学习、自然语言处理、计算机视觉等），能够独立或协作完成目标。基于大语言模型（LLM）的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。

6/27/2025 6:00:00 AM

AI大模型应用开发

Gartner 预测：市场冷静后，2027 年底超 40% 智能体（代理）AI 项目将被取消

Gartner 认为，今年以来愈演愈烈的 AI 智能体概念热潮在很大程度上是炒作的结果，很多项目的“智能体化”仅仅是品牌名称重塑。

6/26/2025 2:47:23 PM

溯波（实习）

首个面向科学任务、真实交互、自动评估的多模态智能体评测环境，ScienceBoard来了

第一作者孙秋实是香港大学计算与数据科学学院博士生，硕士毕业于新加坡国立大学数据科学系。主要研究方向为 Computer-using agents 和 Code intelligence，在 NLP 和 ML 顶会 ACL，EMNLP，ICLR，COLM 等发表多篇论文。本文的 OS-Copilot 团队此前已发布了 OS-Atlas、OS-Genesis 和 SeeClick 等同系列电脑智能体研究成果，被广泛应用于学术界与产业实践中。

6/26/2025 9:01:14 AM

提示词工程、RAG之后，LangChain：上下文工程开始火了！

AI 时代，你可能听说过提示词工程、RAG、记忆等术语。但是很少有人提及上下文工程（context engineering）。其实，这一术语并不新鲜，近两年很多智能体构建者一直在关注这个事情。

6/26/2025 7:00:00 AM

机器之心

无训练智能体蒸馏：AgentDistill 低成本高能效的智能进化方案

大家好，我是肆〇柒。在 AI 领域，大型语言模型（LLM）的蒸馏技术正以前所未有的速度发展，成为压缩模型规模、降低推理成本的关键手段。然而，现有的 LLM 智能体蒸馏方法却面临着高计算成本、泛化能力不足等诸多挑战。

6/25/2025 1:00:00 AM

肆零柒

谷歌 Google Cloud 向 Linux 基金会捐赠 A2A 智能体交互协议

Google Cloud 在 A2A 领域的下一步是通过与外部合作，制定一套更广泛的开放标准，丰富 A2A 协议的功能集。

6/24/2025 10:41:37 AM

溯波（实习）

微软刚发布Mu模型：支持Windows智能体，小参数跑出10倍性能

今天凌晨，微软在官网发布了创新小参数模型Mu。 Mu仅有3.3亿参数，但其性能可以比肩微软之前发布的小参数模型Phi-3.5-mini，体量却比它小10倍左右，并且在离线NPU的笔记本设备上，可以跑出每秒超过100 tokens的响应，这在小参数模型领域非常罕见。此外，Mu支持在Windows中设置智能体，可将自然语言指令实时转化为系统操作，例如，只需对着电脑说一句 “把鼠标指针调大一些，调整屏幕亮度”，智能体就能精准定位到相关设置项一键完成调整。

6/24/2025 9:08:31 AM

掌控 AI 智能体自主性：五级框架下的人机协作之道

大家好，我是肆〇柒，在AI飞速发展的时代，AI 智能体自主性已成为一个备受瞩目的焦点。一方面，它能够为我们带来前所未有的创新应用，极大提升工作效率和生活便利性；另一方面，若不当使用，也可能引发一系列难以预料的风险。随着大型语言模型（LLM）等前沿 AI 技术的飞速进步，AI 智能体的自主性不再是停留在科幻小说中的情节，它已逐渐走进现实，引起了大家的广泛关注和深入探讨。

6/23/2025 10:05:40 AM

肆零柒

ICML 2025 Oral | NAS老树开新花，NUS提出智能体超网，成本狂降55%

本文第一作者为张桂彬，新加坡国立大学25Fall计算机科学博士生；本文在南洋理工大学的王琨博士、上海人工智能实验室的白磊老师、和中国科学技术大学的王翔教授指导下完成。 LLM 智能体的时代，单个 Agent 的能力已到瓶颈，组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功。但 “天团” 不是人越多越好，手动设计既费力又不讨好，现有的智能体自动化方法又只会 “一招鲜”，拿一套复杂阵容应对所有问题，导致 “杀鸡用牛刀”，成本高昂。

6/23/2025 8:57:00 AM

7B智能体仅凭9个任务训练即超越R1！上交大打造AI-for-AI新范式

尽管人工智能（AI）在飞速发展，当前 AI 开发仍严重依赖人类专家大量的手动实验和反复的调参迭代，过程费时费力。这种以人为中心的方式已成为制约创新速度和通向通用人工智能（AGI）的关键瓶颈。为突破限制，AI-for-AI（AI4AI）应运而生。

6/23/2025 8:56:00 AM

世界模型版《模拟人生》：AI虚拟小人街头演讲拉票，GPT-4o选举获胜

当世界模型高度进化后，里面的「人」都在做些什么？有人会进行街头演说，吸引到了不少听众，小孩会和机器狗玩：有人会当街作案，警察前去抓捕，又有人会在大庭广众之下求婚：本周五，来自马萨诸塞大学阿默斯特分校（UMass Amherst）、约翰霍普金斯大学、卡耐基梅隆大学的研究者们提出了一个神奇的研究：虚拟社区（Virtual Community）。虚拟社区将真实世界的地理空间数据与生成模型相结合，为多种不同类型的智能体创建了一个具有社会根基的交互式、可扩展开放世界场景。

6/23/2025 7:05:00 AM

机器之心

自主式AI在企业市场值得关注的九个应用场景

各企业正在部署不断进步的技术，以协助软件编程、创建高级商业智能以及自动化客户支持和人力资源职能。在过去一年中，智能体在GenAI带来的热潮逐渐退去、人们对不切实际的期望感到失望之后，或许成为了最受关注的技术。智能体将GenAI更进一步，强调运营决策而非内容生成，这种对业务流程产生影响的潜力，使得Aflac、Atlantic Health System、Legendary Entertainment以及NASA的喷气推进实验室等企业已经开始采用智能体。

6/23/2025 7:00:00 AM

Grant Gross

「运维版Cursor」首发亮相！终结命令行地狱，Agent解放双手

AI智能体的风终于吹到运维了！ AI Coding似乎已经成为程序员们的标配，不论是最早的Copilot，Cursor的百亿估值，还是最近Claude Code的话题度，程序员手里的AI智能体越来越多——Windsurf、Codex、Trae、Copilot等等。而每天和服务器、数据库打交道的运维人员却一直没有被提及，程序员们有自己的Cursor，但是针对运维工程师的「Cursor」却迟迟没有出现。

6/20/2025 2:35:02 PM