AI在线 AI在线

智能体

智能体规模化部署的隐形悬崖:如何避免部署崩盘?

想要构建并扩展智能体的企业还需要接受另一个现实:智能体的构建方式与其他软件截然不同。 根据Writer公司的CEO兼联合创始人May Habib的说法,智能体在构建方式、运行方式以及改进方式上都“有着根本的不同”,这意味着在处理自适应系统时,需要摒弃传统的软件开发生命周期(SDLC)。 “智能体并不总是可靠地遵循规则,”Habib在周三VB Transform大会的舞台上表示,“它们是结果导向的,它们会解读信息,会适应变化,而且,它们的行为真的只有在现实世界环境中才会显现出来。
6/30/2025 7:07:00 AM
Marty Swant

从自主式AI领军企业实战中提炼的关键部署策略

在VB Transform 2025大会的第二天,行业领袖们分享了大规模部署智能体的宝贵经验。 本次小组讨论由Foundation . Capital的普通合伙人Joanne Chen主持,参与讨论的嘉宾包括:Rocket Companies的首席技术官Shawn .
6/30/2025 2:00:00 AM
Sean

杀疯了,这个 AI+Python 智能体救了看门老大爷!

最近AiPy很火,我用了有一段时间了,感觉严重影响睡眠,感觉这东西容易上瘾,今天推荐给大家。 AiPy它是基于AI Python,官方的说法是他们给大模型装上了手脚,也就是说,用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制,听起来有点逆天。 然后AiPy是个开源项目,有命令行版和客户端。
6/27/2025 9:29:45 AM
老朱2000

SCIENCEBOARD:构建智能体驱动的科学探索新「环境」

大家好,我是肆〇柒。 今天,我们来聊聊 SCIENCEBOARD,这是一个由香港大学、上海人工智能实验室、复旦大学、北京大学、南京大学、华东师范大学和耶鲁大学等,多所知名高校和研究机构共同打造的创新平台。 它致力于在多域科学工作流中评估多模态自主智能体,为推动 AI 驱动的科学发现提供了全新的方法和工具。
6/27/2025 7:00:00 AM
肆零柒

一文彻底搞懂智能体Agent基于ReAct的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
6/27/2025 6:00:00 AM
AI大模型应用开发

Gartner 预测:市场冷静后,2027 年底超 40% 智能体(代理)AI 项目将被取消

Gartner 认为,今年以来愈演愈烈的 AI 智能体概念热潮在很大程度上是炒作的结果,很多项目的“智能体化”仅仅是品牌名称重塑。
6/26/2025 2:47:23 PM
溯波(实习)

首个面向科学任务、真实交互、自动评估的多模态智能体评测环境,ScienceBoard来了

第一作者孙秋实是香港大学计算与数据科学学院博士生,硕士毕业于新加坡国立大学数据科学系。 主要研究方向为 Computer-using agents 和 Code intelligence,在 NLP 和 ML 顶会 ACL,EMNLP,ICLR,COLM 等发表多篇论文。 本文的 OS-Copilot 团队此前已发布了 OS-Atlas、OS-Genesis 和 SeeClick 等同系列电脑智能体研究成果,被广泛应用于学术界与产业实践中。
6/26/2025 9:01:14 AM

提示词工程、RAG之后,LangChain:上下文工程开始火了!

AI 时代,你可能听说过提示词工程、RAG、记忆等术语。 但是很少有人提及上下文工程(context engineering)。 其实,这一术语并不新鲜,近两年很多智能体构建者一直在关注这个事情。
6/26/2025 7:00:00 AM
机器之心

无训练智能体蒸馏:AgentDistill 低成本高能效的智能进化方案

大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)的蒸馏技术正以前所未有的速度发展,成为压缩模型规模、降低推理成本的关键手段。 然而,现有的 LLM 智能体蒸馏方法却面临着高计算成本、泛化能力不足等诸多挑战。
6/25/2025 1:00:00 AM
肆零柒

谷歌 Google Cloud 向 Linux 基金会捐赠 A2A 智能体交互协议

Google Cloud 在 A2A 领域的下一步是通过与外部合作,制定一套更广泛的开放标准,丰富 A2A 协议的功能集。
6/24/2025 10:41:37 AM
溯波(实习)

微软刚发布Mu模型:支持Windows智能体,小参数跑出10倍性能

今天凌晨,微软在官网发布了创新小参数模型Mu。 Mu仅有3.3亿参数,但其性能可以比肩微软之前发布的小参数模型Phi-3.5-mini,体量却比它小10倍左右,并且在离线NPU的笔记本设备上,可以跑出每秒超过100 tokens的响应,这在小参数模型领域非常罕见。 此外,Mu支持在Windows中设置智能体,可将自然语言指令实时转化为系统操作,例如,只需对着电脑说一句 “把鼠标指针调大一些,调整屏幕亮度”,智能体就能精准定位到相关设置项一键完成调整。
6/24/2025 9:08:31 AM

掌控 AI 智能体自主性:五级框架下的人机协作之道

大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
6/23/2025 10:05:40 AM
肆零柒

ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%

本文第一作者为张桂彬,新加坡国立大学25Fall计算机科学博士生;本文在南洋理工大学的王琨博士、上海人工智能实验室的白磊老师、和中国科学技术大学的王翔教授指导下完成。 LLM 智能体的时代,单个 Agent 的能力已到瓶颈,组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功。 但 “天团” 不是人越多越好,手动设计既费力又不讨好,现有的智能体自动化方法又只会 “一招鲜”,拿一套复杂阵容应对所有问题,导致 “杀鸡用牛刀”,成本高昂。
6/23/2025 8:57:00 AM

7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式

尽管人工智能(AI)在飞速发展,当前 AI 开发仍严重依赖人类专家大量的手动实验和反复的调参迭代,过程费时费力。 这种以人为中心的方式已成为制约创新速度和通向通用人工智能(AGI)的关键瓶颈。 为突破限制,AI-for-AI(AI4AI)应运而生。
6/23/2025 8:56:00 AM

世界模型版《模拟人生》:AI虚拟小人街头演讲拉票,GPT-4o选举获胜

当世界模型高度进化后,里面的「人」都在做些什么? 有人会进行街头演说,吸引到了不少听众,小孩会和机器狗玩:有人会当街作案,警察前去抓捕,又有人会在大庭广众之下求婚:本周五,来自马萨诸塞大学阿默斯特分校(UMass Amherst)、约翰霍普金斯大学、卡耐基梅隆大学的研究者们提出了一个神奇的研究:虚拟社区(Virtual Community)。 虚拟社区将真实世界的地理空间数据与生成模型相结合,为多种不同类型的智能体创建了一个具有社会根基的交互式、可扩展开放世界场景。
6/23/2025 7:05:00 AM
机器之心

自主式AI在企业市场值得关注的九个应用场景

各企业正在部署不断进步的技术,以协助软件编程、创建高级商业智能以及自动化客户支持和人力资源职能。 在过去一年中,智能体在GenAI带来的热潮逐渐退去、人们对不切实际的期望感到失望之后,或许成为了最受关注的技术。 智能体将GenAI更进一步,强调运营决策而非内容生成,这种对业务流程产生影响的潜力,使得Aflac、Atlantic Health System、Legendary Entertainment以及NASA的喷气推进实验室等企业已经开始采用智能体。
6/23/2025 7:00:00 AM
Grant Gross

「运维版Cursor」首发亮相!终结命令行地狱,Agent解放双手

AI智能体的风终于吹到运维了! AI Coding似乎已经成为程序员们的标配,不论是最早的Copilot,Cursor的百亿估值,还是最近Claude Code的话题度,程序员手里的AI智能体越来越多——Windsurf、Codex、Trae、Copilot等等。 而每天和服务器、数据库打交道的运维人员却一直没有被提及,程序员们有自己的Cursor,但是针对运维工程师的「Cursor」却迟迟没有出现。
6/20/2025 2:35:02 PM

天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课

400 多年前,宋应星著成《天工开物》。 这是一部写给匠人、也写给未来的书。 它让人相信:技术不是死物,而是人与世界持续互动的方式。
6/20/2025 10:31:27 AM