最近微软开源了一个 Agent 叫 UFO,通过自然语言指令实现 Windows 操作系统上的自动化任务操作。
图片
之前我们分享的 Agent 大多是自主使用浏览器,而 UFO 更进了一步,可以使用操作系统中的各种APP帮你完成任务。
下面是 UFO 的架构图
UFO² architecture
可以看到,它是一个多Agent系统,中间的 HostAgent 用来解析用户的自然语言,启动必要的应用程序。
下面的每个应用程序都对应一个Agent。
这让我想到了前段时间谷歌提出的一个跟MCP类似协议——A2A,用于制定Agent之间通信的标准协议。
图片
从 UFO 的架构上看,普通A2A这类协议还是很有必要的。
假如上述应用程序Agent都支持了A2A协议,那我们开发的Agent也就都能轻松调用Windows 系统的各种应用程序,既能加快Agent开发效率,也可以大大提高Agent的能力。
最近,我们也在开发一个跟 Manus 类似的智能体,对AI时代“杀手级”应用有一些思考。
我觉得“杀手级”应用一定要具备的一个特点就是之前完全没出现过,一定是一个全新物种。
比如,互联网时代,淘宝就是一个杀手级应用,是互联网时代的全新物种。淘宝出现之前,不能甚至不敢想象,我们还可以完成跨时空购物。
反之,目前一些垂类Agent,比如旅游Agent,帮用户自动规划出行、游玩。
这类Agent虽然能解决一大部分人的旅游需求,但它成不了“杀手级”,因为即便没有大模型,这类需求也能被满足很好(旅行社),大模型无非解决的就是效率问题。
所以,从这个角度说,我觉得到目前为止,Manus、UFO这类智能体至少已经有“杀手级”的苗头。
虽然,这些产品现阶段不可避免被大家吐槽智障,但起码是一个全新物种。一句话让一个Agent像助理一样自动帮你干完活,这个现象在之前是完全没有的。
无论如何,AI时代,我们普通人最大的机会在于拥抱AI,积极拥抱变化,在AI浪潮中找到属于自己的位置。