AI在线 AI在线

大模型公司不搞浏览器搞Agent,实测找到原因了

闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI如果Agent能操作命令行,就有了与整个计算机系统交互的能力。 也意味着一台计算机的几乎所有功能,都可以通过自然语言来驱动。

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

如果Agent能操作命令行,就有了与整个计算机系统交互的能力。

也意味着一台计算机的几乎所有功能,都可以通过自然语言来驱动。

这种产品终于有雏形了,我们抓来阶跃星辰的桌面Agent小跃来看看实力~

它的形态比较新颖:是一个悬浮球……

区别于浏览器Agent,小跃平时就这样狗狗祟祟可可爱爱趴在桌面上。

大模型公司不搞浏览器搞Agent,实测找到原因了

当然了,完整形态如下:

大模型公司不搞浏览器搞Agent,实测找到原因了

打眼一看,这个小跃能接互联网、能搜索浏览器、能处理Excel表格、还能连接本地操作系统。

大模型公司不搞浏览器搞Agent,实测找到原因了

不过,据官方介绍,它较为突出的本领是支持通过“妙计”复用操作步骤,也支持设置“定时任务”到点自动执行,甚至能并行处理任务,不用像鸡排哥一样:做完你的再做你的。(doge)

大模型公司不搞浏览器搞Agent,实测找到原因了

好好好,开测!

首先,对于学计算机的广大朋友们来说,实践的第一课是什么?

有言道:搭环境两小时,写代码十分钟。虽然说搭环境是必修课,但偶尔让AI代劳一下也不是不可以。

先来下个conda!

下载conda

小跃随即开始用内置的浏览器访问下载页面,倒是也不用担心被它看到浏览记录了。

大模型公司不搞浏览器搞Agent,实测找到原因了

找完下载链接后检查设备型号,选取合适版本后自动开始Terminal下载。

大模型公司不搞浏览器搞Agent,实测找到原因了

几分钟后完成操作,整个过程不用动手。(实际上随时可以手动接管)

大模型公司不搞浏览器搞Agent,实测找到原因了

最后来检查一下,真的有!nice~

大模型公司不搞浏览器搞Agent,实测找到原因了

做不同的项目,对环境的需求也不一样,比如:

我要做机器学习课程的CNN图像分类作业,帮我自动创建conda虚拟环境‘cnn-hw’,Python版本3.11,安装torch、torchvision、matplotlib和jupyterlab,安装完启动jupyter。

大模型公司不搞浏览器搞Agent,实测找到原因了

在实际执行过程中,如果一种方法行不通,它会自动纠错并修改。

大模型公司不搞浏览器搞Agent,实测找到原因了

最终,在本地打开了Jupyter。

大模型公司不搞浏览器搞Agent,实测找到原因了

再来检查一下我们要求的安装包是否下载了。

大模型公司不搞浏览器搞Agent,实测找到原因了 大模型公司不搞浏览器搞Agent,实测找到原因了

小跃甚至把环境变量都给你配好了,正好手头有一个贪吃蛇代码,在这个环境里跑一下。

大模型公司不搞浏览器搞Agent,实测找到原因了

觉得这个贪吃蛇太简单?让小跃帮忙升级一波。

这是我之前写的Python贪吃蛇代码,帮我优化三点:

用Pygame替换原来的tkinter界面,加个开始菜单;

增加分数排行榜功能,数据存在本地JSON文件里;

检查代码里的内存泄漏问题并修复,最后生成可执行的exe文件”。

大模型公司不搞浏览器搞Agent,实测找到原因了

由于Agent在执行任务过程中会有很多中间步骤(比如自动安装Pygame包等,能用到的都会自动安装),这里我们就不一一详细展开了,结果就是小跃直接写了个项目出来,并且都保存在了本地。

大模型公司不搞浏览器搞Agent,实测找到原因了

现在的贪吃蛇变成了这样:

大模型公司不搞浏览器搞Agent,实测找到原因了

看来,在编程方面,小跃可以直接当你的实时助手了,从环境到代码包办。

那对于在不需要编程的场景下,它又有什么亮点呢?

首先,这个桌面伴侣就像一个小助手,可以用它来设置提醒。

大模型公司不搞浏览器搞Agent,实测找到原因了

于是就会得到贴心提示:

大模型公司不搞浏览器搞Agent,实测找到原因了

还比如「/」设置一个“妙计”指令,提示词就可以无限复用

大模型公司不搞浏览器搞Agent,实测找到原因了

执行操作只需要:

/图片按时间分类

大模型公司不搞浏览器搞Agent,实测找到原因了

更绝的是它能定时任务。

大模型公司不搞浏览器搞Agent,实测找到原因了

到点自动开刷小红书。

大模型公司不搞浏览器搞Agent,实测找到原因了

做任务还不用一个个排队,把事情都交给它,让它在后台跑,不干扰你当前的工作,任务结束时会浮出提醒。

大模型公司不搞浏览器搞Agent,实测找到原因了

说完功能,说说不足。

实测下来最大的一个感受就是

比如搭建环境,任务完成时长要以分钟为单位,可能一些性子急的朋友已经用这个时间找到教程自己做完了。

大模型公司不搞浏览器搞Agent,实测找到原因了

还有就是调试代码时遇到多个错误可能修改不完全,要让它多查几次。

还有就是,目前小跃只有Mac版本,据说Windows版本正在拍马赶来的路上……

当然了,“会玩电脑”、“接管电脑”也是Agent元年里最重要的产品及应用趋势。

大模型玩家早就摩拳擦掌了。

智谱一早就推出了桌面Agent,主打推理、生成PPT和海报,后来还接入了视频生成模型。

大模型公司不搞浏览器搞Agent,实测找到原因了

MiniMax的Agent也在今年的WAIC上亮相,被内部人员称为“超级员工”,能够输出分析报告、代码文件、网页小游戏、演讲ppt等多种形式。

大模型公司不搞浏览器搞Agent,实测找到原因了

前段时间Kimi家的OK Computer,可以自动在云端的临时虚拟环境进行操作。

大模型公司不搞浏览器搞Agent,实测找到原因了

而到了小跃这里,更是离开了浏览器,成为了悬浮球。

我们只需要通过语言交互,就可以在本地终端“为所欲为”。

大模型公司不搞浏览器搞Agent,实测找到原因了

过去需要用户手动衔接的操作环节,如今正被语言指令串联起来,或许未来我们和电脑的互动,会像和人对话一样轻松。

Agent正在打破人机交互的边界,也在对操作系统,提出新的要求。

— 完 —

相关资讯

阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业

2025 年 2 月 21 日,阶跃在上海迎来了首届 Step UP 生态开放日。 活动中,阶跃重点介绍了其在智能终端 Agent 领域的战略布局,同时汇聚了吉利汽车集团、OPPO、智元机器人等行业巨头,共同见证了大模型技术在智能终端 Agent、金融财经、内容创作、新零售和数字人等领域的强大赋能与创新实践。 此外,阶跃星辰还发布了「繁星计划」二期,旨在从模型优化、算力支持、资本投入、数据共享和企业孵化等方面为开发者提供全方位赋能,激发更多 Agent 应用创新。
2/25/2025 4:00:00 PM
郑佳美

大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”

阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。
1/21/2025 3:14:48 PM
浩渺

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。
1/22/2025 5:02:00 PM
朱可轩
  • 1