AI在线 AI在线

MIT 新创公司 OpenAGI 推出 AI Agent,声称超越 OpenAI 与 Anthropic

近日,来自麻省理工学院的初创公司 OpenAGI 正式亮相,并宣布其新推出的 AI 模型 Lux 在计算机操作方面的表现超越了 OpenAI 和 Anthropic 的同类产品,且成本仅为其十分之一。 OpenAGI 的首席执行官秦增义表示,Lux 是一种基础模型,旨在通过解析计算机截图,自动执行桌面应用程序中的操作。 在最新发布的 Online-Mind2Web 基准测试中,Lux 的成功率达到了83.6%,而 OpenAI 的 Operator 仅为61.3%,Anthropic 的 Claude Computer Use 则为56.3%。

近日,来自麻省理工学院的初创公司 OpenAGI 正式亮相,并宣布其新推出的 AI 模型 Lux 在计算机操作方面的表现超越了 OpenAI 和 Anthropic 的同类产品,且成本仅为其十分之一。OpenAGI 的首席执行官秦增义表示,Lux 是一种基础模型,旨在通过解析计算机截图,自动执行桌面应用程序中的操作。

在最新发布的 Online-Mind2Web 基准测试中,Lux 的成功率达到了83.6%,而 OpenAI 的 Operator 仅为61.3%,Anthropic 的 Claude Computer Use 则为56.3%。这种显著的性能差距让业界人士对 Lux 的技术能力充满期待。

与传统的大型语言模型不同,Lux 采用了 “Agent主动预训练” 的方法,专注于从计算机截图和动作序列中学习。这一自我强化的训练循环使得 Lux 能够在不断探索的过程中提高自身能力,从而实现了更高效的操作。

OpenAGI 还声称,Lux 的操作成本大约是 OpenAI 和 Anthropic 前沿模型的十分之一,且其速度也更快。不同于仅能处理浏览器任务的竞争对手,Lux 可以全面控制桌面应用程序,包括 Excel、Slack 等,极大地扩展了其市场潜力。公司同时发布了开发者软件开发工具包,允许第三方基于 Lux 开发应用。

在安全性方面,OpenAGI 为 Lux 设计了内置的安全机制,当模型接收到可能违反安全政策的请求时,会拒绝执行,并向用户发出警告。这一特性在当前 AI 代理快速发展的背景下尤为重要。

秦增义博士背景深厚,曾参与开发多个广受欢迎的 AI 模型,展示了较小团队在技术上的潜力与创新。

划重点:

- 🚀 OpenAGI 推出的 Lux AI 代理在计算机操作基准测试中获得83.6% 的成功率,远超 OpenAI 和 Anthropic。

- 💡 Lux 采用独特的学习方式,通过计算机截图和动作序列进行训练,具有自我强化的能力。

- 🔒 安全机制内置于 Lux 中,能够识别和拒绝潜在的危险请求,保障用户数据安全。

相关资讯

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。 同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。 新发布的“产品支持代理”由Adobe Experience Platform Agent Orchestrator提供技术支持,能够在AI Assistant的对话界面中,为用户提供即时的操作指导和支持案例创建流程。
6/6/2025 11:00:55 AM
AI在线

OpenAI 升级 ChatGPT 语音模式,体验更自然对话

OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。 这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。 在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。
6/9/2025 11:00:56 AM
AI在线

ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华

OpenAI 旗下热门 AI 工具 ChatGPT 推出了一项备受期待的新功能——笔记工具,专为会议记录、头脑风暴和个人笔记管理设计。 这一功能目前仅在 ChatGPT 的 macOS 桌面应用程序中可用,为用户提供了一种高效、无缝的信息整理方式。 隐形记录,智能整理ChatGPT 的新笔记工具主打“隐形”记录体验,用户只需在 macOS 桌面应用中点击聊天窗口右侧的圆形图标,即可启动录音模式。
6/20/2025 5:01:01 PM
AI在线