AI在线 AI在线

OpenAI 启用 AI 模拟黑客攻击,只为修补代理式浏览器的致命漏洞

OpenAI 正采取一种“以毒攻毒”的新策略,来提升其代理式网页浏览器 ChatGPT Atlas 的安全性。 为了应对日益复杂的网络威胁,OpenAI 开发了一套“自动化攻击者”系统,通过模拟真实黑客的攻击手段,对 ChatGPT Atlas 进行全天候的压力测试。 这套系统的核心在于对抗提示注入(Prompt Injection)攻击。

OpenAI 正采取一种“以毒攻毒”的新策略,来提升其代理式网页浏览器 ChatGPT Atlas 的安全性。为了应对日益复杂的网络威胁,OpenAI 开发了一套“自动化攻击者”系统,通过模拟真实黑客的攻击手段,对 ChatGPT Atlas 进行全天候的压力测试。

这套系统的核心在于对抗提示注入(Prompt Injection)攻击。在这种攻击中,恶意第三方会悄悄向 AI 代理发送指令,诱导其执行违背用户意愿的操作,例如在用户不知情的情况下转发敏感邮件或删除云端文件。AIbase 获悉,OpenAI 的“自动化攻击者”利用了先进的强化学习技术,能够自主发现人类红队测试中未曾察觉的新型攻击路径。

在一次实际演示中,这个 AI 攻击者成功模拟了诱导 Atlas 向公司 CEO 发送辞职信的场景。虽然 Atlas 的防御机制最终拦截了这一请求并提醒了用户,但 OpenAI 坦言,安全博弈是一场持久战。由于代理式浏览器需要深度介入用户的数字化生活(如访问邮件、日历等),其便利性本身也带来了更大的风险暴露面。

尽管技术手段在不断进化,OpenAI 在最新报告中警示称,由于 AI 代理的本质特性,这类安全威胁可能永远无法被彻底“根治”。AIbase 提醒用户,在享受 AI 浏览器带来便利的同时,仍需保持警惕,关注官方发布的实时安全响应与防护建议。

相关资讯

OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁

OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁

【AIbase报道】尽管 OpenAI 正在全力推广其全新一代智能浏览器 ChatGPT Atlas,但公司内部安全主管 Dane Stuckey 近日却公开表达了对其潜在安全风险的担忧,引发业界关注。 Stuckey 指出,Atlas 面临的最大挑战之一是尚未彻底解决的 “即时注入”(Prompt Injection)攻击。 这类攻击通过在网页、邮件或其他内容中巧妙嵌入恶意指令,从而诱导 AI 代理执行非预期操作。
10/24/2025 10:47:12 AM AI在线
OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元

OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算,从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题,控制成本成行业挑战。##AI模型成本##
4/3/2025 7:59:45 AM 远洋
o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o
9/22/2024 1:27:00 PM 机器之心