OpenAI 启用 AI 模拟黑客攻击，只为修补代理式浏览器的致命漏洞

作者：AI在线 2025-12-24 11:41

OpenAI 正采取一种“以毒攻毒”的新策略，来提升其代理式网页浏览器 ChatGPT Atlas 的安全性。为了应对日益复杂的网络威胁，OpenAI 开发了一套“自动化攻击者”系统，通过模拟真实黑客的攻击手段，对 ChatGPT Atlas 进行全天候的压力测试。这套系统的核心在于对抗提示注入（Prompt Injection）攻击。

OpenAI 正采取一种“以毒攻毒”的新策略，来提升其代理式网页浏览器 ChatGPT Atlas 的安全性。为了应对日益复杂的网络威胁，OpenAI 开发了一套“自动化攻击者”系统，通过模拟真实黑客的攻击手段，对 ChatGPT Atlas 进行全天候的压力测试。

这套系统的核心在于对抗提示注入（Prompt Injection）攻击。在这种攻击中，恶意第三方会悄悄向 AI 代理发送指令，诱导其执行违背用户意愿的操作，例如在用户不知情的情况下转发敏感邮件或删除云端文件。AIbase 获悉，OpenAI 的“自动化攻击者”利用了先进的强化学习技术，能够自主发现人类红队测试中未曾察觉的新型攻击路径。

在一次实际演示中，这个 AI 攻击者成功模拟了诱导 Atlas 向公司 CEO 发送辞职信的场景。虽然 Atlas 的防御机制最终拦截了这一请求并提醒了用户，但 OpenAI 坦言，安全博弈是一场持久战。由于代理式浏览器需要深度介入用户的数字化生活（如访问邮件、日历等），其便利性本身也带来了更大的风险暴露面。

尽管技术手段在不断进化，OpenAI 在最新报告中警示称，由于 AI 代理的本质特性，这类安全威胁可能永远无法被彻底“根治”。AIbase 提醒用户，在享受 AI 浏览器带来便利的同时，仍需保持警惕，关注官方发布的实时安全响应与防护建议。

OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁

【AIbase报道】尽管 OpenAI 正在全力推广其全新一代智能浏览器 ChatGPT Atlas，但公司内部安全主管 Dane Stuckey 近日却公开表达了对其潜在安全风险的担忧，引发业界关注。 Stuckey 指出，Atlas 面临的最大挑战之一是尚未彻底解决的 “即时注入”（Prompt Injection）攻击。这类攻击通过在网页、邮件或其他内容中巧妙嵌入恶意指令，从而诱导 AI 代理执行非预期操作。

10/24/2025 10:47:12 AM AI在线

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算，从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题，控制成本成行业挑战。##AI模型成本##

4/3/2025 7:59:45 AM 远洋

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来，它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练，它就能直接拿下数学奥赛金牌，甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo，我们看了不少，评估 o1 表现的评测，全网比比皆是，关于 o1 技术路线的讨论也如火如荼，引发了广泛的关注和深入的思考。不过 o1 背后的故事，还鲜为人知，那些在幕后默默付出的团队成员们，他们的故事同样值得被讲述和铭记。刚刚，OpenAI 发布了 o1 研发团队的完整访谈，为我们揭秘了 o1 的「成长历程」。o

9/22/2024 1:27:00 PM 机器之心

OpenAI 启用 AI 模拟黑客攻击，只为修补代理式浏览器的致命漏洞

相关资讯

OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo