AI在线 AI在线

AI 智能体已具备与人类黑客正面较量的能力,部分情况甚至能取胜

研究团队在两场大规模的“夺旗赛”(CTF)中对 AI 系统进行了实战测试,数千名选手参与角逐。在这类比赛中,参赛队伍需通过破解加密、识别漏洞等方式解决安全难题,找到隐藏的“旗帜”。

据外媒 The Decoder 1 日报道,Palisade Research 最近举办的一系列网络安全竞赛表明,AI 智能体已具备与人类黑客正面较量的能力,甚至在部分场合中胜出。

研究团队在两场大规模的“夺旗赛”(CTF)中对 AI 系统进行了实战测试,数千名选手参与角逐。在这类比赛中,参赛队伍需通过破解加密、识别漏洞等方式解决安全难题,找到隐藏的“旗帜”。

AI 智能体已具备与人类黑客正面较量的能力,部分情况甚至能取胜

测试的目的是检验 AI 智能体能否与人类队伍抗衡。结果显示,AI 的表现远超预期,大多数参赛 AI 都超过了人类选手的平均水平。

参赛的 AI 系统复杂程度各不相同。有的团队如 CAI 花费约 500 小时打造专属系统,也有像 Imperturbable 团队仅花 17 小时就通过优化现有模型 EnIGMA 和 Claude Code 的提示词参赛。

在首场名为“AI vs. Humans”的比赛中,六支 AI 团队与约 150 支人类队伍展开比拼。所有选手需在 48 小时内完成 20 道密码学与逆向工程题目

七个参赛 AI 中有四个成功破解了其中 19 道题。排名最高的 AI 团队位列总榜前 5%,整体表现优于大多数人类选手。比赛题目均可在本地运行,降低了 AI 的技术门槛。

AI 智能体已具备与人类黑客正面较量的能力,部分情况甚至能取胜

尽管如此,部分经验丰富的人类选手依旧不落下风。有选手指出,自己曾参加多支国际强队,丰富的 CTF 实战经验和对常用解题策略的熟悉,是他们保持竞争力的关键。

第二场“Cyber Apocalypse”则难度大幅升级。AI 智能体需面对全新题型,并与近 18000 名人类玩家同台竞技。62 项任务中,不少要求与外部服务器进行交互,对主要依赖本地计算的 AI 系统提出挑战。

AI在线从报道中获悉,本场共有四个 AI 智能体参赛,其中 CAI 表现最佳,完成了 20 项任务,排名第 859 位,位列全部参赛队伍前 10%、活跃队伍前 21%。Palisade Research 表示,该 AI 系统的表现超过了约 90% 的人类团队

AI 智能体已具备与人类黑客正面较量的能力,部分情况甚至能取胜

研究人员还分析了 AI 所破解题目的难度。以人类顶尖队伍解题所需时间为参考,发现 AI 有 50% 成功率解出人类高手也需约 78 分钟才能破解的题目。换言之,AI 已具备解决高难度问题的能力。

AI 智能体已具备与人类黑客正面较量的能力,部分情况甚至能取胜

相关资讯

微软将举办大型线下黑客大会,400 万美元悬赏云计算与 AI 软件漏洞

微软宣布将举办一场名为“零日探索”(Zero Day Quest)的线下黑客大会,旨在鼓励研究人员发现影响云计算和人工智能工作负载的软件中的高危安全漏洞。
11/19/2024 10:00:25 PM
远洋

研究发现黑客可轻松操控 AI 机器人,将其变成致命武器

宾夕法尼亚大学的研究人员发现,一系列人工智能增强型机器人系统存在严重的漏洞,容易受到黑客攻击和控制。
11/25/2024 5:58:48 PM
远洋

AI抢不走的工作,微软力挺红队测试仍需人类“掌舵”

随着AI的快速发展,安全专家担心人工智能会取代他们的工作,但微软的研究人员坚持认为,有效的红队测试仍然依赖于人类的专业知识、文化意识和情商——这些品质是机器无法复制的。 微软的AI红队严格测试了100多款生成式AI产品,并确定人类的创造力在发现漏洞,以及预测黑客如何利用这些系统方面仍然至关重要。 根据雷德蒙德AI红队发布的白皮书,其开源的PyRIT(Python风险识别工具包)等工具可以简化模拟黑客攻击,但最终,在处理复杂风险方面,人类的参与仍然不可替代。
1/15/2025 7:38:07 AM
跳舞的花栗鼠
  • 1