AI 安全性与有效性测试存在严重缺陷，引发专家关注

作者：AI在线 2025-11-04 10:51

近日，来自英国政府 AI 安全研究所的计算机科学家及斯坦福大学、加州大学伯克利分校和牛津大学的专家们，对超过440个用于评估新人工智能模型安全性和有效性的基准进行了深入研究。他们发现几乎所有测试在某一领域存在缺陷，这些缺陷可能会 “削弱结果声明的有效性”，并且一些测试的评分结果可能 “无关紧要甚至误导”。图源备注：图片由AI生成随着各大科技公司不断推出新 AI，公众对 AI 的安全性和有效性日益担忧。

近日，来自英国政府 AI 安全研究所的计算机科学家及斯坦福大学、加州大学伯克利分校和牛津大学的专家们，对超过440个用于评估新人工智能模型安全性和有效性的基准进行了深入研究。他们发现几乎所有测试在某一领域存在缺陷，这些缺陷可能会 “削弱结果声明的有效性”，并且一些测试的评分结果可能 “无关紧要甚至误导”。

机器人人工智能 AI

图源备注：图片由AI生成

随着各大科技公司不断推出新 AI，公众对 AI 的安全性和有效性日益担忧。当前，美国和英国尚未实施全国范围的 AI 监管，而这些基准则成为检验新 AI 是否安全、是否符合人类利益及其在推理、数学和编码方面声称能力的重要工具。

研究的首席作者、牛津互联网研究所的 Andrew Bean 表示:“基准测试支撑着几乎所有关于 AI 进步的声明，但缺乏统一的定义和可靠的测量，使得我们难以判断模型是否真正改善，还是仅仅看似改善。” 他提到，谷歌最近撤回了其新推出的 AI 模型 Gemma，因为该模型传播了有关美国参议员的不实指控，且这些指控是完全虚构的。

这并不是个别现象。Character.ai 也在最近宣布禁止青少年与其 AI 聊天机器人进行开放式对话，原因是该公司卷入了几起青少年自杀的争议。研究显示，只有16% 的基准使用不确定性估计或统计测试来展示其准确性。在一些评估 AI 特性的基准中，像 “无害性” 这样的概念定义不清，导致测试效果不佳。

专家们呼吁制定共享标准和最佳实践，以改善 AI 的评估过程，从而确保其安全性与有效性。

划重点:
🌐 研究发现，440多个 AI 测试基准几乎都有缺陷，影响结果有效性。
🚨 谷歌的 Gemma 模型因传播虚假指控而被撤回，凸显 AI 监管的紧迫性。
📊 仅16% 的基准使用统计测试，缺乏标准化，亟需改进 AI 评估方法。

互联网女皇340页AI报告：全球科技巨头正以空前规模投入AI研发与资本支出

根据互联网女皇最新发布的AI趋势报告的深入分析，全球最大的科技公司正以空前的规模和速度投入人工智能（AI）领域的研发和资本支出。报告指出，过去二十年来，科技行业的资本支出持续走高，最初是为了存储和访问数据，然后是为了分发和规模化，而现在则主要集中在计算和智能方面。这份AI趋势报告强调，到2023年，AI已经从一个研究功能转变为一个重要的资本支出项目。

6/5/2025 3:00:56 PM AI在线

美国拟禁止州级人工智能法规，引发对消费者保护的担忧

最近，针对人工智能（AI）立法的争议在美国愈演愈烈。国会的商业委员会共和党成员在最新版本的预算提案中，提出了一项为期十年的州级 AI 法规禁令。这项提案源于前总统唐纳德・特朗普的一项大型预算计划。

6/9/2025 11:00:56 AM AI在线

调查显示：美国青少年对大型科技公司的信任正在下降

Common Sense的调查发现，64%的青少年表示不相信大型科技公司会关心他们的心理健康，62%的青少年认为这些公司若涉及到利润问题，就不会保证他们的安全。

1/30/2025 5:55:14 PM 清源

​AI 安全性与有效性测试存在严重缺陷，引发专家关注

相关资讯

互联网女皇340页AI报告：全球科技巨头正以空前规模投入AI研发与资本支出

美国拟禁止州级人工智能法规，引发对消费者保护的担忧

调查显示：美国青少年对大型科技公司的信任正在下降

AI 安全性与有效性测试存在严重缺陷，引发专家关注