OpenAI 发布 GPT-4o 模型卡：概述 AI 安全和风险缓解措施

作者：故渊 2024-08-10 11:54

OpenAI 公司于 8 月 8 日发布报告，概述了 GPT-4o 模型的系统卡（System Card），介绍了包括外部红队（模拟敌人攻击）、准备框架（Preparedness Framework）在内的诸多细节。OpenAI 表示 GPT-4o 模型的核心就是准备框架（Preparedness Framework），这是一种评估和降低人工智能系统相关风险的系统方法。AI在线从报道中获悉，该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。除了针对 GPT-4 和 GPT-4V 进行的安全评估

OpenAI 公司于 8 月 8 日发布报告，概述了 GPT-4o 模型的系统卡（System Card），介绍了包括外部红队（模拟敌人攻击）、准备框架（Preparedness Framework）在内的诸多细节。

OpenAI 表示 GPT-4o 模型的核心就是准备框架（Preparedness Framework），这是一种评估和降低人工智能系统相关风险的系统方法。AI在线从报道中获悉，该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。

除了针对 GPT-4 和 GPT-4V 进行的安全评估和缓解措施外，OpenAI 还针对 GPT-4o 的音频功能开展了更多安全工作。

评估的风险包括扬声器识别、未经授权的语音生成、受版权保护内容的潜在生成、无根据推断以及不允许的内容。基于这些评估结果，OpenAI 在模型和系统层面都实施了保障措施。

OpenAI 还与 100 多名外部红队人员合作，在向公众发布模型之前对其进行评估。红队人员将进行探索性的能力发现，评估模型带来的新的潜在风险，并对缓解措施进行压力测试。

OpenAI 发布 HealthBench：评估大型语言模型在医疗领域表现的新标准

近日，OpenAI 发布了一款名为 HealthBench 的开源评估框架，旨在测量大型语言模型（LLMs）在真实医疗场景中的表现和安全性。此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持，旨在弥补现有评估标准的不足，特别是在真实应用、专家验证和诊断覆盖方面。现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式，如多项选择考试。

5/13/2025 3:00:52 PM AI在线

大模型增速远超摩尔定律！MIT 最新研究：人类快要喂不饱 AI 了

【新智元导读】近日，来自 MIT （麻省理工学院）的研究人员发表了关于大模型能力增速的研究，结果表明，LLM 的能力大约每 8 个月就会翻一倍，速度远超摩尔定律！硬件马上就要跟不上啦！我们人类可能要养不起 AI 了！近日，来自 MIT FutureTech 的研究人员发表了一项关于大模型能力增长速度的研究，结果表明：LLM 的能力大约每 8 个月就会翻一倍，速度远超摩尔定律！论文地址：的能力提升大部分来自于算力，而摩尔定律代表着硬件算力的发展，—— 也就是说，随着时间的推移，终有一天我们将无法满足 LLM 所需要

3/18/2024 4:41:06 PM 清源

代码大模型安全规范正式定稿：百度阿里小米 vivo 等参与，中国信通院启动首轮评估

近年来，代码大模型已成为企业研发人员辅助编程必备助手，能够生成、翻译、补全代码，帮助定位和修复错误。然而，代码大模型背后隐藏的风险挑战还有待讨论。中国信息通信研究院（以下简称“中国信通院”）依托中国人工智能产业发展联盟（AIIA），联合业内近 30 家单位共同编制了《代码大模型安全风险防范能力要求及评估方法》规范（简称“规范”），聚焦代码大模型的安全能力，从基础功能出发，评估代码大模型的基础能力和安全风险防范能力。2024 年 6 月 18 日，规范第三次研讨会成功举办，对规范内容做出进一步的完善和修订，现已完成定

6/20/2024 4:18:53 PM 汪淼

OpenAI 发布 GPT-4o 模型卡：概述 AI 安全和风险缓解措施

相关资讯

OpenAI 发布 HealthBench：评估大型语言模型在医疗领域表现的新标准

大模型增速远超摩尔定律！MIT 最新研究：人类快要喂不饱 AI 了

代码大模型安全规范正式定稿：百度阿里小米 vivo 等参与，中国信通院启动首轮评估