OpenAI 推出 gpt-oss-safeguard:实时可更新的开源 AI 安全模型

作者：AI在线 2025-10-31 09:46

OpenAI 今日宣布推出全新开源安全模型套件 gpt-oss-safeguard，旨在为 AI 系统提供更加灵活、透明且可审计的安全分类能力。该模型包含120位和20位两个版本，并以 Apache2.0许可证开放，允许开发者自由使用、修改和集成。与传统的安全分类器不同，gpt-oss-safeguard 支持 “实时策略解读”，这意味着当安全或内容规则发生变化时，模型无需重新训练即可即时适配更新。

OpenAI 今日宣布推出全新开源安全模型套件 gpt-oss-safeguard，旨在为 AI 系统提供更加灵活、透明且可审计的安全分类能力。该模型包含120位和20位两个版本，并以 Apache2.0许可证开放，允许开发者自由使用、修改和集成。

与传统的安全分类器不同，gpt-oss-safeguard 支持 “实时策略解读”，这意味着当安全或内容规则发生变化时，模型无需重新训练即可即时适配更新。这一机制大幅降低了安全系统维护成本，使企业和机构能够以更高的速度应对不断演变的合规与内容安全需求。

OpenAI，ChatGPT，人工智能，AI

在透明性方面，OpenAI 表示，gpt-oss-safeguard 的架构让开发者可以直接查看模型的决策过程，更直观地理解其判断逻辑，从而方便审计与优化。这一设计回应了长期以来外界对 AI 黑箱问题的担忧，也为构建可信赖的 AI 安全生态提供了新的技术范式。

值得注意的是，gpt-oss-safeguard 建立在 OpenAI 自家的开源模型 gpt-oss 之上，并作为 OpenAI 与 ROOST 平台（专注于 AI 安全、保障与治理基础设施的开源社区）的合作成果推出。OpenAI 称，这一项目的目标是推动全球范围内更开放、负责任的 AI 安全标准化进程。

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道，知情人士透露微软工程师团队正加速部署服务器资源，为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。尽管OpenAI CEO山姆·阿尔特曼（Sam Altman）近期确认GPT-4.5将在几周内亮相，但微软内部预计最快下周即可完成新模型的托管部署，这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。

2/21/2025 11:12:00 AM AI在线

研究显示，AI 用户可与双人团队媲美，提升工作效率

最近的一项研究显示，使用人工智能（AI）的个人在工作表现上可与传统的双人团队相媲美。此次研究由776名洁(Procter & Gamble)专家参与，他们在一天的工作坊中为多个业务单位开发产品创意。研究将参与者分成两组，分别是由一名商业专家和一名技术专家组成的团队，和单独的个人，其中一半的团队和个人都获得了 GPT-4和 GPT-4o 的访问权限。

3/24/2025 9:33:00 AM AI在线

OpenAI宣布GPT-4退役，AI浪潮进入新篇章

人工智能领域的技术迭代速度令人惊叹。近日，OpenAI正式宣布，其标志性模型GPT-4将于2025年4月30日从ChatGPT中全面退役，被更先进的GPT-4o取代。这一消息引发了业界和创作者的广泛讨论，标志着AI大模型时代又一次里程碑式的转折。

4/13/2025 7:34:53 AM AI在线

OpenAI 推出 gpt-oss-safeguard:实时可更新的开源 AI 安全模型

相关资讯

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

研究显示，AI 用户可与双人团队媲美，提升工作效率

OpenAI宣布GPT-4退役，AI浪潮进入新篇章