AI在线 AI在线

OpenAI 计划发布开放权重模型,打破“闭源”惯例

据知情人士透露,OpenAI 正在准备推出其首个开放权重模型,最早可能于下周发布。 这款新的语言模型将允许公司和政府在 OpenAI 和微软 Azure 服务器之外的供应商上自行运行,标志着 OpenAI 自2019年发布 GPT-2以来首次发布开放权重模型。 此举也打破了 OpenAI 自2023年与微软签署独家云提供商协议以来,其语言模型一直保持闭源的惯例。

据知情人士透露,OpenAI 正在准备推出其首个开放权重模型,最早可能于下周发布。 这款新的语言模型将允许公司和政府在 OpenAI 和微软 Azure 服务器之外的供应商上自行运行,标志着 OpenAI 自2019年发布 GPT-2以来首次发布开放权重模型。

此举也打破了 OpenAI 自2023年与微软签署独家云提供商协议以来,其语言模型一直保持闭源的惯例。

OpenAI

OpenAI 的模型通常是闭权的,这意味着模型的训练参数不公开。然而,即将推出的这款开放权重模型将改变这一现状,使其能够在 Azure、Hugging Face 以及其他大型云提供商上使用,类似于今年早些时候 DeepSeek 的 R1模型迅速获得微软和其他云提供商支持的情况。

消息人士称,这款新模型“类似于 o3mini”,并具备使 OpenAI 最新模型如此强大的推理能力。在过去的几个月里,OpenAI 一直在向开发者和研究人员演示这个开放模型,并积极向更广泛的 AI 社区征求反馈。

OpenAI 尚未就即将发布的开放模型发表评论。这一举动无疑将在人工智能领域引发广泛关注,并可能对模型开发和部署的未来产生深远影响。

相关资讯

OpenAI 推迟首个开源大模型发布,确保安全性成首要任务

近日,OpenAI 宣布将推迟原定于下周发布的首个开源权重大模型。 OpenAI 的 CEO Sam Altman 表示,此次延迟的主要原因是为了进行更全面的安全测试和对高风险领域的审查。 他强调,一旦模型权重公开,就无法撤回,而这款新模型对于 OpenAI 而言也是一个全新的挑战,因此他们希望确保一切都能做到尽善尽美。
7/14/2025 3:10:48 PM
AI在线

S-LoRA:一个GPU运行数千大模型成为可能

一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法,通常用于将 base 模型适配到多种任务中,从而产生了大量从一个 base 模型衍生出来的 LoRA 适配程序。这种模式为服务过程中的批量推理提供了大量机会。LoRA 的研究表明了一点,只对适配器权重进行微调,就能获得与全权重微调相当的性能。虽然这种方法可以实现单个适配器
11/15/2023 3:04:00 PM
机器之心

大模型时代还不理解自注意力?这篇文章教你从头写代码实现

自注意力是 LLM 的一大核心组件。对大模型及相关应用开发者来说,理解自注意力非常重要。近日,Ahead of AI 杂志运营者、机器学习和 AI 研究者 Sebastian Raschka 发布了一篇文章,介绍并用代码从头实现了 LLM 中的自注意力、多头注意力、交叉注意力和因果注意力。太长不看版这篇文章将介绍 Transformer 架构以及 GPT-4 和 Llama 等大型语言模型(LLM)中使用的自注意力机制。自注意力等相关机制是 LLM 的核心组件,因此如果想要理解 LLM,就需要理解它们。不仅如此,这
2/16/2024 5:06:00 PM
机器之心
  • 1