AI在线 AI在线

OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”

OpenAI CEO山姆・奥尔特曼宣布,原定初夏发布的开源模型将推迟至夏末,因团队取得‘意想不到且相当惊人’的成果。该模型旨在超越现有开源推理模型,如DeepSeek R1。行业竞争激烈,Mistral和Qwen近期也发布了新模型。#AI开源模型##OpenAI#

OpenAI 的开源模型发布计划出现了新的调整。该公司首席执行官山姆・奥尔特曼(Sam Altman)在周二于 X 平台上发布的一篇帖子中宣布,原计划于今年初夏推出的开源模型预计将推迟至夏末发布,不会在 6 月与公众见面。

OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”

AI在线注意到,奥尔特曼在帖子中写道:“我们将为开源权重模型多花一点时间,也就是说,大家可以在今年夏末期待它的到来,但不会是 6 月。”他还提到,OpenAI 的研究团队在开发过程中取得了一些“意想不到且相当惊人”的成果,这些成果将使得最终的开源模型“非常值得等待”,但需要更多时间来完善。

OpenAI 的开源模型原本计划具备与该公司 O 系列模型相似的“推理”能力,并且目标是超越其他现有的开源推理模型,例如 DeepSeek 的 R1 模型。自 OpenAI 首次宣布将推出开源模型以来,这一领域的竞争愈发激烈。就在本周二,另一家经常发布开源模型的人工智能实验室 Mistral 推出了其首个 AI 推理模型系列 Magistral。而在今年 4 月,中国的 AI 实验室 Qwen 也发布了一组混合 AI 推理模型,这些模型能够在深入推理问题和快速给出传统回答之间灵活切换。

为了在性能基准上取得更好的成绩,OpenAI 还考虑为其开源模型增加一些复杂的特性,以提升其竞争力。据 TechCrunch 此前报道,OpenAI 的领导层曾讨论过让开源模型能够连接到公司云端托管的 AI 模型,以处理复杂的查询请求。不过,目前尚不清楚这些功能是否会最终出现在开源模型中。

奥尔特曼此前曾表示,OpenAI 在开源模型方面站在了“历史的错误一边”。为了纠正这一形象,公司面临着巨大的压力,必须推出一款能够与行业内顶尖开源产品相媲美的开源模型。

相关资讯

DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源

还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。
1/19/2025 10:19:33 PM
汪淼

再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
1/28/2025 9:33:49 PM
汪淼

阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
1/27/2025 11:08:00 AM
AI在线
  • 1