AI在线 AI在线

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。 帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接()以及相关配图。 网友难免会联想猜测:也许DeepSeek R2 即将上线发布。

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接(https://huggingface.co/deepseek-ai)以及相关配图。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

网友难免会联想猜测:也许DeepSeek R2 即将上线发布。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

紧接着就是各种有关DeepSeekR2的离谱谣言:

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

一位X用户“预告”:

“Deepseek-R2 明天或周三发布,在大多数基准测试中比 o3 稍差,但便宜 97%,幻觉更少。”

当然最多疯传的则是未经证实的“参数和细节”——

(1)拥有 1.2 万亿参数,活跃参数为 780 亿,采用混合 MoE 架构

(2)成本比 GPT-4o 便宜 97.3%(输入每百万次 0.07 美元,输出每百万次 0.27 美元)

(3)使用了 5.2PB 的训练数据,在 C-Eval2.0 测试中取得了 89.7% 的得分

(4)视觉能力更强,在 COCO 测试集上达到了 92.4%

(5)某国产芯片910B利用率达82%

(6)大规模转移,远离美国供应链。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

传的煞有其事,不过据小编看到业内人士对此事的反应:从疯传的部分图片来源看,是一个炒股网站。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

所以,DeepSeek又被某些人“薅羊毛”了。可以肯定这些参数肯定是谣言。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

另外,X上已经有别有用心的用户注册了DeepSeek R2的昵称,大家注意防诈。

不过大家对于R2的发布充满了期待,小编上周在做直播栏目时,嘉宾表示对于多模态推理方面很有期待,希望R2能给出更多的意外之喜。

截至发稿时,DeepSeek 和 Qwen 官方均未对相关传闻作出回应。

相关资讯

斯坦福最新研究:AI 的上下文比参数重要,无需重训、不再微调

大数据文摘出品近日,斯坦福大学与 SambaNova Systems 合作发表了论文《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》。 该论文提出了一个名为ACE(Agentic Context Engineering)的框架,可以让AI在不重新训练权重的前提下,实现自我改进。 图片论文链接:,大模型的能力,并非仅由参数决定,更取决于“上下文的质量”。
10/31/2025 4:06:19 PM

OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座

OpenAI在8月初发布了开放权重模型家族gpt-oss,这是公司自2019年GPT-2以来首次真正意义上的开源动作。 仅仅两周后,一位研究者就将这一模型“拆解重组”,推出了与官方版本迥异的变体。 康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris,公开了名为gpt-oss-20b-base的新版本。
8/19/2025 2:10:00 AM

阿里最新模型真的猛! 真肝实测:硬刚GPT5,技压DS、月暗,情商比GPT5高,读懂下棋大爷淋雨4小时的倔犟,但我发现了一个问题

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)越来越有趣了! 连续两天,中国队一天推出了一个万亿参数模型。 昨天是Kimi的k2-0905,今天凌晨,则是阿里的Qwen3-Max-preview!
9/6/2025 6:54:33 PM
云昭