AI在线 AI在线

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。 帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接()以及相关配图。 网友难免会联想猜测:也许DeepSeek R2 即将上线发布。

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接(https://huggingface.co/deepseek-ai)以及相关配图。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

网友难免会联想猜测:也许DeepSeek R2 即将上线发布。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

紧接着就是各种有关DeepSeekR2的离谱谣言:

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

一位X用户“预告”:

“Deepseek-R2 明天或周三发布,在大多数基准测试中比 o3 稍差,但便宜 97%,幻觉更少。”

当然最多疯传的则是未经证实的“参数和细节”——

(1)拥有 1.2 万亿参数,活跃参数为 780 亿,采用混合 MoE 架构

(2)成本比 GPT-4o 便宜 97.3%(输入每百万次 0.07 美元,输出每百万次 0.27 美元)

(3)使用了 5.2PB 的训练数据,在 C-Eval2.0 测试中取得了 89.7% 的得分

(4)视觉能力更强,在 COCO 测试集上达到了 92.4%

(5)某国产芯片910B利用率达82%

(6)大规模转移,远离美国供应链。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

传的煞有其事,不过据小编看到业内人士对此事的反应:从疯传的部分图片来源看,是一个炒股网站。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

所以,DeepSeek又被某些人“薅羊毛”了。可以肯定这些参数肯定是谣言。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

另外,X上已经有别有用心的用户注册了DeepSeek R2的昵称,大家注意防诈。

不过大家对于R2的发布充满了期待,小编上周在做直播栏目时,嘉宾表示对于多模态推理方面很有期待,希望R2能给出更多的意外之喜。

截至发稿时,DeepSeek 和 Qwen 官方均未对相关传闻作出回应。

相关资讯

OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座

OpenAI在8月初发布了开放权重模型家族gpt-oss,这是公司自2019年GPT-2以来首次真正意义上的开源动作。 仅仅两周后,一位研究者就将这一模型“拆解重组”,推出了与官方版本迥异的变体。 康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris,公开了名为gpt-oss-20b-base的新版本。
8/19/2025 2:10:00 AM

阿里最新模型真的猛! 真肝实测:硬刚GPT5,技压DS、月暗,情商比GPT5高,读懂下棋大爷淋雨4小时的倔犟,但我发现了一个问题

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)越来越有趣了! 连续两天,中国队一天推出了一个万亿参数模型。 昨天是Kimi的k2-0905,今天凌晨,则是阿里的Qwen3-Max-preview!
9/6/2025 6:54:33 PM
云昭

Kimi开源又放大招!20秒更新万亿参数的中间件来了

Kimi开源又双叒放大招了! 一个中间件,就能让Kimi K2的万亿模型参数进入“秒更时代”。 图片不仅支持一次性把更新完的权重从一个节点同时发送给所有节点,还能实现点对点动态更新。
9/11/2025 1:33:52 PM
  • 1