AI在线 AI在线

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。 帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接()以及相关配图。 网友难免会联想猜测:也许DeepSeek R2 即将上线发布。

昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接(https://huggingface.co/deepseek-ai)以及相关配图。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

网友难免会联想猜测:也许DeepSeek R2 即将上线发布。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

紧接着就是各种有关DeepSeekR2的离谱谣言:

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

一位X用户“预告”:

“Deepseek-R2 明天或周三发布,在大多数基准测试中比 o3 稍差,但便宜 97%,幻觉更少。”

当然最多疯传的则是未经证实的“参数和细节”——

(1)拥有 1.2 万亿参数,活跃参数为 780 亿,采用混合 MoE 架构

(2)成本比 GPT-4o 便宜 97.3%(输入每百万次 0.07 美元,输出每百万次 0.27 美元)

(3)使用了 5.2PB 的训练数据,在 C-Eval2.0 测试中取得了 89.7% 的得分

(4)视觉能力更强,在 COCO 测试集上达到了 92.4%

(5)某国产芯片910B利用率达82%

(6)大规模转移,远离美国供应链。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

传的煞有其事,不过据小编看到业内人士对此事的反应:从疯传的部分图片来源看,是一个炒股网站。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

所以,DeepSeek又被某些人“薅羊毛”了。可以肯定这些参数肯定是谣言。

DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了

另外,X上已经有别有用心的用户注册了DeepSeek R2的昵称,大家注意防诈。

不过大家对于R2的发布充满了期待,小编上周在做直播栏目时,嘉宾表示对于多模态推理方面很有期待,希望R2能给出更多的意外之喜。

截至发稿时,DeepSeek 和 Qwen 官方均未对相关传闻作出回应。

相关资讯

打破「非此即彼」,平衡 AI 与物理,中国科学院提出建立可学习的气候模型

平衡 AI-物理模型示意图。编辑 | X人工智能(AI)迅速发展,大模型正在重新定义我们理解和应对气候挑战的方式。AI 模型已经席卷了大气科学的各个领域。今年年初,中国科学院大气物理研究所黄刚研究员团队将物理与 AI 融合,提升了数值模式的降水预报技巧。近日,黄刚团队联合中国科学院大学、青岛海洋科学与技术国家实验室、同济大学和首尔国立大学在《Advances in Atmospheric Sciences》上,发表了题为「Toward a Learnable Climate Model in the Artific
5/2/2024 5:14:00 PM
ScienceAI

预测所有物种DNA、RNA、蛋白质的形式和功能,Arc、斯坦福、NVIDIA发布最大AI生物模型Evo2

编辑 | 萝卜皮所有生命都用 DNA 编码信息。 虽然测序、合成和编辑基因组代码的工具已经改变了生物学研究,但智能地编写新的生物系统还需要深入了解基因组编码的巨大复杂性。 科学家们今天发布了他们所称的有史以来最大的生物学人工智能(AI)模型——Evo-2。
2/20/2025 2:57:00 PM
ScienceAI

干货速递,百度BML自动超参搜索技术原理揭秘与实战攻略!

在人工智能领域,算法工程师在训练神经网络模型的过程中,完成网络构建和准备好训练数据后,往往需要对模型进行各种参数优化,以获得更好的模型效果。但调参其实并不简单,背后往往是通宵达旦的参数调试与效果验证,并需要做大量的实验,不仅耗时也耗费大量算力。这个时候,往往想尝试自动超参搜索,但又开始担心算力要求所带来的额外训练成本。莫慌!百度全功能AI开发平台BML带着免费算力额度与自动超参搜索能力来了!先来介绍百度最近全新升级的BML,何方神圣?全功能AI开发平台BML(Baidu Machine Learning) ,是为企
8/11/2021 3:37:00 PM
百度大脑
  • 1