DeepSeek新AI模型有多震撼？外媒：相当于30美元iPhone降临

DeepSeek（深度求索）再次推出新版开源AI模型，它的性能与美国最先进的AI模型虽然还有一些差距，但差距极小，成本低很多很多。西方许多人认为，美国限制中国AI发展的企图遇挫，中国正在加速前进，以更高效率打造高端AI模型。去年12月，杭州幻方量化推出DeepSeekV3开源大语言模型，它的性能与OpenAI 40和Anthropic Claude 3.5 .

DeepSeek（深度求索）再次推出新版开源AI模型，它的性能与美国最先进的AI模型虽然还有一些差距，但差距极小，成本低很多很多。西方许多人认为，美国限制中国AI发展的企图遇挫，中国正在加速前进，以更高效率打造高端AI模型。

去年12月，杭州幻方量化推出DeepSeek V3开源大语言模型，它的性能与OpenAI 40和Anthropic Claude 3.5 Sonnet差不多，当时OpenAI和Anthropic正在开发下一代模型。按照描述，V3的成本只有560万美元！要知道OpenAI、谷歌、Anthropic为了搭建、训练模型花费数亿美元，未来可能达几十亿。

Andrej Karpathy曾经说过，V3的投资“低得有些荒谬”，在资源受限的条件下，无论是研究还是工程，都取得了令人惊叹的成就。

DeepSeek创始人、CEO、幻方量化创始人梁文锋去年曾说：“对我们而言钱不是问题，先进芯片受限却是一个问题。”

V3是用Nvidia H800芯片训练的，它比美国版本性能弱一些，之后美国连Nvidia H800也禁了，不能向中国出售。

有人将同一时间发布的DeepSeek-R1-Zero和DeepSeek-R1进行了对比：

——DeepSeek-R1-Zero的优势：它具备创造性推理能力，擅长独立发现独特、创造性的推理策略。拥有自我验证与反思能力，可以验证自己的推理，在处理时进行反思，能有效进行长链思维。

——DeepSeek-R1的优势：可读性高，精准，模型输出的结果是可读的，更精致，出错率低。性能方面有强大竞争力，与最顶级的OpenAI模型可以一较高下，无论是数学、编程还是逻辑推理，都不逊色。

——DeepSeek-R1-Zero的弱点：输出有时会重复，显得杂乱，对用户不够友好，有时很难解释输出的结果。

相比较而言，DeepSeek-R1给出的结果更精致、更可靠，更加具有一致性。DeepSeek-R1-Zero在AI研究领域具有突破性意义，它向我们证明，单靠增强学习就能学会推理，不需要人类引导，这对AI发展来说具有里程碑意义。

R1是以Zero作为基础开发的，它将SFT和SR结合在一起，在性能、与人类偏好保持一致两个方面达到了平衡，更适合现实应用。

DeepSeek新AI模型有多震撼？外媒：相当于30美元iPhone降临

接下来让我们看看外媒都是如何评价的：

Venturebeat：中国企业戏剧性后来居上

最新的DeepSeek-R1性能与OpenAI开发的o1差不多，无论是数学、编程还是推理，都很出色。最让人吃惊的依然是成本，DeepSeek-R1的成本比o1低90-95%。

DeepSeek-R1的出现标志着开源模型取得了重大进步。它告诉我们，开源模型与闭源模型的差距正在缩小，二者将同时向AGI迈进。

报告显示，DeepSeek-R1在AIME2024数学测试中取得79.8%的成绩，与OpenAI o1的79.2%水平相当。在Codeforces测试中达到了2029的评分，超过96.3%的人类程序员（o1约为96.6%）。

英伟达高级科学家Jim Fan第一时间发表评论称，OpenAI的目标本来是开发真正开源、具有前沿性的AI模型，但现在这一目标却被一家非美国企业达成，最戏剧性的结果可能已经出现。在X平台上，他的评论目前已经被阅读106万次。

OpenAI o1的每百万tokens输入成本约为15美元，每百万tokens输出成本为60美元，DeepSeek Reasoner（基于R1模型）分别只有0.55美元和2.19美元。

DeepSeek新AI模型有多震撼？外媒：相当于30美元iPhone降临

Arstechnica：在硬件上进行本地处理将会实现

R1模型与其它大语言模型有着不同的运行机制，用到了所谓的“Inference-time reasoning approach”，也就是在模型推理阶段进行逻辑推理，这种推理方式和人类极为相似，又叫“模拟推理”（SR）。虽然SR推理给出回应时会慢一点，多耗费一点时间，但面对数学、物理、科学任务时结果更好。

不只是DeepSeek，中国的阿里巴巴、Kimi也都发布可以媲美o1的模型。

乔治梅森大学（George Mason University）AI研究人员Dean Ball说：“DeepSeek的小模型（distilled model，也就是R1的小号版本）性能让人惊叹，未来将会出现一大批推理能力不错的模型，它们可以在本地硬件上完成处理。”

forexlive网站：相当于30美元的iPhone问世

回想2017年时苹果推出iPhone X，售价999美元，手机狂卖，让苹果生态系统迅猛扩张。我们假设一下，如果有一家公司，它推出一款手机和一个手机平台，各方面更强，但价格只有30美元，会怎样？

没错，今天的AI世界正在发生这种戏剧性的变化。中国DeepSeek开源模型的性能居然追上了o1，但成本却低很多。不只如此，你还可以下载，免费使用。

无论是规模还是效率，R1取得了巨大进步，它改变了我们预期。我们曾经认为AI革命需要大量算力和电力，现在看来并非如此。就在新模型发布前几小时，特朗普刚刚宣布要投资1000亿美元在美国建设数据中心，同时还宣布与三家科技巨头开展5000亿美元AI项目.

DeepSeek告诉我们，在训练基本模型时有完全不同的可行方法，它们的效果同样好，但成本低无数倍。R1的到来可以让更多应用程序落地，之前这些程序因为成本过高不能推向市场，未来AI会在实体经济中有更大规模的应用。（小刀）

DeepSeek新AI模型有多震撼？外媒：相当于30美元iPhone降临

Venturebeat：中国企业戏剧性后来居上

Arstechnica：在硬件上进行本地处理将会实现

forexlive网站：相当于30美元的iPhone问世

相关资讯

DeepSeek本地部署教程，小白也能搞定！

发烧友！一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

英伟达点赞DeepSeek：是“出色的人工智能进步”