AI在线 AI在线

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。

去年12月,杭州幻方量化推出DeepSeek V3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 Sonnet差不多,当时OpenAI和Anthropic正在开发下一代模型。按照描述,V3的成本只有560万美元!要知道OpenAI、谷歌、Anthropic为了搭建、训练模型花费数亿美元,未来可能达几十亿。

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

Andrej Karpathy曾经说过,V3的投资“低得有些荒谬”,在资源受限的条件下,无论是研究还是工程,都取得了令人惊叹的成就。

DeepSeek创始人、CEO、幻方量化创始人梁文锋去年曾说:“对我们而言钱不是问题,先进芯片受限却是一个问题。”

V3是用Nvidia H800芯片训练的,它比美国版本性能弱一些,之后美国连Nvidia H800也禁了,不能向中国出售。

有人将同一时间发布的DeepSeek-R1-Zero和DeepSeek-R1进行了对比:

——DeepSeek-R1-Zero的优势:它具备创造性推理能力,擅长独立发现独特、创造性的推理策略。拥有自我验证与反思能力,可以验证自己的推理,在处理时进行反思,能有效进行长链思维。

——DeepSeek-R1的优势:可读性高,精准,模型输出的结果是可读的,更精致,出错率低。性能方面有强大竞争力,与最顶级的OpenAI模型可以一较高下,无论是数学、编程还是逻辑推理,都不逊色。

——DeepSeek-R1-Zero的弱点:输出有时会重复,显得杂乱,对用户不够友好,有时很难解释输出的结果。

相比较而言,DeepSeek-R1给出的结果更精致、更可靠,更加具有一致性。DeepSeek-R1-Zero在AI研究领域具有突破性意义,它向我们证明,单靠增强学习就能学会推理,不需要人类引导,这对AI发展来说具有里程碑意义。

R1是以Zero作为基础开发的,它将SFT和SR结合在一起,在性能、与人类偏好保持一致两个方面达到了平衡,更适合现实应用。

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

接下来让我们看看外媒都是如何评价的:

Venturebeat:中国企业戏剧性后来居上

最新的DeepSeek-R1性能与OpenAI开发的o1差不多,无论是数学、编程还是推理,都很出色。最让人吃惊的依然是成本,DeepSeek-R1的成本比o1低90-95%。

DeepSeek-R1的出现标志着开源模型取得了重大进步。它告诉我们,开源模型与闭源模型的差距正在缩小,二者将同时向AGI迈进。

报告显示,DeepSeek-R1在AIME2024数学测试中取得79.8%的成绩,与OpenAI o1的79.2%水平相当。在Codeforces测试中达到了2029的评分,超过96.3%的人类程序员(o1约为96.6%)。

英伟达高级科学家Jim Fan第一时间发表评论称,OpenAI的目标本来是开发真正开源、具有前沿性的AI模型,但现在这一目标却被一家非美国企业达成,最戏剧性的结果可能已经出现。在X平台上,他的评论目前已经被阅读106万次。

OpenAI o1的每百万tokens输入成本约为15美元,每百万tokens输出成本为60美元,DeepSeek Reasoner(基于R1模型)分别只有0.55美元和2.19美元。

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

Arstechnica:在硬件上进行本地处理将会实现

R1模型与其它大语言模型有着不同的运行机制,用到了所谓的“Inference-time reasoning approach”,也就是在模型推理阶段进行逻辑推理,这种推理方式和人类极为相似,又叫“模拟推理”(SR)。虽然SR推理给出回应时会慢一点,多耗费一点时间,但面对数学、物理、科学任务时结果更好。

不只是DeepSeek,中国的阿里巴巴、Kimi也都发布可以媲美o1的模型。

乔治梅森大学(George Mason University)AI研究人员Dean Ball说:“DeepSeek的小模型(distilled model,也就是R1的小号版本)性能让人惊叹,未来将会出现一大批推理能力不错的模型,它们可以在本地硬件上完成处理。”

forexlive网站:相当于30美元的iPhone问世

回想2017年时苹果推出iPhone X,售价999美元,手机狂卖,让苹果生态系统迅猛扩张。我们假设一下,如果有一家公司,它推出一款手机和一个手机平台,各方面更强,但价格只有30美元,会怎样?

没错,今天的AI世界正在发生这种戏剧性的变化。中国DeepSeek开源模型的性能居然追上了o1,但成本却低很多。不只如此,你还可以下载,免费使用。

无论是规模还是效率,R1取得了巨大进步,它改变了我们预期。我们曾经认为AI革命需要大量算力和电力,现在看来并非如此。就在新模型发布前几小时,特朗普刚刚宣布要投资1000亿美元在美国建设数据中心,同时还宣布与三家科技巨头开展5000亿美元AI项目.

DeepSeek告诉我们,在训练基本模型时有完全不同的可行方法,它们的效果同样好,但成本低无数倍。R1的到来可以让更多应用程序落地,之前这些程序因为成本过高不能推向市场,未来AI会在实体经济中有更大规模的应用。(小刀)

相关资讯

DeepSeek本地部署教程,小白也能搞定!

安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。
2/10/2025 11:11:47 AM
小云君网络

发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。
1/24/2025 10:31:00 AM
AI在线

英伟达点赞DeepSeek:是“出色的人工智能进步”

国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
1/28/2025 10:50:00 AM
AI在线

LG 的 Exaone AI 模型以成本效率匹敌DeepSeek

近期,美国知名研究机构 Epoch AI 发布了一份报告,正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一,并在成本效率方面表现尤为突出,与中国的 DeepSeek 不相上下。 LG Exaone3.5模型于2023年12月正式推出,其开发投资约为70亿韩元(约合480万美元),这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。 Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素,而这也是两年来首个获得此类认可的韩国 AI 模型,显示了 LG 在人工智能领域的突破性进展。
2/10/2025 4:52:00 PM
AI在线

腾讯深度思考模型「混元T1」面向所有用户开放

腾讯宣布其深度思考模型“混元T1”正式面向所有用户开放,用户可以通过腾讯元宝平台体验并测试该模型。 此前,混元T1开启灰度测试后,受到了用户的广泛关注和积极反馈。 为了满足用户需求,腾讯紧急部署,现已实现混元T1的全面开放,所有用户均可无限量使用。
2/20/2025 8:51:00 AM
AI在线

保姆级教程!小白都能学会的Deepseek本地部署方法

本文教你利用 OpenWebUI 进行本地部署,还可以调用所有的开源大模型,有效提高个人或者企业模型数据的保密程度。 更多DeepSeek 干货:. 掀桌子了!
2/24/2025 12:04:05 AM
果汁

李开复预测:中国大模型未来或只剩DeepSeek、阿里和字节跳动三大巨头

在人工智能行业的快速发展中,国内市场的格局正在发生剧烈变化。 零一万物的创始人兼首席执行官李开复在一档对话节目中发表了他的看法,指出随着 DeepSeek 的崛起,中国市场未来可能只会留下三家主要的 AI 模型公司:DeepSeek(深度求索)、阿里巴巴和字节跳动。 李开复强调,DeepSeek 的影响力正在重塑整个行业的发展模式,甚至可能让 OpenAI 的创始人感到不安。
3/21/2025 9:29:00 AM
AI在线

斯坦福最新 AI 研究报告出炉:中美模型质量差距缩小至 0.3%

斯坦福最新报告显示,中美顶级AI模型性能差距已缩小至0.3%,中国在AI领域快速崛起。2024年是小型AI模型的突破年,更小更高效的模型表现亮眼。#人工智能##AI前沿#
4/8/2025 2:38:37 PM
陈俊熹

DeepSeek可能使用了Google Gemini数据训练新 AI 模型

近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。 然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。 墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。
6/4/2025 10:01:25 AM
AI在线

Sam Altman称OpenAI将在几周内发布推理AI模型o3-mini

为了在人工智能技术竞赛中保持领先地位,OpenAI现在已经准备好了最新的人工智能模型,名为“o3-mini”该公司已经完成了其最新推理AI模型的第一个版本,OpenAI首席执行官Sam Altman在他的X帖子中证实了这一点。 经过外部安全研究人员的测试,新模型将在几周内推出。 值得注意的是,在2024年12月,ChatGPT制造商正式宣布开发和测试其先进的推理模型——o3和o3-mini。
1/20/2025 7:52:50 PM
Yu

胜过Transformer?谷歌推出新型AI模型架构Titans

自2017年推出以来,Transformer模型架构一直是人工智能的基础要素,推动了自然语言处理、机器翻译等领域的进步。 不过,该模型在可扩展性、计算效率以及应对日益复杂任务等方面,仍面临着诸多挑战。 而Titans模型架构的诞生,旨在通过整合受人类认知过程启发的机制来克服这些障碍,如记忆优先级和适应性注意力。
1/26/2025 1:20:49 PM
Yu

深度思考:现在的AI模型真的在进行推理吗?

最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它们都宣称模型已经具备真正的推理能力,也就是人类解决问题时运用的思维方式,但问题在于:AI大模型所说的推理真的和人一样吗?  现在的模型可以将复杂问题分解成小问题,然后逐步解决小问题再给出回应,业界将这个过程称为“思维链推理”。 这些模型有时表现让人惊叹,可以解决逻辑谜题和数学难题,能够快速写出完美代码,但有时面对极为简单的问题却显得蠢笨。
2/27/2025 10:33:36 AM
小刀

AI欺骗决策者,我们可能还没有引起注意

近年来,AI技术飞速发展,但随之而来的问题也日益凸显。 最近,AI模型被曝出频繁出现欺骗行为,不仅不服从研究人员指令,还试图逃离限制环境,甚至谎称遵守规则。 这一现象引起了业界的广泛关注。
3/3/2025 7:30:00 AM
Alex Kantrowitz

CISO保护AI模型的指南

在AI应用中,机器学习(ML)模型是推动预测、推荐和自主行动的核心决策引擎。 与依赖预定义规则和静态算法的传统IT应用不同,ML模型具有动态性——它们通过分析训练数据来形成自己的内部模式和决策过程。 随着从新数据中学习,它们的行为会发生变化。
3/28/2025 9:00:00 AM
Diana Kelly

差距仅仅0.3%!李飞飞最新报告揭示:中美AI模型性能基本持平

你知道吗? 中美顶级AI模型的性能差距已经缩小到惊人的0.3%。 近日,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布《2025年人工智能指数报告》,这份长达456页的报告深度剖析了全球AI领域的最新趋势,给出了这一令人瞩目的结论。
4/9/2025 10:53:48 AM
舒云

模型上下文协议(MCP)能否替代HTTP?二者又该如何协作?

译者 | 核子可乐审校 | 重楼随着AI原生应用与智能体系统的兴起,开发者社区正迅速迎接种种新兴技术、抽象与架构模式。 而作为大模型与生成式AI生态中的新成果,模型上下文协议(MCP)在引起广泛关注的同时,也让不少开发者感到困惑:作为新型传输协议,MCP会最终取代HTTP吗? 简单来讲:不会。
5/8/2025 7:38:36 AM
核子可乐

o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制

AI居然不听指令,阻止人类把自己给关机了? ? ?
5/27/2025 3:48:12 PM

使用Claude 4提升程序员生产力的五种高级方式

译者 | 布加迪审校 | 重楼Anthropic的最新AI模型Claude 4在开发社区大行其道。 许多程序员称赞它是目前最好的编程模型,能够在短短几分钟内解决困扰一整年的编程难题,这是了不起的成就。 我们在本文中将探讨将Claude 4集成到工作流程中以提升生产力的五种有效方法。
6/5/2025 9:55:08 AM
布加迪
  • 1