DeepSeek R1

中国大模型首登Nature封面！DeepSeek首次披露：R1训练只花200万

中国大模型首登Nature封面！DeepSeek首次披露：R1训练只花200万

Nature封面认证！ DeepSeek R1成果，又拿下了最新殊荣。就在最新的Nature新刊中，DeepSeek一举成为首家登上《Nature》封面的中国大模型公司，创始人梁文锋担任通讯作者。

9/18/2025 12:58:42 PM henry

DeepSeek-R1超级外挂！“人类最后的考试”首次突破30分，上海交大等开源方案碾压OpenAI、谷歌

DeepSeek-R1超级外挂！“人类最后的考试”首次突破30分，上海交大等开源方案碾压OpenAI、谷歌

西风发自凹非寺. 量子位 | 公众号 QbitAI“人类最后的考试”首次突破30分，还是咱国内团队干的！该测试集是出了名的超难，刚推出时无模型得分能超过10分。

7/9/2025 1:28:00 PM 西风

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

OPPO、一加手机操作系统官方微博 @ColorOS 今日发文宣布，OPPO 小布助手已率先升级 DeepSeek-R1 全新版本（海报显示为“最新版”），号称“从此思考更深，推理更强”。

6/9/2025 2:17:04 PM 归泷

DeepSeek-R1-0528 更新官方详解：思考更深、推理更强，整体表现接近 o3

DeepSeek-R1-0528 更新官方详解：思考更深、推理更强，整体表现接近 o3

DeepSeek R1 模型昨日宣布完成小版本升级，当前版本为 DeepSeek-R1-0528。用户通过官方网站、App 或小程序进入对话界面后，开启“深度思考”功能即可体验最新版本。API 也已同步更新，调用方式不变。

5/29/2025 8:16:57 PM 汪淼

DeepSeek R1 模型完成小版本试升级

DeepSeek R1 模型完成小版本试升级

DeepSeek 在官方交流群中发布通知：DeepSeek R1 模型已完成小版本试升级，欢迎前往官方网页、App、小程序测试（打开深度思考），API 接口和使用方式保持不变。

5/28/2025 8:25:22 PM 汪淼

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。近日，加州大学伯克利分校、UIUC、ETH Zurich、CMU 等机构的研究者观察到了这一现象，他们分析了 LRM 在执行智能体任务过程中存在的推理 - 行动困境，并着重强调了过度思考的危险。论文标题：The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks论文链接：「单机模式」下，这些模型在实时互动的环境中仍是「思想上的巨人，行动中的矮子」。

3/2/2025 2:07:00 PM 机器之心

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-mini

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-mini

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/25/2025 11:29:00 AM 机器之心

昆仑万维旗下 Opera 接入 DeepSeek R1 模型，支持本地个性化部署

昆仑万维旗下 Opera 接入 DeepSeek R1 模型，支持本地个性化部署

Opera 在 2024 年将内置本地大语言模型（LLM）引入 Web 浏览器，提供超 50 种 LLM 的访问权限。Opera Developer 利用 Ollama 框架（由 llama.cpp 实现）支持了 DeepSeek R1 系列模型部署。

2/19/2025 10:13:41 PM 归泷（实习）

200多行代码，超低成本复现DeepSeek R1「Aha Moment」！复旦大学开源

200多行代码，超低成本复现DeepSeek R1「Aha Moment」！复旦大学开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/18/2025 10:24:00 AM 机器之心

免费！「DeepSeek-R1 671B满血版」不卡、不限次！问小白火速支援

免费！「DeepSeek-R1 671B满血版」不卡、不限次！问小白火速支援

最近 DeepSeek 太火，问题来了，你是不是经常遇到这个情况？不卡顿、联网的、满血版 DeepSeek R1 越来越香，也越来越难享用到？问小白来了，火速上线、火线支援。

2/14/2025 10:16:00 AM 机器之心

玩转DeepSeek！5个超实用的新手技巧

玩转DeepSeek！5个超实用的新手技巧

大家好，我是小六，借着这次 DeepSeek 的热度，给大家分享一些关于 deepseek 的技巧。这个春节 DeepSeek 成为了互联网圈的热门话题，这两天一度登顶中、日、美三个 App Store 榜首。几乎一夜之间，所有人都在关注 DeepSeek，甚至在老家完全没用过 AI 的亲戚都在问 DeepSeek 是什么，怎么用。

2/12/2025 12:17:06 AM Mr.小六

爆肝48小时！学会这8招，让DeepSeek变得超好用！

爆肝48小时！学会这8招，让DeepSeek变得超好用！

更多相关介绍：. 重磅好文！ 8个章节带你全方位了解DeepSeek这两天，DeepSeek-R1 火的飞起，在中日美三个 Appstore 榜上登顶。

2/8/2025 12:04:55 AM 解决师Blue

免费！潞晨携手华为昇腾，国产算力DeepSeek R1推理API及云镜像服务来了

免费！潞晨携手华为昇腾，国产算力DeepSeek R1推理API及云镜像服务来了

DeepSeek-R1 系列模型的开源，因其出色的性能和低廉的开发成本，已引发全球的热切讨论和关注。潞晨科技携手华为昇腾，联合发布基于国产 910B 算力的 DeepSeek R1 系列推理 API，及云镜像服务。 DeepSeek R1 系列推理 API 免费体验在本次发布中，潞晨以自研国产推理引擎为技术底座，成功实现了国产华为昇腾 910B 算力与 DeepSeek R1 系列模型的推理适配优化，性能表现与使用高端 GPU 持平，为开发者提供高效、灵活、稳定的 AI 推理服务，助力企业实现降本增效，加速智能业务基于国产软硬件体系快速部署落地。

2/4/2025 8:39:00 PM 机器之心

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

AI 圈的头条被 DeepSeek 承包了十几天，昨天，OpenAI 终于坐不住了，推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型，而且相比之前的 o1 系列，成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型：刚刚上线，已经有网友迫不及待的拿它和席卷整个大模型圈的国产大模型 DeepSeek R1 进行对比了。

2/2/2025 11:54:00 PM 机器之心

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/2/2025 11:51:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉