R1

DeepSeek R1模型震撼AI界:低成本高效能引领行业“效率”新赛道

今年1月，DeepSeek发布的R1模型不仅是一次普通的AI公告，更被誉为科技行业的“分水岭”，其影响力震动了整个科技行业，迫使行业领导者重新思考AI开发的基本方法。 DeepSeek的非凡成就并非源于新颖的功能，而是它以极低的成本实现了与科技巨头相媲美的成果，这标志着AI发展正沿着“效率”和“计算”两条并行轨道快速前进。在约束中创新:低成本实现高性能DeepSeek的异军突起令人瞩目，它展现了即使在重大限制下，创新也能蓬勃发展的能力。

6/16/2025 1:01:09 PM AI在线

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？（此前该公司发布Ministral 3B/8B时，声称“始终优于同行”，却没有对比Qwen2.5）图片图片在该模型发布的前几个小时，Mistral AI的CEO Arthur Mensch在接受炉边访谈时声称即将发布的Magistral能够与其他所有竞争对手相抗衡。

6/11/2025 2:28:34 PM

全面解读：新版R1低调升级！编程强到起飞直追o3-high，支持30分钟以上长思考，推理、写作都进化了！

出品 | 51CTO技术栈（微信号：blog51cto）DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”！图片这波有多低调呢？ DeepSeek 又是“0 宣发”出手，连一句英文公告都没有。

5/29/2025 1:05:32 PM 伊风

DeepSeek 全新开源R1-0528 模型登场，性能媲美 OpenAI o3 模型

今天凌晨，知名的开源大模型平台 DeepSeek 发布了其最新版本 R1（0528），引起了广泛关注。此次发布没有附带详细说明，DeepSeek 选择了 “悄然” 开放模型，预计后续会发布模型卡，进一步介绍其功能。据悉，R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示，其表现与 OpenAI 最新的 o3模型相当。

5/29/2025 9:00:51 AM AI在线

蚂蚁武威：下一代「推理」模型范式大猜想

R1 之后，长思维链成为研究下一代基础模型中 “推理”（Reasoning）能力的热门方向。一方面，R1 证明了大模型深度思考的可行性；与此同时，尽管 R1 展现出了强大的性能，大模型推理的序幕实则才刚刚拉开。此外，R1 在海外掀桌也给国内人工智能的研究带来一个显著影响，即：越来越多的研究者敢于站在更高视角思考，提出前瞻引领的技术思想。

5/21/2025 12:10:00 AM 陈彩娴

全新音频问答模型 Omni-R1：利用文本驱动的强化学习和自动生成的数据推进音频问答

最近，一项来自 MIT CSAIL、哥廷根大学、IBM 研究所等机构的研究团队提出了一个名为 Omni-R1的全新音频问答模型。该模型在 Qwen2.5-Omni 的基础上，通过一种名为 GRPO（Group Relative Policy Optimization）的强化学习方法进行优化，显示出在音频问答任务中的出色表现。 Omni-R1在著名的 MMAU 基准测试中创造了新的最先进成绩，涵盖了声音、语音和音乐等多个音频类别。

5/20/2025 12:00:55 PM AI在线

文生图进入R1时代：港中文MMLab发布T2I-R1，让AI绘画“先推理再下笔”

“先推理、再作答”，语言大模型的Thinking模式，现在已经被拓展到了图片领域。近日，港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型：T2I-R1。大家都知道，OpenAI o1和DeepSeek-R1这类的大语言模型（LLMs），已经在解数学题和写代码这些需要“动脑筋”的事情上面展现出了较高的水平。

5/13/2025 1:54:41 PM 量子位

性能与效率的双赢:Qwen3横空出世，MoE架构大幅降低部署成本

阿里云旗下通义千问（Qwen）团队正式发布Qwen3系列模型，共推出8款不同规格的模型，覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型，也是首个配备混合思维模式的国产模型。模型阵容丰富，满足各类部署需求Qwen3系列包含6款Dense模型和2款MoE模型:Dense模型:0.6B、1.7B、4B、8B、14B、32BMoE模型:Qwen3-235B-A22B （总参数235B，激活参数22B）Qwen3-30B-A3B （总参数30B，激活参数3B）所有模型均支持128K上下文窗口，并配备了可手动控制的"thinking"开关，实现混合思维模式。

4/29/2025 4:00:41 PM AI在线

刚刚，Qwen3强势登顶，成开源新王！国内首个混合推理模型，235B击败R1、o1!源神火力全开：全系列8个模型一口气开源！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）源神 Qwen3 赶在五一假期前重磅上线！这次 Qwen3 直接放出了一整个“全家桶” ——总共 8 个模型，包括 2 个 MoE（稀疏专家）模型和 6 个稠密模型，规模从 0.6B 到 235B 不等，阵容堪称豪华。图片其中，旗舰模型 Qwen3-235B-A22B 强势登顶，成为新一代开源之王！

4/29/2025 7:39:45 AM 伊风

李飞飞/DeepSeek前员工领衔，复现R1强化学习框架，训练Agent在行动中深度思考

什么开源算法自称为DeepSeek-R1（-Zero）框架的第一个复现？新强化学习框架RAGEN，作者包括DeepSeek前员工Zihan Wang、斯坦福李飞飞团队等，可训练Agent在行动中深度思考。图片论文一作Zihan Wang在DeepSeek期间参与了Deepseek-v2和Expert Specialized Fine-Tuning等工作，目前在美国西北大学读博。

4/25/2025 1:34:53 PM

亚洲崛起：DeepSeek、巨额投资与数据中心助力 AI 竞争力

在今年的达沃斯世界经济论坛上，众多商界和政界领袖齐聚一堂，普遍认为美国科技巨头在人工智能（AI）领域占据主导地位，而中国乃至整个亚洲似乎都在这一赛道上滞后。然而，在与会者离开后，这种看法开始遭遇挑战。首先，来自中国的一家名不见经传的对冲基金 —— 深度寻求（DeepSeek）在这一时刻引发了全球的注意。

4/18/2025 10:01:28 AM AI在线

成效初显！基于DeepSeek强化学习的医疗VLM策略来了

编辑 | ScienceAI在人工智能跨界医疗的浪潮中，如何赋能视觉语言模型（VLM）去 “看懂” 多种类型的医学影像，并在疾病诊断、病灶分析等任务中给出可信解释，已成关键挑战。近期，来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略，称之为 “Med-R1”，通过鼓励模型在 “推理过程” 上不断探索，大大提升了跨模态、跨任务的泛化能力。本文将结合实验结果和推理案例，为大家展示 DeepSeek 在医疗 VLM 中的实战成效。

3/21/2025 2:05:00 PM ScienceAI

招商证券：公司目前已部署DeepSeek系列模型接入办公交流软件

招商证券在互动平台表示，公司已部署DeepSeek系列模型，当前主要接入公司办公交流软件，支持员工日常办公需要。未来公司将全方位使用R1 类强推理模型进行业务数智化升级，围绕智能投顾、智能投资、智能投研等核心业务进行落地探索。

3/19/2025 5:58:00 PM AI在线

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

2025年3月6日，一款名为 **Light-R1-32B** 的全新语言模型正式亮相。这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器，经过特别训练，以其卓越的数学解题能力、低廉的训练成本以及可复现性，成为人工智能领域的一大亮点。开发团队xAI表示，Light-R1-32B不仅在性能上超越同类模型，还为学术研究和实际应用提供了极具价值的参考。

3/7/2025 10:00:29 AM AI在线

三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级

三星近日宣布，中国市场发售的Galaxy S25系列正式整合DeepSeek-R1大模型，进一步提升其AI功能。据三星中国官方消息，用户无需额外下载App或注册账号，只需将三星生活助手升级至最新版本，或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体，即可体验包括深度思考、联网搜索、情绪价值、上下文记忆及视觉解析在内的多项AI功能。通过接入DeepSeek-R1，Galaxy S25系列实现了多模态感知与跨应用执行能力的显著提升。

3/4/2025 11:20:00 AM AI在线

中信特钢成功接入 DeepSeek-R1 大模型，推进数字化转型

中信特钢在数字化转型领域迈出了重要一步，近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。公司表示，未来将致力于推动数字技术与实体经济的深度融合，以此为基础进行全方位的改革，力求加快构建数据资产并挖掘数据的潜在价值。中信特钢在推进智能运维方面的努力，是企业在激烈市场竞争中的一项战略举措。

3/3/2025 5:57:00 PM AI在线

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

在人工智能（AI）技术快速发展的今天，DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟，推动 AGI(通用人工智能)的高效发展。为了实现这一目标，DeepSeek 采用了跨节点专家并行(Expert Parallelism，EP)技术，显著提高了 GPU 的计算效率，并在降低延迟的同时，扩展了批处理规模。

3/3/2025 9:45:00 AM AI在线

DeepSeek揭秘:AI推理系统背后的545%惊人利润率

DeepSeek在知乎开设官方账号，发布了《DeepSeek-V3/R1推理系统概览》技术文章，首次详细披露其模型推理系统的优化细节和成本利润率信息，标志着备受关注的"DeepSeek开源周"正式结束。文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐，更低的延迟"。为实现这些目标，DeepSeek采用了大规模跨节点专家并行（EP）技术，尽管这增加了系统复杂性。

3/2/2025 10:26:00 AM AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

R1

DeepSeek R1模型震撼AI界:低成本高效能引领行业“效率”新赛道

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

全面解读：新版R1低调升级！编程强到起飞直追o3-high，支持30分钟以上长思考，推理、写作都进化了！

DeepSeek 全新开源R1-0528 模型登场，性能媲美 OpenAI o3 模型

蚂蚁武威：下一代「推理」模型范式大猜想

全新音频问答模型 Omni-R1：利用文本驱动的强化学习和自动生成的数据推进音频问答

文生图进入R1时代：港中文MMLab发布T2I-R1，让AI绘画“先推理再下笔”

性能与效率的双赢:Qwen3横空出世，MoE架构大幅降低部署成本

刚刚，Qwen3强势登顶，成开源新王！国内首个混合推理模型，235B击败R1、o1!源神火力全开：全系列8个模型一口气开源！

李飞飞/DeepSeek前员工领衔，复现R1强化学习框架，训练Agent在行动中深度思考

亚洲崛起：DeepSeek、巨额投资与数据中心助力 AI 竞争力

成效初显！基于DeepSeek强化学习的医疗VLM策略来了

招商证券：公司目前已部署DeepSeek系列模型 接入办公交流软件

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级

中信特钢成功接入 DeepSeek-R1 大模型，推进数字化转型

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

DeepSeek揭秘:AI推理系统背后的545%惊人利润率

招商证券：公司目前已部署DeepSeek系列模型接入办公交流软件