R1
DeepSeek R1模型震撼AI界:低成本高效能引领行业“效率”新赛道
                        今年1月,DeepSeek发布的R1模型不仅是一次普通的AI公告,更被誉为科技行业的“分水岭”,其影响力震动了整个科技行业,迫使行业领导者重新思考AI开发的基本方法。 DeepSeek的非凡成就并非源于新颖的功能,而是它以极低的成本实现了与科技巨头相媲美的成果,这标志着AI发展正沿着“效率”和“计算”两条并行轨道快速前进。 在约束中创新:低成本实现高性能DeepSeek的异军突起令人瞩目,它展现了即使在重大限制下,创新也能蓬勃发展的能力。
                    
                    6/16/2025 1:01:09 PM
                        AI在线
                    新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了
                        “欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。 然而再一次遭到网友质疑:怎么又不跟最新版Qwen和DeepSeek R1 0528对比? (此前该公司发布Ministral 3B/8B时,声称“始终优于同行”,却没有对比Qwen2.5)图片图片在该模型发布的前几个小时,Mistral AI的CEO Arthur Mensch在接受炉边访谈时声称即将发布的Magistral能够与其他所有竞争对手相抗衡。
                    
                    6/11/2025 2:28:34 PM
                        
                    全面解读:新版R1低调升级!编程强到起飞直追o3-high,支持30分钟以上长思考,推理、写作都进化了!
                        出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”! 图片这波有多低调呢? DeepSeek 又是“0 宣发”出手,连一句英文公告都没有。
                    
                    5/29/2025 1:05:32 PM
                        伊风
                    DeepSeek 全新开源R1-0528 模型登场,性能媲美 OpenAI o3 模型
                        今天凌晨,知名的开源大模型平台 DeepSeek 发布了其最新版本 R1(0528),引起了广泛关注。 此次发布没有附带详细说明,DeepSeek 选择了 “悄然” 开放模型,预计后续会发布模型卡,进一步介绍其功能。 据悉,R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示,其表现与 OpenAI 最新的 o3模型相当。
                    
                    5/29/2025 9:00:51 AM
                        AI在线
                    蚂蚁武威:下一代「推理」模型范式大猜想
                        R1 之后,长思维链成为研究下一代基础模型中 “推理”(Reasoning)能力的热门方向。 一方面,R1 证明了大模型深度思考的可行性;与此同时,尽管 R1 展现出了强大的性能,大模型推理的序幕实则才刚刚拉开。 此外,R1 在海外掀桌也给国内人工智能的研究带来一个显著影响,即:越来越多的研究者敢于站在更高视角思考,提出前瞻引领的技术思想。
                    
                    5/21/2025 12:10:00 AM
                        陈彩娴
                    全新音频问答模型 Omni-R1:利用文本驱动的强化学习和自动生成的数据推进音频问答
                        最近,一项来自 MIT CSAIL、哥廷根大学、IBM 研究所等机构的研究团队提出了一个名为 Omni-R1的全新音频问答模型。 该模型在 Qwen2.5-Omni 的基础上,通过一种名为 GRPO(Group Relative Policy Optimization)的强化学习方法进行优化,显示出在音频问答任务中的出色表现。 Omni-R1在著名的 MMAU 基准测试中创造了新的最先进成绩,涵盖了声音、语音和音乐等多个音频类别。
                    
                    5/20/2025 12:00:55 PM
                        AI在线
                    文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”
                        “先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。 近日,港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型:T2I-R1。 大家都知道,OpenAI o1和DeepSeek-R1这类的大语言模型(LLMs),已经在解数学题和写代码这些需要“动脑筋”的事情上面展现出了较高的水平。
                    
                    5/13/2025 1:54:41 PM
                        量子位
                    性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本
                        阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。 这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备混合思维模式的国产模型。 模型阵容丰富,满足各类部署需求Qwen3系列包含6款Dense模型和2款MoE模型:Dense模型:0.6B、1.7B、4B、8B、14B、32BMoE模型:Qwen3-235B-A22B (总参数235B,激活参数22B)Qwen3-30B-A3B (总参数30B,激活参数3B)所有模型均支持128K上下文窗口,并配备了可手动控制的"thinking"开关,实现混合思维模式。
                    
                    4/29/2025 4:00:41 PM
                        AI在线
                    刚刚,Qwen3强势登顶,成开源新王!国内首个混合推理模型,235B击败R1、o1!源神火力全开:全系列8个模型一口气开源!
                        编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)源神 Qwen3 赶在五一假期前重磅上线! 这次 Qwen3 直接放出了一整个“全家桶” ——总共 8 个模型,包括 2 个 MoE(稀疏专家)模型和 6 个稠密模型,规模从 0.6B 到 235B 不等,阵容堪称豪华。 图片其中,旗舰模型 Qwen3-235B-A22B 强势登顶,成为新一代开源之王!
                    
                    4/29/2025 7:39:45 AM
                        伊风
                    李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考
                        什么开源算法自称为DeepSeek-R1(-Zero) 框架的第一个复现? 新强化学习框架RAGEN,作者包括DeepSeek前员工Zihan Wang、斯坦福李飞飞团队等,可训练Agent在行动中深度思考。 图片论文一作Zihan Wang在DeepSeek期间参与了Deepseek-v2和Expert Specialized Fine-Tuning等工作,目前在美国西北大学读博。
                    
                    4/25/2025 1:34:53 PM
                        
                    亚洲崛起:DeepSeek、巨额投资与数据中心助力 AI 竞争力
                        在今年的达沃斯世界经济论坛上,众多商界和政界领袖齐聚一堂,普遍认为美国科技巨头在人工智能(AI)领域占据主导地位,而中国乃至整个亚洲似乎都在这一赛道上滞后。 然而,在与会者离开后,这种看法开始遭遇挑战。 首先,来自中国的一家名不见经传的对冲基金 —— 深度寻求(DeepSeek)在这一时刻引发了全球的注意。
                    
                    4/18/2025 10:01:28 AM
                        AI在线
                    成效初显!基于DeepSeek强化学习的医疗VLM策略来了
                        编辑 | ScienceAI在人工智能跨界医疗的浪潮中,如何赋能视觉语言模型(VLM)去 “看懂” 多种类型的医学影像,并在疾病诊断、病灶分析等任务中给出可信解释,已成关键挑战。 近期,来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略,称之为 “Med-R1”,通过鼓励模型在 “推理过程” 上不断探索,大大提升了跨模态、跨任务的泛化能力。 本文将结合实验结果和推理案例,为大家展示 DeepSeek 在医疗 VLM 中的实战成效。
                    
                    3/21/2025 2:05:00 PM
                        ScienceAI
                    招商证券:公司目前已部署DeepSeek系列模型 接入办公交流软件
                        招商证券在互动平台表示,公司已部署DeepSeek系列模型,当前主要接入公司办公交流软件,支持员工日常办公需要。 未来公司将全方位使用R1 类强推理模型进行业务数智化升级,围绕智能投顾、智能投资、智能投研等核心业务进行落地探索。
                    
                    3/19/2025 5:58:00 PM
                        AI在线
                    Light-R1-32B:低成本高性能的数学解题新星闪耀登场
                        2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。 这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学解题能力、低廉的训练成本以及可复现性,成为人工智能领域的一大亮点。 开发团队xAI表示,Light-R1-32B不仅在性能上超越同类模型,还为学术研究和实际应用提供了极具价值的参考。
                    
                    3/7/2025 10:00:29 AM
                        AI在线
                    三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级
                        三星近日宣布,中国市场发售的Galaxy S25系列正式整合DeepSeek-R1大模型,进一步提升其AI功能。 据三星中国官方消息,用户无需额外下载App或注册账号,只需将三星生活助手升级至最新版本,或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体,即可体验包括深度思考、联网搜索、情绪价值、上下文记忆及视觉解析在内的多项AI功能。 通过接入DeepSeek-R1,Galaxy S25系列实现了多模态感知与跨应用执行能力的显著提升。
                    
                    3/4/2025 11:20:00 AM
                        AI在线
                    中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型
                        中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
                    
                    3/3/2025 5:57:00 PM
                        AI在线
                    DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
                        在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。 这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。 为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
                    
                    3/3/2025 9:45:00 AM
                        AI在线
                    DeepSeek揭秘:AI推理系统背后的545%惊人利润率
                        DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。 文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。 为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。
                    
                    3/2/2025 10:26:00 AM
                        AI在线
                    
        资讯热榜
    
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                