AI在线 AI在线

R1

性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。 这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备混合思维模式的国产模型。 模型阵容丰富,满足各类部署需求Qwen3系列包含6款Dense模型和2款MoE模型:Dense模型:0.6B、1.7B、4B、8B、14B、32BMoE模型:Qwen3-235B-A22B (总参数235B,激活参数22B)Qwen3-30B-A3B (总参数30B,激活参数3B)所有模型均支持128K上下文窗口,并配备了可手动控制的"thinking"开关,实现混合思维模式。
4/29/2025 4:00:41 PM
AI在线

刚刚,Qwen3强势登顶,成开源新王!国内首个混合推理模型,235B击败R1、o1!源神火力全开:全系列8个模型一口气开源!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)源神 Qwen3 赶在五一假期前重磅上线! 这次 Qwen3 直接放出了一整个“全家桶” ——总共 8 个模型,包括 2 个 MoE(稀疏专家)模型和 6 个稠密模型,规模从 0.6B 到 235B 不等,阵容堪称豪华。 图片其中,旗舰模型 Qwen3-235B-A22B 强势登顶,成为新一代开源之王!
4/29/2025 7:39:45 AM
伊风

李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考

什么开源算法自称为DeepSeek-R1(-Zero) 框架的第一个复现? 新强化学习框架RAGEN,作者包括DeepSeek前员工Zihan Wang、斯坦福李飞飞团队等,可训练Agent在行动中深度思考。 图片论文一作Zihan Wang在DeepSeek期间参与了Deepseek-v2和Expert Specialized Fine-Tuning等工作,目前在美国西北大学读博。
4/25/2025 1:34:53 PM

亚洲崛起:DeepSeek、巨额投资与数据中心助力 AI 竞争力

在今年的达沃斯世界经济论坛上,众多商界和政界领袖齐聚一堂,普遍认为美国科技巨头在人工智能(AI)领域占据主导地位,而中国乃至整个亚洲似乎都在这一赛道上滞后。 然而,在与会者离开后,这种看法开始遭遇挑战。 首先,来自中国的一家名不见经传的对冲基金 —— 深度寻求(DeepSeek)在这一时刻引发了全球的注意。
4/18/2025 10:01:28 AM
AI在线

成效初显!基于DeepSeek强化学习的医疗VLM策略来了

编辑 | ScienceAI在人工智能跨界医疗的浪潮中,如何赋能视觉语言模型(VLM)去 “看懂” 多种类型的医学影像,并在疾病诊断、病灶分析等任务中给出可信解释,已成关键挑战。 近期,来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略,称之为 “Med-R1”,通过鼓励模型在 “推理过程” 上不断探索,大大提升了跨模态、跨任务的泛化能力。 本文将结合实验结果和推理案例,为大家展示 DeepSeek 在医疗 VLM 中的实战成效。
3/21/2025 2:05:00 PM
ScienceAI

招商证券:公司目前已部署DeepSeek系列模型 接入办公交流软件

招商证券在互动平台表示,公司已部署DeepSeek系列模型,当前主要接入公司办公交流软件,支持员工日常办公需要。 未来公司将全方位使用R1 类强推理模型进行业务数智化升级,围绕智能投顾、智能投资、智能投研等核心业务进行落地探索。
3/19/2025 5:58:00 PM
AI在线

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。 这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学解题能力、低廉的训练成本以及可复现性,成为人工智能领域的一大亮点。 开发团队xAI表示,Light-R1-32B不仅在性能上超越同类模型,还为学术研究和实际应用提供了极具价值的参考。
3/7/2025 10:00:29 AM
AI在线

三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级

三星近日宣布,中国市场发售的Galaxy S25系列正式整合DeepSeek-R1大模型,进一步提升其AI功能。 据三星中国官方消息,用户无需额外下载App或注册账号,只需将三星生活助手升级至最新版本,或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体,即可体验包括深度思考、联网搜索、情绪价值、上下文记忆及视觉解析在内的多项AI功能。 通过接入DeepSeek-R1,Galaxy S25系列实现了多模态感知与跨应用执行能力的显著提升。
3/4/2025 11:20:00 AM
AI在线

中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型

中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
3/3/2025 5:57:00 PM
AI在线

DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率

在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。 这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。 为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
3/3/2025 9:45:00 AM
AI在线

DeepSeek揭秘:AI推理系统背后的545%惊人利润率

DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。 文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。 为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。
3/2/2025 10:26:00 AM
AI在线

美的推出首款 DeepSeek 空调,语音控制新时代来临!

近日,美的正式发布了其首款搭载 DeepSeek 技术的空调 —— 鲜净感空气机 T6DeepSeek R1满血版。 这款新产品定于3月1日13:30全球首发,备受期待。 T6DeepSeek R1空调以 “空气智驾” 作为卖点,强调其卓越的自适应能力。
2/26/2025 8:58:00 PM
AI在线

中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”

当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。 ”Anthropic 官方表示。 简单来说,Claude 3.7 Sonnet 既能提供近乎即时的响应(标准模式,standard),也可以向用户直观展示其长时间的逐步思考过程(扩展思考模式,extended thinking)。
2/26/2025 10:10:12 AM
架构师秋天

百度教育「拍照搜题」、「AI写作文」接入DeepSeek-R1模型

2月25日,百度宣布其教育产品“拍照搜题”与“AI写作文”正式接入DeepSeek-R1模型,标志着百度在AI教育领域的重大技术升级。 此次接入将为用户带来更加智能、高效的学习体验,开启AI学习新时代。 百度教育产品此次接入DeepSeek-R1模型,旨在通过深度学习技术提升学习工具的智能化水平。
2/25/2025 2:07:00 PM
AI在线

吴泳铭预告的旗舰推理模型更了!阿里重磅推出QwQ-Max预览版,Agent或成正式版王炸;一手实测R1热门问题,各有千秋!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)吴泳铭亲自预告过的,阿里旗舰推理模型,新消息来了。 刚刚,它的预览版正式发布和上线体验——就是这个QwQ-Max-Preview! 一眼看去,我愿称之为最萌的推理模型,看blog主页的名称,感觉思维链中的模型正在很努力的思考中……图片Qwen Chat 中已经可以体验预览版模型:,发现这里有一个隐藏彩蛋,内容是由QwQ-Max-Preview自己写的,我们可以看到AI做自我介绍时的思维链:首先,该模型属于 Qwen 系列,是基于 Qwen2.5-Max 构建的。
2/25/2025 12:48:03 PM
伊风

双擎升级!商汤大装置DeepSeek企业版上线+免费版扩容

今年2月,商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,受到客户的热烈响应。 为了更好的服务用户,经过系列优化,,现正式推出企业版,同时完成免费版国产化适配与算力扩容,形成专业强支撑 普惠广覆盖的双擎驱动! 登录官网,即刻体验!
2/24/2025 4:48:00 PM
新闻助手

深推理模型崛起!Together AI融资3.05亿美元助推GPU需求

在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。 该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。 与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。
2/21/2025 10:28:00 AM
AI在线

微信资源直通DeepSeek-R1啦!打工人:哎呀妈(ima)

AI好好用报道编辑:SiaAI 产品都发现了引流新方法 ——DeepSeek-R1。 打工人の AI 外挂,又双叒升级啦! 今天,腾讯旗下智能工作台 ima.copilot( 简称 ima )喜提「双模双待」:左持腾讯混元大模型,右牵 DeepSeek-R1。
2/13/2025 11:01:00 AM
AI好好用