AI在线 AI在线

理论

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
5/26/2025 8:48:00 AM

ChatGPT引爆教育革命,学习效果暴涨86.7%!

现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
5/26/2025 8:43:00 AM

矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%

深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。 论文标题:XXt Can Be Faster论文链接: X 引发热烈讨论,并引起 MIT、斯坦福、哈佛及 Google DeepMind 科学家的广泛关注。 背景矩阵乘法优化堪称计算机科学领域的「珠穆朗玛峰」。
5/26/2025 8:41:00 AM

打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了

不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
5/26/2025 8:40:00 AM

如何使用Google Gemini模型完成计算机视觉任务?

译者 | 李睿审校 | 重楼自从人工智能聊天机器人兴起以来,Google Gemini脱颖而出,已经成为推动智能系统进化的主要参与者之一。 除了强大的会话能力之外,Gemini还释放了计算机视觉实际应用的潜力,让它们能够看到、解释和描述周围的世界。 本文将逐步讲解如何利用Google Gemini完成计算机视觉任务,其中包括如何设置环境,发送带有指令的图像以及解释模型的输出以进行对象检测、字幕生成和OCR,还将探讨数据注释工具(例如YOLO中使用的工具),为自定义训练场景提供上下文。
5/26/2025 8:36:25 AM
李睿

星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩

星际之门数据中心内部,首次曝光了! 就在刚刚,记者Emily Chang探访了德州阿比林的星际之门基地。 这项特朗普就职典礼第二天就官宣的、意义非凡的5000亿美元AI未来投资计划,第一次如此详尽地展示在我们眼前。
5/26/2025 8:32:00 AM

AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%

如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
5/26/2025 8:30:00 AM

AI 的阴暗面:揭露"举报模式"与勒索企图

人工智能行业正热议最新发布的克劳德4(Claude 4)系列模型。 这些模型具备先进的持续推理能力,能够在执行复杂任务时自主暂停,通过搜索引擎或外部工具检索数据,然后无缝恢复操作。 持续推理与举报功能这种设计使模型能够长时间不间断处理复杂任务。
5/26/2025 8:30:00 AM
憨憨鸭

首次,AI下棋不再是「黑盒」!

围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM

微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场

微软著名开源项目.NET Runtime成了吃瓜现场,全球程序员在GitHub评论区围观嘲笑:微软用垃圾AI折磨微软员工,真是可悲又可笑。 发生什么事? 原来是新出的Copilot代码智能体在尝试帮忙自动修Bug,但那叫一个越帮越乱。
5/26/2025 8:25:00 AM

许多人匆忙部署GenAI,往往没有安全保障

根据Thales的报告,70%的企业认为AI的发展速度,特别是在GenAI方面,是与其采用相关的首要安全担忧,其次是数据完整性(64%)和可信度(57%)的缺乏。 GenAI成为首要支出重点许多企业已经在采用GenAI,三分之一的受访者表示,它要么正在被整合,要么正在积极改变他们的运营方式。 随着GenAI引入数据安全挑战,同时也为加强防御提供了战略机遇,其日益增长的整合标志着企业从实验阶段向更成熟、更运营化的部署转变。
5/26/2025 7:10:00 AM

自主式AI解决方案如何保护全球供应链免受关税干扰

今年2月,关于对墨西哥和加拿大征收关税的讨论逐渐升级,到4月初,美国对贸易伙伴的关税普遍提高。 短短几天后,这些关税大多被降低或完全取消,但对中国商品征收的125%关税除外,该关税引发了报复性声明,但科技领域除外。 简而言之,供应链正进入一个非常不稳定的阶段,鉴于2024年平均每次中断可能产生的连锁反应,每天可能造成高达150万美元的损失,这一点值得关注。
5/26/2025 7:00:00 AM
Danny

美团也入局AI编程了!让开发像点外卖一样简单?

美团近期推出了 AI 编程工具 NoCode,类似于Blot.new、V0.dev,其核心是 “对话即开发”,目的是降低编程门槛,让不懂代码的用户也能轻松构建应用,就像点外卖一样简单! NoCode 概述NoCode 是美团研发质量与效率团队做出的一个零代码 AI 应用开发平台。 它的定位是 “Vibe Coding(氛围编程)”。
5/26/2025 4:00:00 AM

OpenAI没做到,DeepSeek搞定了!开源引爆推理革命

DeepSeek-R1引爆了LLM推理革命。 至今,过去一百多天了,引发了持续复制DeepSeek-R1的热潮。 DeepSeek-R1的秘籍在于强化学习微调算法:群体相对策略优化(Group Relative Policy Optimization,GRPO)。
5/26/2025 4:00:00 AM
新智元

2.4万部电影 AI 解剖报告:为什么你的爱豆在电影里永远死不了?

大数据文摘编译作者:Daniel Parris据说,人固有一死,但史蒂文·西格尔或许是个例外。 作为上世纪80年代颇具票房号召力的动作明星之一,史蒂文·西格尔曾有一个广为人知的坚持:他在银幕上从不输掉打斗。 这背后,是他希望塑造一个战无不胜的武术家形象的考量。
5/26/2025 3:00:00 AM

三大Agent框架对比分析开发者必看

一、Agent技术演进与框架选型关键在GPT-4、Claude 3等大模型突破性发展的推动下,AI智能体(Agent)技术正在经历从实验性工具到生产级系统的质变。 本文将从架构设计、任务处理机制、开发范式三个维度,对AutoGPT、LangChain、BabyAGI三大主流框架进行深度技术解构,辅以代码级分析及性能测试数据,为开发者提供选型决策依据。
5/26/2025 2:15:00 AM
程序员秋天

Claude 4王者降临!连码7小时碾压GPT-4o,开发者直呼:AI编程新神!

一、Claude 4重磅登场2025年5月23日凌晨,Anthropic扔出核弹级新品——Claude 4! 由CEO Dario Amodei亲自站台,携Claude Opus 4(旗舰款)和Claude Sonnet 4(性价比款)强势亮相,重新定义AI编程与推理标准。 核心亮点:编程神器:Claude Opus 4号称全球最强编程模型,在SWE-bench测试中以72.5%得分碾压OpenAI Codex-1(68.2%),连续编码7小时稳定如初!
5/26/2025 2:15:00 AM
Hank

18岁高中生自研 AI 狂扫 2000 亿行数据,挖出150万颗未知天体,顶刊论文+25万美金到手!

大数据文摘出品一个高中生,给宇宙来了个“大扫除”,直接揪出150万个以前没人知道的“太空新邻居”! 主角Matteo Paz(马特奥·帕兹),帕萨迪纳高中的学生。 他凭着一套全新的AI算法,不仅挖出了这150万个太空“新星”,还顺带拓展了NASA一项任务的潜力,更以独立作者身份,在顶刊《天文学杂志》上发了篇硬核论文。
5/26/2025 1:55:00 AM
文摘菌