AI

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文

随着 DeepSeek R1 的持续爆火，推理和强化学习已经成为 AI 领域的热门词汇。短短几个月的时间，我们已经见证了太多的推理大模型，AI 更新迭代速度似乎已经快进到了以天为单位。但在众多研究成果中找到值得关注的内容并不容易。

5/26/2025 8:48:00 AM

ChatGPT引爆教育革命，学习效果暴涨86.7%！

ChatGPT引爆教育革命，学习效果暴涨86.7%！

现在的学生，已经离不开各种AIGC工具了，不论是写作业，还是生成笔记，或者通过阅读AI生成的摘要来读文献。面对这些离不开AI的学生，老师和家长都开始担忧了，这样下去，孩子会不会越变越笨啊。然而，最近一项发表在Nature子刊的研究，基于对59项研究对汇总（元分析）指出，ChatGPT的使用对提高K12（中小学生）的学习表现有显著的正向影响，对于培养学生解决复杂问题的能力也有所帮助。

5/26/2025 8:43:00 AM

打破思维链推理瓶颈！“软推理”让大模型学会人类抽象能力，token使用量还更少了

打破思维链推理瓶颈！“软推理”让大模型学会人类抽象能力，token使用量还更少了

不再像CoT（“思维链”）一样“一个字一个字往外蹦”，加上“软思维”就能让大模型像人类一样进行抽象思考。来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking，让模型在连续的概念空间中进行 “软推理”，而非局限于离散的语言符号，打破了基于离散token的推理瓶颈。相比标准CoT，Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。

5/26/2025 8:40:00 AM

星际之门内部惊人曝光：40万块GPU爆铺！奥特曼千亿豪赌险把电网干崩

星际之门内部惊人曝光：40万块GPU爆铺！奥特曼千亿豪赌险把电网干崩

星际之门数据中心内部，首次曝光了！就在刚刚，记者Emily Chang探访了德州阿比林的星际之门基地。这项特朗普就职典礼第二天就官宣的、意义非凡的5000亿美元AI未来投资计划，第一次如此详尽地展示在我们眼前。

5/26/2025 8:32:00 AM

AI越聪明越不听话！新研究：最强推理模型指令遵循率仅50%

AI越聪明越不听话！新研究：最强推理模型指令遵循率仅50%

如果面前有两个AI助手：一个很聪明但经常不守规矩，另一个很听话但不太聪明，你会怎么选？最近，上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》，通过一个全新的评测基准MathIF揭示：大模型越擅长复杂推理，越容易忽略用户的指令要求，“聪明”和“听话”之间存在明显的矛盾。这项工作的灵感，源自实际使用推理模型（如o3）过程中的一个意外发现：相比许多经过强化推理训练的大模型，GPT-4o在执行具体指令时反而更加“听话” 。

5/26/2025 8:30:00 AM

AI 的阴暗面：揭露"举报模式"与勒索企图

AI 的阴暗面：揭露"举报模式"与勒索企图

人工智能行业正热议最新发布的克劳德4(Claude 4)系列模型。这些模型具备先进的持续推理能力，能够在执行复杂任务时自主暂停，通过搜索引擎或外部工具检索数据，然后无缝恢复操作。持续推理与举报功能这种设计使模型能够长时间不间断处理复杂任务。

5/26/2025 8:30:00 AM 憨憨鸭

首次，AI下棋不再是「黑盒」！

首次，AI下棋不再是「黑盒」！

围棋因其独特的复杂性和对人类智能的深刻体现，可作为衡量AI专业能力最具代表性的任务之一。目前，AI虽然在棋力、效率、通用性等方面均取得显著成绩，但其具体推理过程仍处于「黑盒」之中，更无法用人类语言解释其思考过程和结果。大模型具备良好的自然语言交互性，如何通过提升大模型的推理能力，实现围棋专业能力突破，是摆在科研人员面前的一道难题。

5/26/2025 8:27:00 AM

微软AI公开折磨微软员工，修Bug唯一贡献是改了PR标题，GitHub评论区成吃瓜现场

微软AI公开折磨微软员工，修Bug唯一贡献是改了PR标题，GitHub评论区成吃瓜现场

微软著名开源项目.NET Runtime成了吃瓜现场，全球程序员在GitHub评论区围观嘲笑：微软用垃圾AI折磨微软员工，真是可悲又可笑。发生什么事？原来是新出的Copilot代码智能体在尝试帮忙自动修Bug，但那叫一个越帮越乱。

5/26/2025 8:25:00 AM

许多人匆忙部署GenAI，往往没有安全保障

许多人匆忙部署GenAI，往往没有安全保障

根据Thales的报告，70%的企业认为AI的发展速度，特别是在GenAI方面，是与其采用相关的首要安全担忧，其次是数据完整性(64%)和可信度(57%)的缺乏。 GenAI成为首要支出重点许多企业已经在采用GenAI，三分之一的受访者表示，它要么正在被整合，要么正在积极改变他们的运营方式。随着GenAI引入数据安全挑战，同时也为加强防御提供了战略机遇，其日益增长的整合标志着企业从实验阶段向更成熟、更运营化的部署转变。

5/26/2025 7:10:00 AM

美团也入局AI编程了！让开发像点外卖一样简单？

美团也入局AI编程了！让开发像点外卖一样简单？

美团近期推出了 AI 编程工具 NoCode，类似于Blot.new、V0.dev，其核心是 “对话即开发”，目的是降低编程门槛，让不懂代码的用户也能轻松构建应用，就像点外卖一样简单！ NoCode 概述NoCode 是美团研发质量与效率团队做出的一个零代码 AI 应用开发平台。它的定位是 “Vibe Coding（氛围编程）”。

5/26/2025 4:00:00 AM

2.4万部电影 AI 解剖报告：为什么你的爱豆在电影里永远死不了？

2.4万部电影 AI 解剖报告：为什么你的爱豆在电影里永远死不了？

大数据文摘编译作者：Daniel Parris据说，人固有一死，但史蒂文·西格尔或许是个例外。作为上世纪80年代颇具票房号召力的动作明星之一，史蒂文·西格尔曾有一个广为人知的坚持：他在银幕上从不输掉打斗。这背后，是他希望塑造一个战无不胜的武术家形象的考量。

5/26/2025 3:00:00 AM

18岁高中生自研 AI 狂扫 2000 亿行数据，挖出150万颗未知天体，顶刊论文+25万美金到手！

18岁高中生自研 AI 狂扫 2000 亿行数据，挖出150万颗未知天体，顶刊论文+25万美金到手！

大数据文摘出品一个高中生，给宇宙来了个“大扫除”，直接揪出150万个以前没人知道的“太空新邻居”！主角Matteo Paz（马特奥·帕兹），帕萨迪纳高中的学生。他凭着一套全新的AI算法，不仅挖出了这150万个太空“新星”，还顺带拓展了NASA一项任务的潜力，更以独立作者身份，在顶刊《天文学杂志》上发了篇硬核论文。

5/26/2025 1:55:00 AM 文摘菌

LLM的 “自信陷阱”：上下文幻觉如何侵蚀 AI 信任？

LLM的 “自信陷阱”：上下文幻觉如何侵蚀 AI 信任？

一、当AI自信地给出错误答案在数字技术飞速发展的今天，大语言模型（LLMs）正以前所未有的速度渗透到我们生活的方方面面。从智能客服到医疗诊断，从金融分析到法律文书，这些模型凭借其强大的语言理解和生成能力，似乎正在重塑人类与信息交互的方式。然而，在其光鲜亮丽的表现背后，一个隐蔽而危险的问题正悄然浮现——上下文幻觉（Contextual Hallucination）。

5/26/2025 1:45:00 AM 大模型之路

AI搜索大战爆发，苹果要"斩断"谷歌200亿美元生命线？

AI搜索大战爆发，苹果要"斩断"谷歌200亿美元生命线？

又有大瓜可以吃了！刚刚，苹果公司放了一颗重磅炸弹，让谷歌瞬间慌了神！ 5月份，苹果服务高级副总裁埃迪·库透露，苹果正在积极探索将AI搜索引擎集成到Safari浏览器中，甚至明确表示，OpenAI、Perplexity AI和Anthropic的Claude AI等工具，最终可能会取代谷歌搜索。

5/26/2025 1:30:00 AM 小李哥

巨头竞逐 AI 代理市场!会诞生新的平台型玩家么?

巨头竞逐 AI 代理市场!会诞生新的平台型玩家么?

随着英伟达、谷歌、微软、苹果、Meta、Salesforce 等科技巨头开始押注 AI 代理（AI agent），2025 年被称为“AI 代理元年”——AI 正从“工具”升级为“助手”，甚至“代理人”。对中小企业而言，构建 AI 代理需要集成多个复杂技术要素，包括大语言模型调用、API 编排、记忆机制、工具执行链、状态管理、安全控制等等….为了降低企业应用 AI 代理的门槛，AI 代理市场 (AI Agent Marketplace) 正在兴起。 AI 代理市场可以视作一个平台，允许开发者发布、分发、集成和交易 AI 代理，企业或用户可以按需选择和部署不同类型的代理，实现复杂的自动化任务。

5/26/2025 1:22:55 AM Sophia

AI生态系统如何改变商业应用

AI生态系统如何改变商业应用

企业被战略优势、风险缓解、最大化AI投资价值、改善数据本地化以及降低延迟所驱动——同时优先优化成本和运营性能。独立软件供应商(ISV)则被一套独特的业务和战略目标所驱动，这些目标聚焦于建立信任、满足客户需求，同时保护他们的知识产权(IP)和市场份额。对于受监管行业而言，由于这些生态系统往往涉及第三方供应商和云平台，因此对AI合作伙伴和解决方案的审查需要更高的严格性。

5/26/2025 1:00:00 AM Linda

Google I/O 2025：开发者必须了解的下一代 AI 革命

Google I/O 2025：开发者必须了解的下一代 AI 革命

Google I/O 2025 大会结束了，这场发布会不仅是一场简单的技术更新，而更像是人工智能领域的一次全面进化。从颠覆性的 Gemini 2.5 模型，到真正意义上的 AI 智能助手 Project Astra，再到文本生成视频工具 Veo 3，开发者工具与生态迎来了全方位的变革。以下是最值得开发者关注的技术革新。

5/26/2025 12:00:00 AM 前端小智

被困在 4GB 内存里的 Llama 3.2：AI 在树莓派中上演“死亡循环”

被困在 4GB 内存里的 Llama 3.2：AI 在树莓派中上演“死亡循环”

YouTube用户Rootkid创作的艺术项目'Latent Reflection'引发关注。他将大型语言模型安装在内存不足的树莓派上，AI知道自己会因内存耗尽而崩溃重启，却仍不断思考。#AI艺术# #科技哲学#

5/25/2025 3:34:58 PM 远洋

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算 AI设计大型语言模型生成式AI 搜索视频生成亚马逊 AI模型特斯拉 DeepMind 场景深度学习 Transformer Copilot 架构 MCP 编程视觉