理论

Thinkless框架：让LLM学会“聪明偷懒”的智慧

大家好，我是肆〇柒。今天，我想和大家聊一下，我看到关于自适应思考的另外一片论文，它介绍了Thinkless 框架，并且还有开源仓库。今天我们要了解的 Thinkless 这个框架，由新加坡国立大学的研究人员提出，它能够巧妙地解决当前推理语言模型（LLM）在处理简单问题时过度推理、浪费资源的难题。

6/16/2025 9:40:48 AM

肆零柒

最近，React 官方在其 GitHub 仓库中引入了一个实验性项目 —— React MCP Server，通过 MCP 将大模型与 React 编译工具链连接起来。简单来说，它使 AI 助手不仅能够生成代码，还能以“工具调用”的方式直接参与 React 代码的编译优化和文档查询。 MCP Server 实现了 MCP 协议，并定义了两个主要工具供 AI 使用：编译工具：通过集成 babel-plugin-react-compiler，该工具允许 AI 对传入的 React 组件代码进行编译优化。

6/16/2025 9:36:18 AM

CUGGZ

迈向人工智能的认识论：涌现能力和思路链的忠实性

一、涌现能力：真实现象还是测量幻象过去几年中一个有趣的观察是，随着我们扩大模型规模（在参数和训练数据方面），它们开始展现出较小模型所不具备的全新定性能力。 Wei 等人（2022 年）将这些能力称为涌现能力，并将这种能力定义为“如果某种能力在较小模型中不存在，但在较大模型中存在，则为涌现能力”，以至于“不能简单地通过推断较小模型的性能来预测它”。换句话说，这种技能不是平稳的改进，而是在模型超过某个规模阈值后突然出现。

6/16/2025 9:28:09 AM

晓晓

全球首次，Transformer「混血」速度狂飙65倍！英伟达已下注

扩散方法打入语言模型领域！最近，康奈尔博士生Subham Sahoo，在X介绍了扩散大语言模型的最新工作。这项研究引发了AI研究领域的思考。

6/16/2025 9:13:00 AM

12年博士研究，AI两天爆肝完成！科研效率狂飙3000倍，惊动学术圈

多伦多大学、哈佛MIT等机构联手AI，短短2天内，竟干完了科学家12年的活！研究一出，在全网掀起了巨震。沃顿商学院CS教授Ethan Mollick大受震撼，「AI综述论文体量越来越大，而准确性超越了人类」。

6/16/2025 9:12:00 AM

破解三大数据库AI难题！北大＆亚马逊推出全球首个图中心RDB基础模型

在企业系统和科学研究中普遍存在、结构复杂的关系型数据库（Relational DataBase, RDB）场景中，基础模型的探索仍处于早期阶段。这是因为RDB中的多表交互和异质特征，使传统通用大模型在此类结构化环境下难以直接发挥效能。基于此，北京大学张牧涵团队联合亚马逊云科技共同提出了Griffin：一个具有开创性的、以图为中心的RDB基础模型。

6/16/2025 9:10:00 AM

刚刚！陶哲轩3小时对话流出：AI抢攻菲尔兹奖倒计时

昨天，陶哲轩公开表示：在未来，AI有可能获得菲尔兹奖。在时长3小时14分钟的节目中，他还讨论了数学和物理学中最难的问题：纳维–斯托克斯问题万有理论广义相对论孪生素数猜想费马大定理考拉兹猜想 P=NP 问题一开始，陶哲轩就认为统一物理理论（比如量子力学与广义相对论）之所以难以进展，是因为还没有找到正确的数学语言。而AI可能帮助人类实现「大统一理论」，至少也是发现过程中的一部分。

6/16/2025 9:07:00 AM

全球程序员炸锅！老黄伦敦放豪言：编程语言的未来是「Human」

你知道人类目前的编程语言到底有多少种？ C、C 、C#、Java、Python、PHP、JavaScript、Go、Rust……但不论有多少种，这些都不重要了。未来也许只会剩下唯一一种编程语言，AI将彻底改写人机交互的定义。

6/16/2025 9:03:00 AM

AI改变世界！微软发布700个真实AI Agent、Copilot应用案例

我们经常会听到AI改变世界的观点，但除了问答、查询、总结之外，似乎很少会看到其他真实的AI应用案例。所以，微软作为全球AI领导者之一，发布了700个真实的Agent智能体、Microsoft Copilot应用案例，来帮助大家真实地了解到底AI是如何改变我们的工作模式。这些客户有世界500强企业，有各领域的独角兽，也有世界常青藤名校，业务范围涵盖金融、医疗、科技、教育、汽车制造、零售、电商、能源、航空航天等众多领域。

6/16/2025 9:02:00 AM

比马斯克Neuralink工艺更先进！我国成功开展首例侵入式脑机接口临床试验

用意念操控万物的“脑机接口”，就这样离我们更近了？据央妈最新报道，我国已成功开展首例侵入式脑机接口临床试验——一位因意外事故导致四肢截肢的男子，现在仅凭意念就能玩五子棋游戏、发短信等等。这项研究由中国科学院脑科学与智能技术卓越创新中心，联合复旦大学附属华山医院以及相关企业合作完成。

6/16/2025 9:00:00 AM

AI ASMR突然火爆全网！3天狂揽近10万粉丝，一条切水果视频播放量破1650万

短视频平台熬夜冲浪的我突然发现，AI ASMR突然火了？！大家可以打开声音欣赏一下这条切割浆果的视频，它拿下了16500000的浏览量。

6/16/2025 8:54:00 AM

谢赛宁敲响学界警钟！AI研究可能陷入一场注定失败的有限游戏

凌晨三点的 AI 实验室，键盘敲击声在空荡的房间回响。屏幕上，博士生小王、小李、小赵正疯狂调整模型参数，只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.5%。这样的场景，在如今的 AI 学术圈早已见怪不怪。

6/16/2025 8:53:00 AM

首个统一的图像与视频AIGC可解释性检测框架，多榜单SOTA性能

想象一下：你正在浏览社交媒体，看到一张震撼的图片或一段令人震撼的视频。它栩栩如生，细节丰富，让你不禁信以为真。但它究竟是真实记录，还是由顶尖 AI 精心炮制的「杰作」？

6/16/2025 8:51:00 AM

突破125年世纪难题！北大校友联手科大少年班才子破解希尔伯特第六问题

1900年，数学大师希尔伯特提出23个数学难题，其中第六个问题——“物理学的公理化”，被称为数学物理的终极挑战。 125年后，北大校友邓煜、中科大少年班马骁与陶哲轩高徒扎赫尔・哈尼终于在这一问题上取得重大突破。在20世纪，关于第六问题，希尔伯特追问：能否像欧几里得几何一样，为物理学构建严格的数学基础？

6/16/2025 8:49:00 AM

苹果《思考的错觉》再挨批，Claude与人类共著论文指出其三大关键缺陷

几天前，苹果一篇《思考的错觉》论文吸睛无数又争议不断，其中研究了当今「推理模型」究竟真正能否「推理」的问题，而这里的结论是否定的。论文中写到：「我们的研究表明，最先进的 LRM（例如 o3-mini、DeepSeek-R1、Claude-3.7-Sonnet-Thinking）仍然未能发展出可泛化的解决问题能力 —— 在不同环境中，当达到一定复杂度时，准确度最终会崩溃至零。」不过，这篇论文的研究方法也受到了不少质疑，比如我们的一位读者就认为「给数学题题干加无关内容，发现大模型更容易答错，而质疑大模型不会推理」的做法并不十分合理。

6/16/2025 8:48:00 AM

LLM已能自我更新权重，自适应、知识整合能力大幅提升，AI醒了？

近段时间，关于 AI 自我演进/进化这一话题的研究和讨论开始变得愈渐密集。本月初我们就曾梳理报道了一些，包括 Sakana AI 与不列颠哥伦比亚大学等机构合作的「达尔文-哥德尔机（DGM）」、CMU 的「自我奖励训练（SRT）」、上海交通大学等机构提出的多模态大模型的持续自我改进框架「MM-UPT」、香港中文大学联合 vivo 等机构的自改进框架「UI-Genie」。那之后，相关研究依然还在不断涌现，以下拼图展示了一些例子：而前些天，OpenAI CEO、著名 𝕏 大 v 山姆・奥特曼在其博客《温和的奇点（The Gentle Singularity）》中更是畅想了一个 AI/智能机器人实现自我改进后的未来。

6/16/2025 8:46:00 AM

多智能体在「燃烧」Token！Anthropic公开发现的一切

「Anthropic 发布了他们如何使用多个 Claude AI 智能体构建多智能体研究系统的精彩解释。对于任何构建多智能体系统的人来说，这是一本必读的指南。」刚刚，X 知名博主 Rohan Paul 强力推荐了 Anthropic 一项新研究。

6/16/2025 8:39:00 AM

复旦大学/上海创智学院邱锡鹏：Context Scaling，通往AGI的下一幕

2024 年底，Ilya Sutskever 断言「我们所知的预训练时代即将终结」，让整个人工智能领域陷入对 Scaling What 的集体追问之中。新的思路不断涌现：推理时扩展（Test-Time Scaling）让 OpenAI 的 o 系列在数学推理上大放异彩，DeepSeek-R1 通过 GRPO 替代 PPO 实现了强化学习的突破，强化学习 Self-play LLM 让 AI 在游戏和代码生成中展现惊人能力，Agent 化路径则催生了能够操作浏览器、调用工具的新一代智能助理…… 每一条路都在探寻可能的下一个跃迁。在这场技术探讨中，复旦大学 / 上海创智学院的邱锡鹏教授提出了一个耐人寻味的新路径 ——Context Scaling。

6/16/2025 8:33:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型特斯拉场景深度学习亚马逊架构 Transformer MCP Copilot 编程视觉

理论