理论

一个省略号提示+强化学习搞定大模型“过度思考”，中科院自动化所新方法：从强制推理到自主选择

在日益强调“思维能力”的大语言模型时代，如何让模型在“难”的问题上展开推理，而不是无差别地“想个不停”，成为当前智能推理研究的重要课题。中国科学院自动化研究所联合鹏城实验室提出了一种高效的推理策略，赋予推理大模型根据题目难度自主切换思考模式的能力：通过一个小小的省略号作为提示词多阶段强化学习，引导大模型自主决定是否深度思考、思考多少。研究背景：大模型“想太多”,是优点还是负担？

5/29/2025 9:08:00 AM

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

就在今天凌晨，新版DeepSeek-R1正式开源了！ DeepSeek-R1-0528模型权重已上传到HuggingFace，不过模型卡暂未更新。图片项目地址：，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。

5/29/2025 9:07:37 AM

新智元

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

就在今天凌晨，新版DeepSeek-R1正式开源了！ DeepSeek-R1-0528模型权重已上传到HuggingFace，不过模型卡暂未更新。项目地址：，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。

5/29/2025 9:04:51 AM

开源AI开发生态大洗牌：低代码平台逆袭，传统LLM框架日渐式微

当前的大模型开发生态，被一份报告、完整全景图谱讲清楚了。就在第十届527蚂蚁技术日上，蚂蚁通过Coding范式、数据、模型部署等角度，对现有开源生态进行了全面完整的大剖析，从数据的视角揭示了大模型开源生态的演进规律，如果你是大模型开发者或者潜在的开发者，几乎研究好这份报告可能就够了。但这还不够，在报告出炉之前的周末，蚂蚁还发布了2025大模型开源生态全景图，涵盖19个技术领域、135个项目，进一步给出了大模型开发生态的参考系。

5/29/2025 8:58:08 AM

大模型玩不好数独？！Transformer作者初创公司公布排行榜：o3 Mini High“变异数独”正确率仅2.9%

大模型做数独，总体正确率只有15%？？？

5/29/2025 8:47:00 AM

快速理解热门 LLM 大语言模型

作者 | masonpy本文尽量用最简单的方式, 帮读者理解 LLM，Transformer, Prompt, Function calling, MCP, Agent, A2A 等这些基本概念。表述时不追求绝对准确，尽量通俗易懂，部分内容有个人理解的成份，内容难免疏漏, 欢迎指正。注意：本文需要你有基本的代码阅读能力，当然非开发阅读也不会很困难。

5/29/2025 8:30:00 AM

腾讯技术工程

AlphaEvolve: 谷歌DeepMind迈向通用人工智能（AGI）的突破性一步

译者 | 李睿审校 | 重楼谷歌DeepMind推出的AlphaEvolve旨在自主发现算法和科学解决方案。它基于进化计算原理，通过LLM驱动的独立进化流程，不断优化代码。 AlphaEvolve不仅超越人类专家设计的算法，还在数学和谷歌基础设施优化上取得突破。

5/29/2025 8:19:49 AM

李睿

单人公司能否纯凭AI智能体发育成独角兽？有戏！

译者 | 核子可乐审校 | 重楼如果你正在寻找一种替代打工生活的选择，那么自营职业——也被称为“个体创业”（solopreneuring）——可能是个好思路。你可以凭借自己的软件开发、设计或商业技能作为独立承包商谋求发展。或者，大家甚至可以独立创办一家公司以获得更大的回报。

5/29/2025 8:13:35 AM

核子可乐

马斯克新推出的 AI 编程助手速度是高级工程师的 10 倍，整个技术团队都面临挑战

从特斯拉的自动驾驶技术，到 Neuralink 的脑机接口，马斯克旗下的 AI 项目一直在推动技术边界。最新发布的 AI 编程助手——xAI CodeGen，声称其开发速度是资深开发者的十倍以上。图片作为一款先进的 AI 工具，xAI CodeGen 是否真的能够理解复杂逻辑、准确调试，并生成结构清晰、适合生产环境的代码，成为业界关注的焦点。

5/29/2025 8:10:51 AM

前端小智

智能体如何重塑工业自动化和风险管理

在采访中，西门子数字工业部门网络安全横向管理副总裁迈克尔·梅茨勒(Michael Metzler)讨论了在工业环境中部署智能体所带来的网络安全影响，他谈到了智能体做出半自主决策所带来的风险，以及为什么像纵深防御(Defense-in-Depth)这样的分层安全方法对于保障工业系统安全至关重要。在一个关键基础设施环境(如能源厂或生产线)中，如果智能体被攻破，会带来哪些影响?与传统自动化系统相比，智能体为工业环境引入了哪些新的网络安全风险?智能体代表了工业自动化领域的一项重要进步，通过其半自主决策功能提供了新的能力。与任何技术进步一样，成功实施需要与现有的工业安全和安全标准及协议进行深思熟虑的整合。

5/29/2025 7:02:00 AM

Mirko Zorz

告别手写代码！十款开源 AI 工具，截图秒变可运行代码（附 GitHub 地址）

今年一直在学习和研究AI，也做了很多高价值AI开源项目的总结，今天就和大家分享11款通过截图（图片）生成代码的开源项目和工具，帮助大家提高编码效率。 Screenshot to Code图片它能够将设计图中的截图自动转化为代码片段，主要用于网页和应用界面的开发。支持的技术栈包括 HTML Tailwind、React Tailwind、Vue Tailwind、Bootstrap、Ionic Tailwind、SVG 等。

5/29/2025 5:00:10 AM

趣谈AI

第二次Sora时刻来了！全球首款实时摄像头诞生，真人感拉满颠覆全行业

就在今天，AI视频领域，再次迎来了高能时刻！硅谷新锐公司AKOOL正式发布的全球首款实时摄像头——AKOOL Live Camera，一举点燃了全行业的热情！它不仅能秒变虚拟数字人、实时翻译多语言、无缝替换人脸，还能动态生成影视级画质的视频画面，将四大功能集于一身。

5/29/2025 4:15:00 AM

新智元

混合推理模型（LHRM）：平衡效率与推理能力的新范式

大家好，我是肆〇柒。今天，我们来探讨一下大型混合推理模型（LHRM）。在人工智能领域，大型推理模型（LRM）能够自如的完成比如编程、数学和常识推理等任务。

5/29/2025 3:00:00 AM

肆零柒

如何通过 OpenMemory MCP 增强客户端的上下文感知能力

人工智能（AI）技术发展迅速，大型语言模型（LLMs）极大地简化了许多任务。然而，它们面临一个基本限制：会话之间无法保留记忆。图片如果能够拥有一个本地的、便携的 LLM “记忆层”，完全掌控您的数据，会怎样呢？

5/29/2025 2:11:00 AM

AI研究生

数据提取场景下不同LLM模型对比分析

在数字化时代，数据作为核心资产，其高效处理与利用成为企业和组织发展的关键。然而，大量数据以非结构化文本、传统文档等形式存在，导致数据提取面临巨大挑战。人工智能，尤其是大语言模型（LLMs）的爆发式发展，为大规模自动化数据提取提供了新的可能。

5/29/2025 1:50:00 AM

大模型之路

基于四大AI交互协议的AI测试平台架构

在IT互联网技术领域，一个APP或系统背后的技术架构，有web层、server层、中间件、数据库和底层的操作系统，看起来很复杂。后来大家逐渐形成了较为统一的标准，即通过API接口将不同层级之间串联起来，最终才能形成一个能提供完善服务的APP应用。 AI领域目前也出现了类似的统一标准或者机制，来实现大模型、智能体等AI工具之间的协作通信。

5/29/2025 1:45:00 AM

写文章的老张