理论

一文读懂LLM基于JSON Schema的结构化输出

什么是基于JSON Schema的结构化输出大语言模型通常会生成无特定结构的自由格式文本，在能够有效使用之前需要进行大量的后期处理。这种不可预测性会导致错误、浪费时间并增加成本。 OpenAI推出基于JSON Schema的结构化输出以解决这一问题。

6/12/2025 2:30:00 AM

AI大模型应用开发

我在2025年尝试了12个AI代理框架-哪款更适合你？

AI代理的热潮真实存在。但构建一个AI代理？那完全是另一回事。

6/12/2025 1:45:00 AM

AI研究生

智能体开发实战 | 基于Dify自定义工作流工具构建游戏智能体

前言Dify是一款开源的大语言模型应用开发平台，旨在降低AI应用的开发门槛，帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify允许用户在画布上构建和测试功能强大的AI工作流。工作流通过将复杂任务分解为更小的步骤（节点），有效降低了系统的复杂度。

6/12/2025 1:30:00 AM

AI大模型应用开发

Test-Time Scaling：挖掘大型语言模型推理潜能

大家好，我是肆〇柒。今天，我们来聊一个在人工智能领域备受瞩目的新兴技术方向 ——Test-Time Scaling（TTS）。之所以要给大家介绍这篇关于 Test-time scaling 的综述，是因为其具备极为重要的现实落地意义与学习价值。

6/12/2025 1:00:00 AM

肆零柒

刚刚！OpenAI 上线 o3-pro，性能碾压 Gemini 与 Claude，重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型：o3-pro。 ——这是此前发布的推理模型 o3 的“加强版”。图片o3-pro属于“推理模型”，它可以一步步拆解问题、逻辑严密地得出结论。

6/11/2025 2:48:11 PM

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？在 2016 年的一次演讲中，Yann LeCun 曾将强化学习比喻成蛋糕上的樱桃。他提到，「如果把智能比作一块蛋糕，那么无监督学习就是蛋糕的主体，监督学习就是蛋糕上的糖霜，而强化学习则是糖霜上的樱桃。

6/11/2025 2:45:57 PM

第一作者陈昌和是美国密歇根大学的研究生，师从 Nima Fazeli 教授，研究方向包括基础模型、机器人学习与具身人工智能，专注于机器人操控、物理交互与控制优化。第二作者徐晓豪是美国密歇根大学机器人学院博士生，研究涵盖3D 感知、视觉语言模型驱动的多模态异常检测及鲁棒三维重建。共同第一作者 Quantao Yang 是瑞典皇家理工学院博士后，师从 Olov Andersson 教授，研究聚焦于利用视觉语言模型与大型语言模型提升自主系统在动态环境中的感知与导航能力。

6/11/2025 2:45:26 PM

小红书开源首个 AI 文本大模型：11.2T 精炼语料吊打海量数据，证明“大模型≠大数据”

近日，在中文开源大模型愈发稀缺的背景下，小红书旗下 hi lab 公布了中等规模的 MoE 模型 dots.llm1，以 1420 亿总参数、每次仅激活 140 亿参数的设计，达成与 Qwen2.5-72B 相近的性能，吸引了社区的关注。图片据悉，dots.llm1 是一个 Mixture of Experts（MoE）结构的语言模型。尽管总参数规模达 142B，但在每次推理中只激活 14B，有效控制了计算开销。

6/11/2025 2:44:48 PM

Mistral的首个强推理模型：拥抱开源，推理速度快10倍

大模型强推理赛道，又迎来一位重量级玩家。本周二，欧洲人工智能公司 Mistral AI 发布了 Magistral，这是一个全新的大语言模型（LLM）系列，展现了强大的推理能力。它能够进行不断反思，并解决更复杂的任务。

6/11/2025 2:39:50 PM

硅谷AI圈变天！OpenAI弃微软转投谷歌，LeCun被边缘小扎组队血战复仇

一夜醒来，硅谷变天了！ OpenAI抛弃微软，竟转头和谷歌合作，达成了前所未有的云服务协议。可以说，这笔交易，直接一举重塑了AI竞争格局。

6/11/2025 2:36:16 PM

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？（此前该公司发布Ministral 3B/8B时，声称“始终优于同行”，却没有对比Qwen2.5）图片图片在该模型发布的前几个小时，Mistral AI的CEO Arthur Mensch在接受炉边访谈时声称即将发布的Magistral能够与其他所有竞争对手相抗衡。

6/11/2025 2:28:34 PM

智能体自己出现问题自己找！首次提出“自动化失败归因”课题 | ICML2025 Spotlight

近年来，LLM Multi-Agent系统引起广泛关注。它们各显神通，协同作战解决复杂难题。然而，一顿操作猛如虎，最终结果却“惨不忍睹”，一整个任务失败。

6/11/2025 1:44:44 PM

o3 pro一手真体验！上下文喂到断供！大神：o3 pro不会聊天，上帝渴望上下文，认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）经历了 5 月份的“买买买”的节奏之后，6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。今天凌晨，Sam Altman 动作非常密集。先是宣布 o3 价格“截肢”（价格直接降至 1/5 ），紧接着不到 2 小时后就发布了 o3-pro。

6/11/2025 12:44:40 PM

云昭

扩散语言模型真的会比自回归好？理论分析结果可能恰恰相反

本工作来自北京大学智能学院贺笛老师课题组与蚂蚁集团武威团队。贺笛老师在机器学习领域获得过多项荣誉，包括 ICLR 2023 杰出论文奖与 ICLR 2024 杰出论文奖提名。扩散模型近年来在图像生成领域取得了令人瞩目的成就，其生成图像的质量和多样性令人惊叹。

6/11/2025 9:21:28 AM

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列，Small 版已开源

6 月 11 日消息，法国人工智能实验室 Mistral 周二宣布进军推理人工智能模型领域。 6 月 . 10 日，Mistral 正式推出其首个推理模型系列 .

6/11/2025 9:19:46 AM

远洋

一个md文件收获超400 star，这份综述分四大范式全面解析了3D场景生成

在构建通用人工智能、世界模型、具身智能等关键技术的竞赛中，一个能力正变得愈发核心 —— 高质量的 3D 场景生成。过去三年，该领域的研究呈指数级增长，每年论文数量几乎翻倍，反映出其在多模态理解、机器人、自动驾驶乃至虚拟现实系统中的关键地位。注：图中 2025 年的数据截至 4 月底来自南洋理工大学 S-Lab 的研究者们全面调研了该领域最前沿的研究方法，发表了综述《3D Scene Generation: A Survey》，对 300 篇代表性论文进行了系统归纳，将现有方法划分为四大类：程序化方法、基于神经网络的 3D 表示生成、图像驱动生成，以及视频驱动生成。

6/11/2025 9:19:22 AM