理论

我在2025年尝试了12个AI代理框架-哪款更适合你？

6/12/2025 1:45:00 AM AI研究生

智能体开发实战 | 基于Dify自定义工作流工具构建游戏智能体

前言Dify是一款开源的大语言模型应用开发平台，旨在降低AI应用的开发门槛，帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify允许用户在画布上构建和测试功能强大的AI工作流。工作流通过将复杂任务分解为更小的步骤（节点），有效降低了系统的复杂度。

6/12/2025 1:30:00 AM AI大模型应用开发

Test-Time Scaling：挖掘大型语言模型推理潜能

大家好，我是肆〇柒。今天，我们来聊一个在人工智能领域备受瞩目的新兴技术方向 ——Test-Time Scaling（TTS）。之所以要给大家介绍这篇关于 Test-time scaling 的综述，是因为其具备极为重要的现实落地意义与学习价值。

6/12/2025 1:00:00 AM 肆零柒

刚刚！OpenAI 上线 o3-pro，性能碾压 Gemini 与 Claude，重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型：o3-pro。 ——这是此前发布的推理模型 o3 的“加强版”。图片o3-pro属于“推理模型”，它可以一步步拆解问题、逻辑严密地得出结论。

6/11/2025 2:48:11 PM

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？在 2016 年的一次演讲中，Yann LeCun 曾将强化学习比喻成蛋糕上的樱桃。他提到，「如果把智能比作一块蛋糕，那么无监督学习就是蛋糕的主体，监督学习就是蛋糕上的糖霜，而强化学习则是糖霜上的樱桃。

6/11/2025 2:45:57 PM

10%训练数据超越100%表现，机器人学习领域迎来重要突破

第一作者陈昌和是美国密歇根大学的研究生，师从 Nima Fazeli 教授，研究方向包括基础模型、机器人学习与具身人工智能，专注于机器人操控、物理交互与控制优化。第二作者徐晓豪是美国密歇根大学机器人学院博士生，研究涵盖3D 感知、视觉语言模型驱动的多模态异常检测及鲁棒三维重建。共同第一作者 Quantao Yang 是瑞典皇家理工学院博士后，师从 Olov Andersson 教授，研究聚焦于利用视觉语言模型与大型语言模型提升自主系统在动态环境中的感知与导航能力。

6/11/2025 2:45:26 PM

小红书开源首个 AI 文本大模型：11.2T 精炼语料吊打海量数据，证明“大模型≠大数据”

近日，在中文开源大模型愈发稀缺的背景下，小红书旗下 hi lab 公布了中等规模的 MoE 模型 dots.llm1，以 1420 亿总参数、每次仅激活 140 亿参数的设计，达成与 Qwen2.5-72B 相近的性能，吸引了社区的关注。图片据悉，dots.llm1 是一个 Mixture of Experts（MoE）结构的语言模型。尽管总参数规模达 142B，但在每次推理中只激活 14B，有效控制了计算开销。

6/11/2025 2:44:48 PM

Mistral的首个强推理模型：拥抱开源，推理速度快10倍

大模型强推理赛道，又迎来一位重量级玩家。本周二，欧洲人工智能公司 Mistral AI 发布了 Magistral，这是一个全新的大语言模型（LLM）系列，展现了强大的推理能力。它能够进行不断反思，并解决更复杂的任务。

6/11/2025 2:39:50 PM

硅谷AI圈变天！OpenAI弃微软转投谷歌，LeCun被边缘小扎组队血战复仇

一夜醒来，硅谷变天了！ OpenAI抛弃微软，竟转头和谷歌合作，达成了前所未有的云服务协议。可以说，这笔交易，直接一举重塑了AI竞争格局。

6/11/2025 2:36:16 PM

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？（此前该公司发布Ministral 3B/8B时，声称“始终优于同行”，却没有对比Qwen2.5）图片图片在该模型发布的前几个小时，Mistral AI的CEO Arthur Mensch在接受炉边访谈时声称即将发布的Magistral能够与其他所有竞争对手相抗衡。

6/11/2025 2:28:34 PM

智能体自己出现问题自己找！首次提出“自动化失败归因”课题 | ICML2025 Spotlight

近年来，LLM Multi-Agent系统引起广泛关注。它们各显神通，协同作战解决复杂难题。然而，一顿操作猛如虎，最终结果却“惨不忍睹”，一整个任务失败。

6/11/2025 1:44:44 PM

o3 pro一手真体验！上下文喂到断供！大神：o3 pro不会聊天，上帝渴望上下文，认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）经历了 5 月份的“买买买”的节奏之后，6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。今天凌晨，Sam Altman 动作非常密集。先是宣布 o3 价格“截肢”（价格直接降至 1/5 ），紧接着不到 2 小时后就发布了 o3-pro。

6/11/2025 12:44:40 PM 云昭

扩散语言模型真的会比自回归好？理论分析结果可能恰恰相反

本工作来自北京大学智能学院贺笛老师课题组与蚂蚁集团武威团队。贺笛老师在机器学习领域获得过多项荣誉，包括 ICLR 2023 杰出论文奖与 ICLR 2024 杰出论文奖提名。扩散模型近年来在图像生成领域取得了令人瞩目的成就，其生成图像的质量和多样性令人惊叹。

6/11/2025 9:21:28 AM

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列，Small 版已开源

6 月 11 日消息，法国人工智能实验室 Mistral 周二宣布进军推理人工智能模型领域。 6 月 . 10 日，Mistral 正式推出其首个推理模型系列 .

6/11/2025 9:19:46 AM 远洋

一个md文件收获超400 star，这份综述分四大范式全面解析了3D场景生成

在构建通用人工智能、世界模型、具身智能等关键技术的竞赛中，一个能力正变得愈发核心 —— 高质量的 3D 场景生成。过去三年，该领域的研究呈指数级增长，每年论文数量几乎翻倍，反映出其在多模态理解、机器人、自动驾驶乃至虚拟现实系统中的关键地位。注：图中 2025 年的数据截至 4 月底来自南洋理工大学 S-Lab 的研究者们全面调研了该领域最前沿的研究方法，发表了综述《3D Scene Generation: A Survey》，对 300 篇代表性论文进行了系统归纳，将现有方法划分为四大类：程序化方法、基于神经网络的 3D 表示生成、图像驱动生成，以及视频驱动生成。

6/11/2025 9:19:22 AM

一招缓解LLM偏科！调整训练集组成，“秘方”在此 | 上交大&上海AI Lab等

大幅缓解LLM偏科，只需调整SFT训练集的组成。本来不擅长coding的Llama 3.1-8B，代码能力明显提升。上海交大&上海AI Lab联合团队提出创新方法IDEAL，可显著提升LLM在多种不同领域上的综合性能。

6/11/2025 9:17:00 AM

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

相邻的 KV 缓存将合并为一个。在生成第一个字符时，KV 缓存长度为 1；生成第二个字符后，新生成的 KV 与前一个被合并，KV 缓存长度仍然保持为 1。这种动态合并机制有效压缩了时间维度上的冗余信息。

6/11/2025 9:15:51 AM

刚刚，OpenAI正式发布o3-pro！奥特曼激动更新博客：温和的奇点

今天凌晨一点，OpenAI 宣布：OpenAI o3-pro today.前沿模型的轮流更新这一次轮到 OpenAI 了。，所有 Pro 订阅用户均可通过 ChatGPT 和 API 使用这款强大的推理模型。 Team 用户也可在模型选择器选择使用它。

6/11/2025 9:13:44 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉