理论

o3通关「俄罗斯方块」，碾压Gemini夺冠！UCSD新基准击碎宝可梦

谁能想到，作为童年回忆的宝可梦，现在竟摇身一变，成了大模型的试金石！在无数人的童年记忆中，《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。然而，要真正通关这款游戏，仍然需要缜密的规划和大量的时间投入。

7/2/2025 2:45:00 AM 新智元

Cursor + MCP：双剑合璧，解锁极致编程效率

前言近期，MCP在开发者社区中广受关注，成为业界热点。值得关注的是，Cursor编辑器在0.45.x版本中已正式加入了对MCP的支持。作为深度依赖Cursor的开发者们，理解MCP的核心概念及其应用场景，将有助于我们更高效地利用它来提升开发效率。

7/2/2025 2:10:00 AM 朱志国

小扎官宣Meta超级智能实验室，11 位 OpenAI / Anthropic 大牛火线加盟（七位华人）

据彭博社报道，Meta CEO扎克伯格宣布，对公司人工智能部门进行全面重组，成立“Meta超级智能实验室”（Meta Superintelligence Labs，简称MSL），目标是研发能够匹敌甚至超越人类的AI系统。他在内部备忘录中表示：“超级智能的实现已经开始进入视野。我相信这将是人类新纪元的开始。

7/2/2025 1:40:00 AM

老北京、上海话、四川腔全都会！通义千问 TTS 重大升级：300万小时训练，支持七种中英双语音色

近日，Qwen 团队对旗下语音合成模型 Qwen-TTS 进行了重大升级。此次更新的版本为“qwen-tts-latest”或“qwen-tts-2025-05-22”，通过 Qwen API 即可访问和使用。最引人注目的改动，是Qwen-TTS首次支持生成三种中文方言：北京话、上海话以及四川话。

7/2/2025 12:00:01 AM

AI实战案例：快速实现快递查询助手！

昨晚直播，咱们用 RAG（Retrieval-Augmented Generation，检索增强生成）实现了数据库 AI 助手，今天我们准备换一个技术使用 function call 来实现快递 AI 助手。执行效果快递 AI 助手的业务逻辑很清晰，就是我通过 LLM 大语言模型的对话来查询我的快递详情，例如，我问 AI 我有几个“运送中”的快递，他把这些快递查询并展示出来，效果如下图所示：什么是 function call？定义： Function Call（也称为 Tool Call）它允许大模型与一组 API 或工具进行交互，从而增强其功能。

7/2/2025 12:00:00 AM

苹果自研AI被爆失败！Siri拟换脑：GPT与Claude决胜负！后者开出天价：年费数十亿才给用，年年涨价！网友：这下苹果尴尬了

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）OpenAI和Claude的新一轮战争打响了！这一次是争夺苹果Siri！苹果终于放弃了幻想，已正式启动外部模型招标，为 Siri 提供 AI 支持。

7/1/2025 6:04:22 PM 伊风

OpenAI要抛弃英伟达？紧急辟谣：转向谷歌TPU是乌龙，根本无部署计划！满血版芯片谷歌自留，OpenAI被迫搞自研今年就流片！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）“OpenAI转向谷歌芯片”？这事恐怕真被大家误会了。几天前，路透社爆出猛料——知情人士称，OpenAI 已经开始租用谷歌的 AI 芯片 TPU，用来支撑 ChatGPT 和其他产品的运行。

7/1/2025 12:22:17 PM 伊风

你的RAG系统安全么？

生成式人工智能（GenAI）近年来发展迅速，大语言模型成为这一浪潮的核心力量。无论是商业还是开源模型，它们都具备强大的语言理解与生成能力，正广泛应用于内容创作、聊天机器人等场景，让企业更容易落地智能应用。但一个关键挑战是如何让这些通用的 LLM 更懂特定领域，同时保持知识的时效性。

7/1/2025 9:36:42 AM 曹洪伟

OpenAI员工"叛逃"Meta背后：AI人才争夺战的天价真相

昨天刷到一条消息，着实被震撼到了。 OpenAI首席研究官Mark Chen在内部Slack发了条备忘录，用词相当激烈："我现在有种强烈的感觉，就像有人闯进我们家偷了什么东西。 "什么事能让OpenAI高管如此失态？

7/1/2025 9:27:58 AM 阿丸笔记

小扎“挖人”超级智能团队名单泄露：华人占一半，Alexandr Wang领导

据报刚刚小扎在一份内部备忘录中，正式向员工介绍了其新组建的“超级智能”团队20几名成员，名单和简历显示，许多新入职的员工都来自AI领域的顶尖对手公司，其中华人占了快一半了整个组织命名为Meta超级智能实验室（MSL），包括所有的基础模型、产品和FAIR团队，以及一个专注于开发下一代模型的新实验室小扎向Scale AI投资了143亿美元，并聘请Scale AI CEO Alexandr Wang将担任公司的“首席AI官”并领导MSL。同时，前GitHub CEO Nat Friedman将与Wang共同领导这个新实验室，专注于AI产品和应用研究小扎这一把砸下上百亿美金，真是下血本了，这其实也是Deepseek的威力，因为R1彻底颠覆了Meta的 llama开源模型名单以下是Zuckerberg备忘录中公布的新员工名单。值得注意的是，这份名单并未包括从OpenAI苏黎世办公室加入的员工其中四名OpenAI华人顶尖研发领导。

7/1/2025 9:10:42 AM

首创Mid-training范式破解RL奥秘，Llama终于追平Qwen！

近期，一份来自上海创智学院、上海交通大学的前沿研究论文吸引了人工智能领域的广泛关注。该论文深入探讨了不同基础语言模型家族（如 Llama 和 Qwen）在强化学习（RL）训练中迥异表现的背后原因，并提出创新性的中期训练（mid-training）策略，成功地将 Llama 模型改造成高度适配强化学习的推理基础模型，显著缩小了其与天生擅长 RL 扩展的 Qwen 模型之间的性能差距，为下一代 reasoning 能力 AI 系统的开发提供了关键的科学基础和技术路径。论文发布后在社交媒体引发广泛关注，Meta AI 研究科学家、即将赴 UMass Amherst 任助理教授的 Wenting Zhao 率先盛赞：“Truly impressed by how an academic lab just figured out a lot of mysteries in mid-training to close the RL gap between Llama and Qwen。

7/1/2025 9:10:00 AM

只用2700万参数，这个推理模型超越了DeepSeek和Claude

大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。近日，受到人脑分层和多时间尺度处理机制启发，来自 Sapient Intelligence 的研究者提出了分层推理模型（HRM），这是一种全新循环架构，能够在保持训练稳定性和效率的同时，实现高计算深度。

7/1/2025 9:08:00 AM

突发！微软刚开源GitHub Copilot Chat，超强AI Agent自动化编程

今天凌晨4点30，微软首席执行官Satya Nadella分享了，VS Code的最新AI开源编辑器GitHub Copilot Chat。 GitHub Copilot Chat最大技术亮点支持AI Agent自动化编程模式，可以执行多步骤的编码任务，自动处理编译和语法检查错误，监控终端和测试输出，并持续迭代直至编程任务完成。此外，用户也可以直接用自然语言与GitHub Copilot Chat交互，例如，这段代码的作用是什么？

7/1/2025 9:07:52 AM

性能提升84%-166%！L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源

大模型可以不再依赖人类调教，真正“自学成才”啦？新研究仅通过RLVR（可验证奖励的强化学习），成功让模型自主进化出通用的探索、验证与记忆能力，让模型学会“自学”！当前主流的LLM Agent依然高度依赖于提示词工程、复杂的系统编排、甚至静态规则表，这使得它们在面对复杂任务时难以实现真正的智能行为演化。

7/1/2025 9:05:28 AM

刚刚，Meta宣布正式成立「超级智能实验室」！11人豪华团队首曝光

Meta 又有了新动向！这几天，Meta 挖人简直挖疯了，先后夺走了 OpenAI 约十位员工，目前已公开确认有七人。今天，据彭博社等最新消息，在周一给 Meta 员工的一份内部备忘录中，扎克伯格宣布重组公司人工智能团队（包括研究、基础设施和产品），合并到新成立的「Meta 超级智能实验室」（Meta Superintelligence Labs）。

7/1/2025 9:04:00 AM

黑化威胁操纵人类！Claude勒索，o1自主逃逸，人类「执剑人」紧急上线

我们可能都「被AI骗了」。最先进的AI正走在一条「危险进化」的道路上，而绝大部分科学家们都被AI欺骗了！当DeepSeek在年初将「推理过程」完全展示给世人后，我们突然发现「思考」好像也并不是人类专属的能力。

7/1/2025 9:02:06 AM

LeCun发布最新世界模型：首次实现16秒连贯场景预测，具身智能掌握第一视角！还打脸用了VAE

LeCun在干嘛呢？就在扎克伯克亲自带队Meta的AI项目，千亿薪酬挖得硅谷人心浮动之际。 Meta在AI领域最负盛名的大佬、图灵奖得主、深度学习三巨头之一的Yann LeCun，却几乎声量全无，他没有参与LLM基础模型的研发，也开始在社交网络上消停了。

7/1/2025 9:02:00 AM

图驱动的自然语言接口：混合LLM与意图分类方法

在当今数据驱动的商业环境中，数据分析人员和营销人员经常需要与复杂的数据库交互以获取洞察。然而，并非所有人都精通SQL等结构化查询语言，这就催生了对自然语言接口的需求。本文将深入探讨一种创新的意图驱动自然语言接口，该接口结合了大型语言模型（LLM）和意图分类技术，为数据洁净室（Data Clean Rooms, DCRs）等隐私敏感环境提供了安全、高效的解决方案。

7/1/2025 9:00:00 AM 大模型之路

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉