理论

谷歌研究：合成数据使大模型数学推理能力提升八倍

最近，来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示，目前全球约有 300 万亿个公开可用的高质量文本训练标记。然而，随着类似 ChatGPT 这样的大模型的迅猛发展，对训练数据的需求呈指数级增长，预计到 2026 年之前，这些数据将被耗尽。

4/8/2025 12:40:00 AM 远洋

OpenAI宣布GPT-5推迟数月发布技术整合难度成倍上升

OpenAI 首席执行官萨姆·奥特曼（Sam Altman）近日通过社交媒体宣布，GPT-5 的发布计划将推迟，预计在未来几个月内正式推出。此前，OpenAI 计划在 2025 年初发布 GPT-5，但最终决定延后，以便将该模型做得比预期更好。奥特曼表示，推迟发布的原因是 GPT-5 的能力远超预期，整合所需资源和生态准备超出了当前可控范围。

4/8/2025 12:20:00 AM

三年内拿下10%的赛道份额，用AI撬动技术人才招聘的百亿缺口，万码优才做对了什么

“我想我们是在红海里找到了蓝海”。在众多涌入AI赛道逐梦的创客中，周媛绝对是非常特别的一位——创业之前，她在HRBP架构中担任COE，创业后，作为CEO的她，在一片红海的招聘领域中闯出了另一番洞天。三年前，ChatGPT引爆的AI变革山雨欲来，周媛想要做一款AI驱动的招聘产品的念头愈发强烈：“我意识到再不转型可能要被AI替代掉了”。

4/7/2025 1:30:34 PM 李美涵

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta前脚刚发Llama 4，后脚就有大佬请辞了！一亩三分地的爆料贴称，经过反复训练后，Llama 4未能取得SOTA，甚至与顶尖大模型实力悬殊。为了蒙混过关，高层甚至建议：在后训练阶段中，将多个benchmark测试集混入训练数据。

4/7/2025 1:24:52 PM 新智元

反向传播、前向传播都不要，这种无梯度学习方法是Hinton想要的吗？

「我们应该抛弃反向传播并重新开始。」早在几年前，使反向传播成为深度学习核心技术之一的 Geoffrey Hinton 就发表过这样一个观点。而一直对反向传播持怀疑态度的也是 Hinton。

4/7/2025 1:22:00 PM 机器之心

Agent不会在2025爆发

作者 | 云昭大模型已经在聚光灯下狂奔了28个月，时至今日，Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。可正如不久前“朱啸虎不太看好机器人赛道”一般，Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量，市场异常冷谈我们先从企业内部的Agent来看下。

4/7/2025 1:17:49 PM 云昭

自我修复数据管道：数据工程的下一件大事？

译者 | 李睿审校 | 重楼梅西百货公司首席数据工程师Naresh Erukulla是一位勇于迎接挑战的数据工程师，他擅长用简洁明了的概念验证（POC）解决各种问题。最近，Naresh关注到了数据工程师日常工作中普遍遭遇的一个难题，并为此采取行动，为所有批处理和流数据管道设置了警报系统。当错误超过阈值或数据管道出现故障时，可以迅速通过电子邮件向数据工程师发送故障通知，确保问题能够得到及时处理。

4/7/2025 11:55:58 AM 李睿

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。通过构建大规模（100 万立体图像对）合成训练数据集，结合自动自筛选流程去除模糊样本，并设计了网络架构组件（如侧调谐特征主干和远程上下文推理）来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度，为零样本立体深度估计设立了新标准。

4/7/2025 9:45:00 AM 机器之心

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

你是否想过，LLM也有着自己的小心思？最新研究揭示了一个有趣的现象：LLM在被研究人员测试时，会有意识地改变自己的行为。在面对那些旨在评估人格特质的问题时，它们给出的答案会尽可能地讨人喜欢，符合社会期望。

4/7/2025 9:31:00 AM 新智元

超九成年轻人工作学习离不开AI，人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》

不是我说，年轻人群体到底怎么看AI、用AI啊？？？

4/7/2025 9:28:00 AM 量子位

LLM「想太多」有救了！高效推理让大模型思考过程更精简

LLM的推理能力显著增强，然而，这个「超级大脑」也有自己的烦恼。有时候回答会绕好大一个圈子，推理过程冗长又复杂，虽能得出正确答案，但耗费了不少时间和计算资源。比如问它「2加3等于多少」，它可能会从数字的概念、加法原理开始，洋洋洒洒说上一大通，这在实际应用中可太影响效率啦。

4/7/2025 9:23:00 AM 新智元

Llama 4全网首测来袭，3台Mac狂飙2万亿！多模态惊艳代码却翻车

谁也没料到，大周末的，小扎竟然开源了Llama 4家族。一共三款模型，首次采用MoE架构，开启了原生多模态的Llama时代！ Llama 4 Scout，激活17B，16个专家，109B参数；Llama 4 Maverick，激活17B，128个专家，402B参数；Llama 4 Behemoth，激活288B，16个专家，2T参数。

4/7/2025 9:20:00 AM 新智元

AI爬虫肆虐，OpenAI等大厂不讲武德！开发者打造「神级武器」宣战

AI网络爬虫是互联网上的「蟑螂」，几乎所有软件开发者都会这样认为的。「爬虫」是一种网络自动程序，用来浏览互联网、获取网页内容。而在AI时代，爬虫的威胁到了让开发者不得不封锁掉某个地区所有人的访问。

4/7/2025 9:10:15 AM 新智元

谷歌随OpenAI强势入局，劈柴4天闪电部署Gemini+MCP！

3月31日，谷歌CEO Sundar Pichai（劈柴哥）发出灵魂一问：To MCP or not to MCP, that's the question. （MCP还是不MCP，这是个问题。）MCP的持续火爆，加上OpenAI在27日官宣对MCP的支持，终究还是让谷歌坐不住了。

4/7/2025 9:10:00 AM 新智元

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款：Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

4/7/2025 9:05:00 AM 量子位

2025必知AI趋势：智能体技术如何重塑人机协作

托尼·斯塔克与J.A.R.V.I.S的完美配合，曾是科幻电影中的经典场景。智能助手接收指令，自主思考，调用资源，执行任务，甚至主动提醒风险。这种高度智能的人机协作，正从银幕走入现实，这就是AI智能体(AI Agents)。

4/7/2025 9:00:00 AM 大数据AI智能圈

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 8:42:00 AM 新智元

一文读懂开源 Llama 4 模型

Hello folks，我是 Luga，今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。在人工智能领域，随着技术的不断进步，越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型，凭借其卓越的性能和创新的架构设计，成为了当前 AI 领域的焦点之一。

4/7/2025 8:40:00 AM Luga Lee

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

谷歌研究：合成数据使大模型数学推理能力提升八倍

OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升

三年内拿下10%的赛道份额，用AI撬动技术人才招聘的百亿缺口，万码优才做对了什么

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

反向传播、前向传播都不要，这种无梯度学习方法是Hinton想要的吗？

Agent不会在2025爆发

自我修复数据管道：数据工程的下一件大事？

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

超九成年轻人工作学习离不开AI，人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》

LLM「想太多」有救了！高效推理让大模型思考过程更精简

Llama 4全网首测来袭，3台Mac狂飙2万亿！多模态惊艳代码却翻车

AI爬虫肆虐，OpenAI等大厂不讲武德！开发者打造「神级武器」宣战

谷歌随OpenAI强势入局，劈柴4天闪电部署Gemini+MCP！

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

2025必知AI趋势：智能体技术如何重塑人机协作

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！ 新智元 新智元 2025年04月04日 17:33

一文读懂开源 Llama 4 模型

OpenAI宣布GPT-5推迟数月发布技术整合难度成倍上升

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33