模型

大学文凭成废纸？AI暴击美国00后！他哥大退学成千万富翁，我却还要还学贷

摊牌了，不装了，美国的Z时代已经对上大学彻底不耐烦了。现在，他们喊出这样的宣言：有了ChatGPT，大学文凭已经彻底成了一张废纸！纯粹就是浪费时间和金钱。

4/24/2025 9:14:00 AM 新智元

几行代码，一窥上帝造物！帝国理工开源CAX，引爆人工生命新纪元

人工生命研究的新纪元！「人工生命」(artificial life，或简写为ALife)，旨在模拟生命的行为、特性和演化过程，理解生命的本质，涉及涌现现象、自组织系统或形态发生机制。人工生命（ALife）的研究中，蕴含着能够推动和加速AI进步的重要启发和灵感。

4/24/2025 9:03:00 AM 新智元

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明，大规模强化学习已成为一种极为有效的方法，能够激发大型语言模型（LLM) 的复杂推理行为并显著提升其能力。然而，这些推理模型的核心训练方法在其技术报告中仍然鲜有披露。近期社区的主要工作也仅局限于数学推理领域，使得跨领域泛化这一挑战依然未得到充分探索。

4/23/2025 3:23:25 PM 机器之心

中杯o3成OpenAI“性价比之王”？ARC-AGI测试结果出炉：得分翻倍、成本仅1/20

得分比第二名翻倍，成本却仅为1/20？ o3中杯在超难推理任务ARC-AGI上的新成绩，属实又给众人带来了亿点点震撼。根据ARC Prize官方介绍，本轮测试得出的关键结论如下：o3 (Medium) 在ARC-AGI-1上得分为57%，成本为1.5美元/任务，优于目前所有已知COT推理模型；o4-mini（Medium）在ARC-AGI-1上得分为42%，成本为0.23美元/任务，准确率不足但成本优势明显；在难度升级的ARC-AGI-2上，两种型号模型的准确率均未超过3%。

4/23/2025 11:19:31 AM 量子位

清华&英伟达揭露ICML最佳论文隐藏数值问题，简单掩码模型是等价更好选择 | ICLR25

掩码离散扩散模型，可能并没有看上去那么厉害。这是清华及英伟达研究人员最新提出的观点。他们发现，作为离散扩散模型中性能最强的类别，掩码扩散模型可能有点“被包装过度”了。

4/23/2025 9:44:54 AM

Transformer原作打脸DeepSeek观点？一句Wait就能引发反思，RL都不用

只要预训练，LLM就能涌现自我反思、自我纠正！ Transformer首席作者Ashish Vaswani带队的新研究引来万人围观！强化学习已证明能有效激发大语言模型的反思能力。

4/23/2025 9:36:23 AM 新智元

生成式AI进入第二幕：交大携手创智学院提出「认知工程」，AI新纪元开始了

第二幕将催生一种全新的专业：认知工程师 (Cognitive Engineers)— 专注于将人类或 AI 在各领域的深度认知提炼、结构化并转化为 AI 可学习的形式。无论你是技术创造者还是使用者，理解这场认知革命都至关重要。我们正在从「AI as tools」向「AI as thinking partners」转变，这不仅改变了技术的能力边界，也改变了我们与技术协作的方式。

4/23/2025 9:23:15 AM 机器之心

AI也要007？Letta、伯克利提出「睡眠时间计算」，推理效率翻倍还不加钱

AI 也要 007 工作制了！近日，AI 初创公司 Letta 和 UC 伯克利的研究人员提出了一种扩展人工智能能力的新方式 —— 睡眠时间计算（Sleep-time Compute），让模型在空闲时间「思考」，旨在提高大型语言模型（LLM）的推理效率，降低推理成本，同时保持或提升准确性。睡眠时间计算的核心理念在于：智能体即使在「睡眠」（即用户未提出查询时的闲置状态）时段，也应持续运行，利用这些非交互期重组信息、提前完成推理。

4/23/2025 9:10:00 AM 机器之心

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

论文的第一作者是香港中文大学（深圳）数据科学学院三年级博士生徐俊杰龙，指导老师为香港中文大学（深圳）数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。大型语言模型（LLM）近期在软件工程领域取得了显著进展，催生了 MetaGPT、SWE-agent、OpenDevin、Copilot 和 Cursor 等大量研究成果与实际应用，深刻影响着软件开发的方法论和实践。

4/23/2025 9:06:00 AM 机器之心

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

你是否曾想过DeepSeek-R1为什么能「思考」？距离DeepSeek-R1这只「巨鲸」引发的全球AI海啸似乎刚刚平静下来，但推理模型已经成为了AI宠儿。不论是Gemini 2.5Pro，还是o3，o4-mini，以及所有人都在期待的DeepSeek-R2，都是推理模型。

4/22/2025 3:32:06 PM 新智元

用任务向量做模型编辑为何有效？这篇ICLR 2025 Oral论文给出了理论分析

本文作者李宏康，博士毕业于美国伦斯勒理工大学，本科毕业于中国科学技术大学，并即将前往宾夕法尼亚大学担任博士后研究员。研究方向包括深度学习理论、大语言模型理论等等。本文的通讯作者为伦斯勒理工大学的汪孟教授。

4/22/2025 9:40:00 AM 机器之心

直观即时绘制3D模型，可添加文本提示，VAST又开源了

3D生成明星玩家VAST，又又又又又开源了！ Tripo Doodle（内部代号TripoSG Scribble) ，能够将简单的2D草图和文本提示（Text Prompt）实时转化为精细的3D模型。它改进了传统3D建模学习曲线陡峭、耗时耗力的痛点，尤其是在初期“打形”阶段。

4/22/2025 9:26:00 AM 量子位

多模态大模型改造人脸防伪检测，厦大腾讯优图等研究入选CVPR 2025

4/22/2025 9:22:00 AM 量子位

满血o3降智和幻觉倍增的原因可能找到了

OpenAI推出的满血O3“跑分”（Benchmark）貌似又被独立测试揭穿是刷榜了，而奇怪的测试基准数据可能就是o3降智和幻觉倍增的原因？你可能要问了，一个数学基准测试，与降智和幻觉有什么关系？事情要从去年12月说起。

4/22/2025 9:18:57 AM AI寒武纪

全球首个无限时长视频生成！新扩散模型引爆万亿市场，电影级理解，全面开源

不是5秒，不是10秒，更不只是1分钟。 AI视频生成，正式迎来无限时长的时代！来，话不多说，直接来看一部AI版《罗马假日》：而就是这么一部小短剧片段，它的“起点”，仅仅就是一张照片和一句Prompt：身着优雅西装的欧美男子与一位美女漫步在罗马街头，分享各自的生活趣事，眼神中满是欣赏；夕阳西下，余晖洒在两人脸上，彼此深情对视。

4/22/2025 9:17:00 AM 量子位

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。这次的主题是《LLM 推理的强化学习现状》。博客地址： AI 社区很热闹，尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。

4/22/2025 9:12:00 AM 机器之心

AI创造新物理学，暴力破解引力波！宇宙观测开挂50倍，三体人直呼内行

就在刚刚，AI又将物理学，推动到了全新的领域。来自马克斯·普朗克光科学研究所（MPL）、加州理工等机构的科学家发现，AI已经设计出了人类尚未理解的引力波探测工具。这一发现，直接将可观测的宇宙体积扩大了50倍！

4/22/2025 9:08:00 AM 新智元

更懂公务员的大模型：写作/意图理解/公文排版全拿捏，部署成本直降90%，来自金山

当政务大模型具备推理能力，部署成本直降90%，写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。如上新进展，来自金山办公。时隔四个月，金山自研政务大模型完成推理能力升级。

4/22/2025 9:05:36 AM 量子位

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 腾讯苹果算法 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D 大语言模型 RAG 字节跳动 Sora 百度研究 GPU 生成华为工具 AGI 计算 AI设计生成式AI 大型语言模型搜索视频生成 AI模型亚马逊特斯拉 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉