模型

DeepSeek R-1 能否解答这五道“刁钻”AI 问题？

每当有新的语言模型公开发布时，我总会忍不住拿它来做一些看似简单、实则暗藏难点的小测试。我把这当作给模型做“压力测试”，用来检验它们在逻辑推理上到底行不行。 DeepSeek R-1 刚发布不久，就因为它是开源、且推理能力强大而备受关注。

2/24/2025 12:00:00 AM dev

谷歌超硬核教科书来了！Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

由于深度学习的「黑箱」本性，从业者自我调侃道：如果说深度神经网络是现代版的「炼金术」，我们在古代就是「炼金术士」。 2018年5月3日， Science发表新闻，标题直指「炼金术」，强调加强AI的科学基础但这次的谷歌的团队，却有不一样的看法：在许多方面，深度学习仍然带有一定的「炼金术」色彩，但理解和优化模型性能并不一定如此——即使是在大规模环境下！近日，谷歌DeepMind科学家Jacob Austint在X上，发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。

2/21/2025 1:45:00 PM 新智元

「卖铲子」也疯狂！美国「DeepSeek概念」AI初创，估值达33亿美元

放眼全球，最大的投资风口非AI莫属了。昨日，美国明星初创Together AI宣布，已完成3.05亿美元B轮融资，总估值达到33亿美元。 Together AI表示，这项投资将加速他们在构建基于开源模型的现代AI应用，以及利用他们即将大规模部署的英伟达Blackwell GPU训练定制模型方面的领先地位，也能巩固他们作为首选AI云供应商的地位。

2/21/2025 1:40:00 PM 新智元

大模型扩展新维度：Scaling Down、Scaling Out

本文由悉尼大学计算机学院王云柯，李言蹊和徐畅副教授完成。王云柯是悉尼大学博士后，李言蹊是悉尼大学三年级博士生，徐畅副教授是澳洲ARC Future Fellow，其团队长期从事机器学习算法、生成模型等方向的研究。近年来， Scaling Up 指导下的 AI 基础模型取得了多项突破。

2/21/2025 1:20:00 PM 机器之心

机器人视觉控制新范式！ByteDance Research新算法实现通过性能SOTA

世界模型（World Model）作为近年来机器学习和强化学习的研究热点，通过建立智能体对其所处环境的一种内部表征和模拟，能够加强智能体对于世界的理解，进而更好地进行规划和决策。在强化学习领域中，世界模型通常被建模为一个神经网络，通过历史状态和动作，预测未来可能出现的状态。其中，Dreamer 算法在多种模拟环境的成功表现让我们看到了世界模型优秀的表征和泛化能力。

2/21/2025 1:00:00 PM 机器之心

阿里重回伟大！吴泳铭财报讲话全文曝光：开发者会天然选择阿里云，发布旗舰推理模型！未来三年，阿里对基础设施投资将超过去十年总和！

出品 | 51CTO技术栈（微信号：blog51cto）编辑 | 伊风昨晚，阿里2025财年Q3财报新鲜出炉，同比增长8%，可以说成绩相当亮眼！淘天增收继续加快，阿里云增速重回加速状态，多项核心业务增速达到年内最佳。财报显示：阿里第三季度营收增速创逾一年以来最快，资本开支大增，核心业务加速增长，淘天收入增长加快，阿里云收入重回双位数增长（13%），增幅创约两年以来最大，AI相关产品收入连续六季度保持三位数增长。

2/21/2025 12:40:19 PM 伊风

出人意料！DeepSeek-R1用的GRPO其实没必要？规模化强化学习训练用PPO就够了

2/21/2025 12:24:14 PM 机器之心

前OpenAI CTO 成立思维机器实验室

前OpenAI首席技术官Mira Murati宣布成立新的思维机器实验室（Thinking Machines Lab）。主要有三个方向：帮助人们调整AI系统以满足他们的具体需求；开发坚实的基础以构建更强大的AI系统；培养开放科学的文化，帮助整个领域理解和改进这些系统。以下是Thinking Machines Lab的官网介绍：思维机器实验室（Thinking Machines Lab）是一家人工智能研究与产品公司。

2/21/2025 11:00:00 AM AIGC开放社区

两万字长文深度解密DeepSeek-R1、Kimi 1.5，强推理模型凭什么火出圈？

刚刚过去的春节，DeepSeek-R1 推理大模型引爆了国内外 AI 社区，并火出了圈。最近，各个行业又掀起了接入 DeepSeek 的狂潮，大家唯恐落后于人。北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读，也是此前 o1 解读（北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式）的续作。

2/21/2025 10:34:49 AM 机器之心

谷歌推出PaliGemma 2 mix：用于多任务的视觉语言模型，开箱即用

去年 12 月，谷歌推出了 PaliGemma 2 ，这是Gemma系列中的升级版视觉语言模型。该版本包含不同大小（3B、10B 和 28B 参数）的预训练检查点，可轻松针对各种视觉语言任务和领域进行微调，例如图像分割、短视频字幕、科学问答和文本相关任务，并实现高性能。 2月19日，谷歌宣布推出 PaliGemma 2 mix 检查点。

2/21/2025 10:00:35 AM Omar Sanseviero

再次颠覆学界想象，何恺明发表新作：扩散模型不一定需要噪声条件

一直以来，研究者普遍认为，去噪扩散模型要想成功运行，噪声条件是必不可少的。而大神何恺明的一项最新研究，对这个观点提出了「质疑」。「受图像盲去噪研究的启发，我们研究了各种基于去噪的生成模型在没有噪声调节的情况下的表现。

2/21/2025 9:40:00 AM 机器之心

谷歌豪华阵容打造AI科学家，用测试时间计算加速科学发现，CEO皮猜也来站台了

2/21/2025 9:20:00 AM 量子位

微软Muse秒生游戏登Nature，10亿级画面练出最强AI！千亿游戏市场重洗牌

同一天，微软放出两个核弹，首个拓扑量子芯片，还有首个世界与人类行动模型。 AI离数秒生成游戏视频的未来，又近了一步。今天，微软团队首次引入了「世界与人类行动模型」（WHAM），并冠以希腊艺术女神「缪斯」（Muse）之名。

2/21/2025 8:44:06 AM 新智元

2025年度国际挑战赛正式启动，期待你的加入！

•新挑战￮全新具身智能及自动驾驶赛道，全方位覆盖相关领域最新、最热话题，共同探讨具身智能核心问题。 •高奖金￮总奖池高达 10 万美元，单赛道最高奖金（创新奖冠军）可达 1.5 万美元。 2025年度国际挑战赛旨在通过全球合作促进具身智能与自动驾驶领域的发展。

2/20/2025 6:28:00 PM 新闻助手

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来，开源社区涌现了多种「复现」工作。本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标，探索R1/R1-zero中强化学习步骤带来的模型效果提升，并尝试展望R1技术在未来模型训练与业务落地上的前景。一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。

2/20/2025 3:32:28 PM 腾讯技术工程

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

世界首个20万块GPU（另有说法是10万）训出的Grok-3，官宣人人可用了！ DeepSearch、Think两大模式，同时上线。唯独遗憾的是，Big Brain还在雪藏。

2/20/2025 1:44:01 PM 新智元

Nature认证DeepSeek成科研工具全能者，国内高校如何借力大模型？

DeepSeek的风，也是飘到了科研领域——最新消息，同济大学通过百度智能云千帆大模型平台接入并调用DeepSeek-R1/V3系列模型；包括浙大、北大清华等知名高校也是纷纷出动，要么接入模型推出智能体，又或者出品干货课程、使用手册《从入门到精通》等等，几度都登上热搜。 Nature更是几度发文，因为DeepSeek开源低成本易部署等优势，科学家们纷纷涌向DeepSeek，这种模型已经是科研AI工具中的全能者。感知到的是，大模型在科研探索中发挥的价值远比以往任何时候都深入。

2/20/2025 1:30:00 PM 量子位

物理直觉不再是人类专属？LeCun等新研究揭示AI可如何涌现出此能力

在当今的 AI 领域，图灵奖得主 Yann LeCun 算是一个另类。即便眼见着自回归 LLM 的能力越来越强大，能解决的任务也越来越多，他也依然坚持自己的看法：自回归 LLM 没有光明的未来。在近期的一次演讲中，他将自己的观点总结成了「四个放弃」：放弃生成式模型、放弃概率模型、放弃对比方法、放弃强化学习。

2/20/2025 12:37:57 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画 AI新词大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果腾讯算法 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算 AI设计生成式AI 大型语言模型搜索视频生成亚马逊特斯拉 AI模型 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉