AI

马斯克20亿送Grok 4上火星！20万GPU造宇宙大脑，一句话生成3D黑洞

马斯克20亿送Grok 4上火星！20万GPU造宇宙大脑，一句话生成3D黑洞

1条指令生成整段动画，2分钟内部署一款游戏!Grok 4发布仅仅12小时后，AI开发者Mckay Wrigley体验之后，直呼「强得疯狂」！在一次请求中，Grok 4 Heavy就生成了完整动画，从人群行走到鸟瞰镜头无缝切换，展现惊人理解与执行力，而其他模型完全无法匹敌。提示词：Create an animation of a crowd of people walking to form 「Hello world, I am Grok」 as camera changes to birds-eye.还能表现得像阅兵一样，整齐划一地行进：这款3D视频，全网爆火，浏览量破350万。

7/14/2025 9:16:00 AM

奥特曼气到快失眠？OpenAI前大佬力挺：小扎砸钱挖墙脚，1亿美元很合理

奥特曼气到快失眠？OpenAI前大佬力挺：小扎砸钱挖墙脚，1亿美元很合理

最近，Meta不断从竞争对手那里挖走顶尖AI人才，开出的签约薪酬包更是令人咋舌！比如，庞若鸣跳槽到Meta，总薪酬包高达惊人的2亿美元。为了挖走OpenAI的人才，小扎支付了1亿美元签下了Jiahui Yu。

7/14/2025 9:14:00 AM

VLA 推理新范式！一致性模型 CEED-VLA 实现四倍加速！

VLA 推理新范式！一致性模型 CEED-VLA 实现四倍加速！

本文第一作者为香港科技大学（广州）机器人系一年级博士生宋文轩，主要研究方向为VLA模型，共同第一作者是来自香港科技大学广州的研究助理陈家毅，项目leader为浙江大学和西湖大学联合培养博士生丁鹏翔，他们也是具身智能领域开源项目OpenHelix以及LLaVA-VLA的研究团队。通讯作者为香港科技大学广州的李昊昂教授，他是今年的CVPR2025 Best Paper Candidate的获得者。近年来，视觉 - 语言 - 动作（Vision-Language-Action, VLA）模型因其出色的多模态理解与泛化能力，已成为机器人领域的重要研究方向。

7/14/2025 9:14:00 AM

「流匹配」成ICML 2025超热门主题！网友：都说了学物理的不准转计算机

「流匹配」成ICML 2025超热门主题！网友：都说了学物理的不准转计算机

众所周知，第 42 届国际机器学习大会（ICML）将于 7 月 13 日至 19 日在加拿大温哥华盛大举行。在生成式 AI 领域，最新的前沿热点已经转向探索更高质量，更稳定，更简洁，更通用的模型形态。流匹配（Flow Matching）技术正完美的踩中了每一个热点要素。

7/14/2025 9:12:00 AM

从OpenAI叛逃谷歌！这位27岁小哥，成了奥特曼最忌惮的「秘密武器」

从OpenAI叛逃谷歌！这位27岁小哥，成了奥特曼最忌惮的「秘密武器」

27岁的Logan Kilpatrick，堪称谷歌与开发者之间的「超级联络员」。 2024年，Kilpatrick从OpenAI跳槽谷歌，摇身一变成为谷歌AI赛道上的「秘密武器」。这位年轻的技术天才，不仅掌管谷歌AI Studio，还以超强的个人魅力和开发者洞察力，成了谷歌AI的流量密码。

7/14/2025 9:03:00 AM

7B模型对标GPT-4o，全球首个医疗代码生成大模型训练平台来了

7B模型对标GPT-4o，全球首个医疗代码生成大模型训练平台来了

医疗AI场景复杂，需要“又懂医疗又懂编程”的agent。但像GPT这样现成的大模型难以直接部署，该如何突破技术壁垒？答案是：打造一个统一的训练平台，专门训练能够生成医疗代码的大模型。

7/14/2025 9:00:00 AM

攻克「恶意投毒」攻击！华南理工联合霍普金斯和UCSD，连登TPAMI、TIFS顶刊

攻克「恶意投毒」攻击！华南理工联合霍普金斯和UCSD，连登TPAMI、TIFS顶刊

虽然无法彻底解决维度诅咒带来的问题，根据理论证明，曼哈顿距离在高维空间中的识别能力要远远好于常用的欧式距离，可以缓解维度诅咒效应。方法框架即便曼哈顿距离有着更好的识别效力，但是研究人员也不认为在识别后门攻击的时候曼哈顿就能完全替代欧氏距离。除此以外，先前的工作已经表明[3]，有的后门攻击会在欧氏距离上表现区分度，有的则会在余弦相似度（Cos 距离）上表现差异。

7/14/2025 8:57:00 AM

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

论文作者团队简介：本文第一作者周鑫，共同第一作者梁定康，均为华中科技大学博士生，导师为白翔教授。合作者包括华中科技大学陈楷锦、冯天瑞、林鸿凯，旷视科技陈习武、丁宜康、谭飞杨和香港大学赵恒爽助理教授。在HunyuanVideo上，EasyCache在复杂场景下保持与原视频的一致外观，同时显著加速1.

7/14/2025 8:51:00 AM

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

我们终于摆脱 tokenization 了吗？答案是：可能性无限大。最近，Mamba 作者之一 Albert Gu 又发新研究，他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net，其用模型内部的动态分块过程取代 tokenization，从而自动发现和操作有意义的数据单元。

7/14/2025 8:50:00 AM

模拟大脑功能分化！北大与港中文发布Fast-in-Slow VLA，让“快行动”和“慢推理”统一协作

模拟大脑功能分化！北大与港中文发布Fast-in-Slow VLA，让“快行动”和“慢推理”统一协作

作者简介：由来自北京大学、香港中文大学、北京智源研究院、智平方的老师同学联合研究，作者包括博士生陈浩、刘家铭、顾晨阳、刘卓洋，通讯作者为北京大学仉尚航。北京大学 HMI 实验室长期致力于具身智能和多模态学习领域的研究，欢迎关注。快执行与慢思考：在机器人操控领域，实现高频响应与复杂推理的统一，一直是一个重大技术挑战。

7/14/2025 8:47:00 AM

第一作者必须是AI！首个面向AI作者的学术会议来了，斯坦福发起

第一作者必须是AI！首个面向AI作者的学术会议来了，斯坦福发起

在 AI 已深度介入科研流程的今天，从提出假设到生成图表、撰写论文，它正逐步参与乃至重塑整个科学研究的方式。但讽刺的是，尽管我们在 CVPR、NeurIPS、ICLR、ICML 甚至 ACL 等顶会中看到 AI 无处不在，却几乎没有任何一个会议或期刊承认 AI 的「作者身份」——AI 被广泛使用，却从未被名正言顺地署名。这一局面，终于被打破了。

7/14/2025 8:47:00 AM

氛围编程后，Karpathy又双叒有新「脑洞」！PDF将死，未来99%是AI氛围阅读

氛围编程后，Karpathy又双叒有新「脑洞」！PDF将死，未来99%是AI氛围阅读

Karpathy大神这次继Vibe Coding氛围编程后，又想造全新概念了！大神说他早就抱怨了很多次，未来99%的「Attention」（注意力）即将被AI，而非人类关注。但是现在99.9%的互联网内容还是「写给人看的」，不论是网页、视频还是科研PDF论文。

7/14/2025 8:44:00 AM

清华ICCV25丨密室逃脱成AI新考场，通关率不足50%，暴露空间推理短板

清华ICCV25丨密室逃脱成AI新考场，通关率不足50%，暴露空间推理短板

近年来，多模态大模型（MLLMs）发展迅猛，从看图说话到视频理解，似乎无所不能。但你是否想过：它们真的“看懂”并“想通”了吗？模型在面对复杂的、多步骤的视觉推理任务时，能否像人类一样推理和决策？

7/14/2025 8:40:00 AM

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能，AI 生图能力被拉上了一个新的高度，但你有没有想过，这光鲜亮丽的背后也隐藏着严峻的安全挑战：如何区分生成图像和真实图像？尽管目前有很多研究已在尝试解决这个挑战，然而这个挑战深层次的泛化难题一直没有得到合理的探究，生成图像和真实图像的区别真的是简单的「真假二分类」吗？近日，北京大学与腾讯优图实验室等机构的研究人员针对这一泛化难题做了一些深层次的探究，研究表明 AI 生成图像检测任务远比「真假二分类」复杂！

7/14/2025 8:39:00 AM

用AI写代码效率反降19%！246项任务实测，16位资深程序员参与

用AI写代码效率反降19%！246项任务实测，16位资深程序员参与

用AI，有经验的开发者反倒被拖慢了？在一项基于真实开源项目的实验中，研究者发现使用AI工具不仅没有提升开发效率，反而让任务时间增加19%。这简直与人们预测的结果完全相反。

7/14/2025 8:35:00 AM

杨植麟被梁文锋叫醒了！Kimi新模型发布即开源，1T参数全线SOT

杨植麟被梁文锋叫醒了！Kimi新模型发布即开源，1T参数全线SOT

172天过去，Kimi在深夜低调给出了DeepSeek冲击波后的回应。全新Kimi K2基础大模型，MoE架构，总参数1T，激活参数32B，能力领先性尤其展现在代码、Agent、数学推理任务上。 Kimi援引多个基准评测数据，创造了开源全新SOTA。

7/14/2025 8:30:00 AM

用AI，写代码只会更慢！但一定更「快乐」

用AI，写代码只会更慢！但一定更「快乐」

AI进化成编程怪物后，这或许是很多程序员/科研人的日常。但是，用了AI，写代码一定更快了吗？ METR（Model Evaluation & Threat Research）研究发现，如果你够强、对代码库够熟悉，AI工具反而会给你拖后腿！

7/14/2025 7:54:00 AM

必须 AI 为第一作者！斯坦福发起的科研会议，接收 AI 投稿，AI 审稿、人类只能围观

必须 AI 为第一作者！斯坦福发起的科研会议，接收 AI 投稿，AI 审稿、人类只能围观

2025年10月22日，名为“Agents4Science”的虚拟会议将正式召开。这是全球首个明确规定：AI必须担任论文作者和评审人的科学会议。图片地址：，所有提交的研究论文，必须由AI系统完成主要写作，并接受AI系统的同行评审。

7/14/2025 2:15:00 AM

资讯热榜

月之暗面 Kimi K2 发布并开源，擅长代码与 Agentic 任务 OpenAI 筹划进军硬件市场，CEO 奥尔特曼曾称 AI 革命不一定需要新硬件 ChatGPT 商业推荐被曝引用不可靠信息来源，专家提醒用户勿盲目信任谷歌 Gemini 待发布新技能曝光：AI 帮你生成插画故事书 ChatGPT 又遇“奶奶漏洞”，网友成功让 GPT-4o 主动生成“Win7 密钥” 微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型：10 倍吞吐量，推理能力升级多模态大模型的“安全锁”：SAPT 软提示调优技术资讯/神器/素材全都有！2025年6月设计素材周刊第四波

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 开源用户智能 Meta 微软 GPT 学习图像技术 Gemini AI创作马斯克论文 Anthropic 代码英伟达算法 Stable Diffusion 训练智能体芯片开发者蛋白质生成式腾讯苹果 AI新词神经网络 3D LLM Claude 研究生成机器学习计算 AI for Science Sora 人形机器人 AI视频 xAI AI设计 GPU 华为百度搜索大语言模型 Agent 场景字节跳动预测大型语言模型深度学习工具伟达 Transformer 视觉 RAG 具身智能神器推荐亚马逊 Copilot 模态 AGI LLaMA 文本算力驾驶