模型

NeurIPS Spotlight｜运动遮挡都不怕，0先验、一段视频精准预测相机参数

论文一作李放，美国伊利诺伊大学香槟分校 (UIUC) 博二学生，研究方向为 4D 视觉定位、重建/新视角合成以及理解。第二作者为美国伊利诺伊大学香槟分校博四学生张昊。通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor（Ming-hsuan Yang, Jia-bin Huang 博士导师）。

9/26/2025 9:12:49 AM

ChatGPT新功能Pulse，GPT-5主动给你推消息，大家玩得停不下来

这是 OpenAI CEO 山姆・奥特曼迄今为止最喜欢的 ChatGPT 功能。本周五凌晨，OpenAI 宣布推出 ChatGPT 新功能「Pulse」的预览版，首先向 Pro 订阅用户开放。 ChatGPT 现在会每天晚上主动进行研究，根据你每天的聊天记录、反馈以及日历等关联应用提供个性化更新。

9/26/2025 9:09:32 AM

15 分钟吃透核心：卷积 / 池化 / 全连接 + 六大经典模型对比

卷积神经网络（Convolutional Neural Network，简称CNN）是一种深度学习模型，专门用于处理和分析视觉数据，在图像识别、目标检测等任务中表现尤为出色。然而，CNN的架构因其固有的复杂性和快速演进的特性，往往难以掌握。在本文中，将详细介绍标准CNN架构及CNN家族中的各类模型，并拆解其核心组成部分，包括：卷积层、池化层、全连接层同时讲解步长（stride）、卷积核（kernel）、池化（pooling）等关键概念。

9/26/2025 9:08:27 AM

奖励模型：为什么要用评估专家及其设计方案

大模型最根本的价值就是替代人的工作，而在训练大模型的过程中，还有很多操作是需要人工的。比如数据工程里的数据质量检查、模型评估阶段的人工测评等。关于这个问题，我的答案是使用评估专家模型技术，让这些过程实现完全无人化。

9/26/2025 2:11:00 AM greencoatman

陶哲轩长文剖析现代社会：大型组织挤压小型社群，个体陷入疏离困境，AI正在加速这一进程

陶哲轩刚刚发布长文，从一个协作式数学项目引发的社群现象出发，提出了一个观察现代人类社会的宏观框架。该框架认为，现代技术和激励体系在赋能个体与大型组织的同时，正在严重削弱小型组织的生态位，导致个体普遍面临疏离感、孤独感和无力感。人类社会的四个尺度文章首先提出一个粗略的划分，将人类社会视为四个不同尺度上实体间的互动：1.个体人类2.小型人类组织：如家庭、朋友、本地社团、小型企业、临时项目组、小型在线社群等。

9/25/2025 4:36:09 PM

AI正在偷走白领工作！OpenAI狂砸10亿教AI上班，你的完美继任者即将上岗

AI正在接管白领工作吗？今年5月，Anthropic CEO Dario Amodei曾表示：AI有可能在未来1—5年内消灭一半的入门级白领职位，并使美国失业率上涨到10—20%。这场史无前例的岗位大替代，引发了普遍担忧。

9/25/2025 3:23:44 PM

刚刚，LeCun团队开源首款代码世界模型！能像程序员一样思考的LLM来了

就在今天，Meta官宣发布了一款名为代码世界模型（Code World Model, CWM）的LLM，探索如何使用世界模型改进AI代码生成性能。 Yann LeCun也亲自下场转发撑场子了。 CWM究竟有哪些创新点？

9/25/2025 1:27:39 PM

CrowdStrike联手Meta发布AI安全基准，让AI在真实网络攻击中证明自己

美国网络安全巨头CrowdStrike和Meta凑到一块，在拉斯维加斯的Fal.Con 2025大会上宣布，联合推出了一个叫CyberSOCEval的开源基准测试套件。这东西干嘛的？就是一张给所有号称能做网络安全的AI大语言模型准备的考卷，专门考它们在真实的安全运营中心（SOC）环境下，到底能不能打。

9/25/2025 9:04:00 AM

震撼！AI物理「双修」：亥姆霍兹方程嵌进生成器，伪影当场消失

传统AI在构建无线电地图时常因缺乏物理规律的约束而导致预测失真。为解决这一难题，香港科技大学（广州）的研究团队创新性地提出了PhyRMDM框架，首次将物理信息神经网络（PINN）与扩散模型（Diffusion Model）相结合，并设计了全新的双Unet架构。该框架通过物理方程引导AI模型的训练过程，实现了数据驱动与物理规律的完美融合，将无线电地图的生成精度与物理一致性提升到新的高度。

9/25/2025 9:03:00 AM

Meta打开AI元认知，让AI不止会解题，还会总结套路了

大语言模型记性不太好。具体来说，它们在解决需要多个步骤的复杂问题时，经常“顾尾不顾头”。比如它刚辛辛苦苦推导出一个几何级数求和公式解了一道题，下一道题遇到类似的问题，它就把刚才的功夫忘得一干二净，又从头开始重新推导一遍。

9/25/2025 9:02:00 AM

苏黎世联邦理工学院：Prompt 的尽头是 MBTI ！

怎样写提示词（Prompt）？苏黎世联邦理工学院（ETH Zurich）与BASF研究人员联合发布的新研究给出了答案：提示词的尽头，不是工具箱，而是性格表。图片他们提出了一个名为 MBTI-in-Thoughts 的框架，用心理学中的MBTI人格模型提示大语言模型，从而在不改变模型参数的情况下，引导其产生稳定、可预测的人格行为倾向。

9/24/2025 6:06:33 PM

Nano Banana不及格，开源模型一分难求！上海AI Lab新基准直击文生图模型痛点

从GPT-4o到Nano Banana、Seedream 4.0，今年的大模型想要出圈，“画得好”俨然成了必杀技。不过，在比拼真实感、艺术性方面，生图模型是神仙打架，在“做题”上，现如今的模型们又到底能力几何？比如，当指令变成画出1-甲基环己烯酸催化水合的反应机理、根据给定的边集画出图的最小生成树，模型能否像相关专业的人类考生一样，真正把知识理解、推理和作图结合在一起？

9/24/2025 1:04:01 PM

国产MiroMind智能体框架，登顶全球预测未来大模型榜单

一个叫MiroMind的AI公司，在全球首个动态实时预测基准FutureX上拿了第一。老板，是陈天桥。就是那个创办了盛大网络，后来跑去做脑科学研究的陈天桥。

9/24/2025 9:02:42 AM

Nature发布Delphi-2M模型，提前20年预测你得什么病

一个叫Delphi-2M的AI模型横空出世，在科学界炸开了锅。这玩意儿能预测一个人未来可能得的1000多种病，有时候甚至能提前几十年打招呼。相关的研究成果，2025年9月17日发表在了顶尖期刊《自然》上。

9/24/2025 9:00:25 AM suai

Qwen开源版Banana来了！原生支持ControlNet

Qwen版Banana来了！刚刚，Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。不仅支持多图融合，提供“人物人物”，“人物商品”，“人物场景” 等多种玩法，还增强了人物、商品、文字等单图一致性。

9/24/2025 8:57:13 AM

GUI智能体训练迎来新范式！半在线强化学习让7B模型媲美GPT-4o

如何让AI更聪明地操作手机、电脑界面？浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上，推出全新研究成果——UI-S1，提出了一种名为半在线强化学习（Semi-online Reinforcement Learning）的创新训练范式。该工作融合了离线训练的稳定性与在线学习的长程优化能力，在不依赖真实环境交互的前提下，显著提升了模型在动态多轮任务中的表现。

9/24/2025 8:53:10 AM

山姆•奥特曼刚发长文：《丰盛的智能》，智能将人人可及

刚刚，Sam Altman 发布了一篇名为Abundant Intelligence的新博文，勾勒出 OpenAI 野心勃勃的 AI 基础设施愿景。山姆•奥特曼在文中表示，AI 服务的增长速度令人惊叹，而未来将更加惊人。他认为:随着 AI 变得更智能，获取 AI 将成为经济的基本驱动力，甚至可能最终被视为一项基本人权。

9/24/2025 8:46:13 AM J0hn

Depth Anything再出新作！浙大&港大出品：零样本，优化任意深度图

深度感知，即让机器拥有「三维视觉」，是当今计算机科学和机器人领域的基石。它赋予了自动驾驶系统判断安全距离的能力，让AR/VR头显能准确感知物理空间，也为工业自动化提供了精准操作的保障。尽管单目深度估计（MDE）模型取得了重大进展，能够进行完整和详细的深度预测，但预测的深度是相对的，缺乏精确的度量信息。

9/23/2025 12:52:38 PM

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

模型

NeurIPS Spotlight｜运动遮挡都不怕，0先验、一段视频精准预测相机参数

ChatGPT新功能Pulse，GPT-5主动给你推消息，大家玩得停不下来

15 分钟吃透核心：卷积 / 池化 / 全连接 + 六大经典模型对比

奖励模型：为什么要用评估专家及其设计方案

陶哲轩长文剖析现代社会：大型组织挤压小型社群，个体陷入疏离困境，AI正在加速这一进程

AI正在偷走白领工作！OpenAI狂砸10亿教AI上班，你的完美继任者即将上岗

刚刚，LeCun团队开源首款代码世界模型！能像程序员一样思考的LLM来了

CrowdStrike联手Meta发布AI安全基准，让AI在真实网络攻击中证明自己

震撼！AI物理「双修」：亥姆霍兹方程嵌进生成器，伪影当场消失

Meta打开AI元认知，让AI不止会解题，还会总结套路了

苏黎世联邦理工学院：Prompt 的尽头是 MBTI ！

Nano Banana不及格，开源模型一分难求！上海AI Lab新基准直击文生图模型痛点

国产MiroMind智能体框架，登顶全球预测未来大模型榜单

Nature发布Delphi-2M模型，提前20年预测你得什么病

Qwen开源版Banana来了！原生支持ControlNet

GUI智能体训练迎来新范式！半在线强化学习让7B模型媲美GPT-4o

山姆•奥特曼刚发长文：《丰盛的智能》，智能将人人可及

Depth Anything再出新作！浙大&amp;港大出品：零样本，优化任意深度图

Depth Anything再出新作！浙大&港大出品：零样本，优化任意深度图