资讯列表

分类

标签

RAE的终极形态？北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

本文作者来自北京大学和阿里通义万相实验室。其中论文第一作者是汤昊，北京大学 2022 级博士生，发表多篇 NeurIPS, CVPR，ICCV 和 ECCV，目前主要关注统一的多模态理解和生成。指导教授是王立威老师，北京大学智能学院教授，曾获 NeurIPS 2024 和 ICLR 2023 最佳论文奖。

11/2/2025 5:58:00 PM

机器之心

综述连arXiv都不给发了？最严新规出台：被会议、期刊接收才行，workshop都不行

arXiv 新规：综述、立场论文不再随意接收，会议、期刊接收之后才给发正在写综述和立场论文的学者注意了：即日起，所有想要投稿到 arXiv 计算机科学分类下的综述性文章和立场论文，必须先被正式的期刊或会议接受，并且完成同行评审。这是 arXiv 刚刚出台的新规。具体来说，作者在投稿时需要提供文章已被接收并成功完成同行评审的证据（包含同行评审的期刊参考文献和 DOI 元数据）。

11/2/2025 5:53:00 PM

机器之心

高智商 ≠ 高财商？50天实盘测试：LMArena 高分王者也可能是「韭菜」

该研究团队来自伊利诺伊大学厄巴纳-香槟分校（UIUC）。核心贡献者之一 Haofei Yu 为计算机系博士生，另一位核心贡献者 Fenghai Li 为计算机系本科生，指导教师 Jiaxuan You 为计算机系助理教授，指导 UIUC U Lab。 Jiaxuan You 教授的研究聚焦于大模型智能体（Agentic LLM）的基础能力、垂直应用、生态建设，博士毕业于斯坦福大学，已在 NeurIPS、ICML、ICLR 等顶级会议发表论文三十余篇，总引用量近两万次，多次担任 Area Chair 并组织 Workshop；其开发或主导的开源项目累计获得三万余颗 Star。

11/2/2025 5:51:00 PM

机器之心

Meta裁员、OpenAI重组：万字复盘谷歌起笔的AI史诗，如何被「群雄」改写剧本？

近期各大 AI 公司大动作频出，Meta FAIR 部门遭裁员、OpenAI 资本重组、AWS 大裁员……这一系列动荡表明 AI 行业正从「无限淘金热」转向残酷的「阵地战」。资本开始重新评估价值，巨头们在激烈的军备竞赛中也不得不审视成本与效率。那么，这场「阵地战」是怎么打起来的？

11/2/2025 5:46:00 PM

机器之心

少量视角也能得到完整3D几何，即插即用的语义增强重建插件来了

本文作者来自上海交通大学、英国曼彻斯特大学与香港中文大学。团队成员包括：徐博、王钰超、乐心怡（上海交通大学，自动化系），郭宇鹄、王昌凌（英国曼彻斯特大学，机械与航空航天工程学院），王文婷、任扬（香港中文大学，机械与自动化工程学系）。表面重建的核心挑战，在于在少量视角下同时兼顾几何准确性、细节还原与结构完整性。

11/2/2025 5:36:00 PM

机器之心

别急着写代码了，先好好写文档吧！Gemini CLI产品负责人预言：未来的开发者可能根本不需要看代码，只需要写下意图

编辑 | 听雨出品 | 51CTO技术栈（微信号：blog51cto）别急着写代码，先教AI怎么干活。这是 Google Cloud Platform 开发者体验部门副总裁Keith Ballinger 最近在《The New Stack Agents》节目上说的一句话，也是一针见血地指出了当下AI开发的最大误区。 Ballinger 是少数依然亲自写代码的高管之一，同时深度参与了最新的 “智能体化” 编程工具的研发与使用。

11/2/2025 1:32:29 PM

听雨

最新外国「自研」大模型，都是套壳国产？

外国开发者：我们该开始学习中文了吗？绷不住了，美国科技公司最新发布的大模型，思考时怎么一直在说中文？本周，知名 AI 代码工具 Cursor 发布了 2.0 版重大更新，推出了首个自家的代码模型 Composer，以及用于并行协作多个智能体的新界面。

11/1/2025 8:51:00 PM

机器之心

5分钟上手，无照就能飞：91万「空中F1」已经排到了2027

马斯克看了都沉默。几十年来人们一直幻想，要是有一天能直接飞去上班，不用再堵在路上就好了。但现实远没那么简单，真正的个人飞行器并不像《杰森一家》动画里那样，只要背上装满易燃燃料的喷气包就能飞。

11/1/2025 8:45:00 PM

机器之心

上海AI Lab发布混合扩散语言模型SDAR：首个突破6600 tgs的开源扩散语言模型

程爽，上海人工智能实验室和浙江大学联培博士生一年级；卞一涵，美国马里兰大学硕士生二年级，上海人工智能实验室实习生；刘大卫，上海人工智能实验室和上海交通大学联培博士生一年级；齐弼卿，上海人工智能实验室研究员（指导老师）大模型推理速度慢、成本高，已成为限制其广泛应用的核心瓶颈。其根源在于自回归（AR）模型「逐字生成」的串行模式。近日，上海人工智能实验室针对该难题提出全新范式 SDAR (Synergistic Diffusion-AutoRegression)。

11/1/2025 8:40:00 PM

机器之心

AEPO：智能体熵平衡策略优化，让探索更稳，推理更深！

在智能体强化学习的快速发展中，如何在探索与稳定之间取得平衡已成为多轮智能体训练的关键。主流的熵驱动式智能体强化学习（Agentic RL）虽鼓励模型在高不确定性处分支探索，但过度依赖熵信号常导致训练不稳、甚至策略熵坍塌问题。为此，中国人民大学高瓴人工智能学院与快手 Klear 语言大模型团队联合提出 Agentic Entropy-Balanced Policy Optimization（AEPO），一种面向多轮智能体的熵平衡强化学习优化算法。

11/1/2025 8:27:00 PM

机器之心

我雇了个AI，替我读微信列表里“吃灰”的公众号文章

咱就是说，大家微信星标的那一溜儿公众号，真会点开看吗？反正我是没有，除了偶尔出于强迫症点开星标账号清清红点，平时几乎不会全部点进去看它到底更新了啥…. 因为真的——读（太）！

11/1/2025 4:24:21 PM

一水

LLM能替代数据科学家了？DeepAnalyze帮你告别手动分析数据

DeepAnalyze团队投稿. 量子位 | 公众号 QbitAI. 你是否还在为复杂的文件和海量数据而苦恼？

11/1/2025 12:27:15 PM

梦晨

你的AI Twin即将上线，天禧AI 3.5版本重大升级！构建你的个人专属硅基队友

10月31日，以”AI有凌犀赫然心动”为主题的联想天禧AI 一体多端秋季新品超能之夜正式落幕，联想集团高级副总裁、中国消费业务群总经理张华宣布，天禧个人超级智能体升级至3.5版本。天禧个人超级智能体在历时两年左右的发展后，开始理解并适应每个人的行为习惯，正在实现从“助手”到“队友”的进化。天禧AI的成长阶梯正式迈入其五级演进路线中的第三个，也是最重要的阶段，情感与个性开始涌现，多智能体协同调度，任务自主拆解和完成，这也是我们看见AI twin的第一束光。

11/1/2025 10:11:59 AM

量子位的朋友们

OpenAI CEO回应马斯克质疑:我只想在宇宙中留下印记

OpenAI 的首席执行官萨姆・奥特曼近日在社交媒体平台 X 上发表了一篇长文，回应了外界对 OpenAI 即将上市的质疑。尤其是他与老对手埃隆・马斯克之间的争论，引起了广泛关注。日前有报道称，OpenAI 正在考虑最早于明年下半年申请首次公开募股（IPO），预计融资至少600亿美元，目标估值高达1万亿美元，这将成为历史上最大的 IPO 之一。

10/31/2025 7:16:04 PM

AI在线

理想召回11411辆MEGA，宣布免费更换电池

一凡发自副驾寺. 智能车参考 | 公众号 AI4Auto刚刚，理想宣布了对MEGA的召回。涉及11411辆，理想汽车宣布为车主免费更换全新动力电池及相关配套设备。

10/31/2025 6:11:12 PM

一凡

新一代 AI 视频生成模型 LTX-2发布:完整叙事高清视频一键生成

在 AI 技术迅猛发展的背景下，Lightricks 公司近日发布了其最新研发的 AI 视频生成模型 ——LTX-2。这一模型能够一次性生成长达20秒的完整4K 叙事高清视频，配有声音和口型同步，为视频创作带来了革命性的进展。 LTX-2的核心技术在于其音画同步生成能力，传统的 AI 视频生成工具往往只能生成无声视频，随后需要人工添加配音。

10/31/2025 5:21:45 PM

AI在线

大模型公司不搞浏览器搞Agent，实测找到原因了

闻乐发自凹非寺. 量子位 | 公众号 QbitAI如果Agent能操作命令行，就有了与整个计算机系统交互的能力。也意味着一台计算机的几乎所有功能，都可以通过自然语言来驱动。

10/31/2025 4:57:59 PM

闻乐

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

闻乐发自凹非寺. 量子位 | 公众号 QbitAITransformer的时代，正在被改写。月之暗面最新发布的开源Kimi Linear架构，用一种全新的注意力机制，在相同训练条件下首次超越了全注意力模型。

10/31/2025 4:49:31 PM

闻乐

资讯热榜

AMD CEO 透露：多家OpenAI 级别客户争相采购AI芯片附保姆级实操教程！Suno V5让整个B站开始文艺复兴了！谷歌流量显著下降，People Inc. 与微软达成 AI 内容授权协议中国华电发布 “华电智” 大模型，能源管理进入智能新时代后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）谷歌推出新款 Vertex AI 代理构建工具，助力企业智能化 10分钟教会机器人工作?上海AgiBot正在重写制造业规则 OpenAI CEO：OpenAI 失败时不希望政府出手救助

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 AI for Science Agent 苹果芯片 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型具身智能生成百度 Sora 工具 GPU 华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习生成式AI 架构 DeepMind 亚马逊编程特斯拉视觉 Transformer AI模型预测 MCP