资讯列表
RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑
本文作者来自北京大学和阿里通义万相实验室。 其中论文第一作者是汤昊,北京大学 2022 级博士生,发表多篇 NeurIPS, CVPR,ICCV 和 ECCV,目前主要关注统一的多模态理解和生成。 指导教授是王立威老师,北京大学智能学院教授,曾获 NeurIPS 2024 和 ICLR 2023 最佳论文奖。
11/2/2025 5:58:00 PM
机器之心
综述连arXiv都不给发了?最严新规出台:被会议、期刊接收才行,workshop都不行
arXiv 新规:综述、立场论文不再随意接收,会议、期刊接收之后才给发正在写综述和立场论文的学者注意了:即日起,所有想要投稿到 arXiv 计算机科学分类下的综述性文章和立场论文,必须先被正式的期刊或会议接受,并且完成同行评审。 这是 arXiv 刚刚出台的新规。 具体来说,作者在投稿时需要提供文章已被接收并成功完成同行评审的证据(包含同行评审的期刊参考文献和 DOI 元数据)。
11/2/2025 5:53:00 PM
机器之心
高智商 ≠ 高财商?50天实盘测试:LMArena 高分王者也可能是「韭菜」
该研究团队来自伊利诺伊大学厄巴纳-香槟分校(UIUC)。 核心贡献者之一 Haofei Yu 为计算机系博士生,另一位核心贡献者 Fenghai Li 为计算机系本科生,指导教师 Jiaxuan You 为计算机系助理教授,指导 UIUC U Lab。 Jiaxuan You 教授的研究聚焦于大模型智能体(Agentic LLM)的基础能力、垂直应用、生态建设,博士毕业于斯坦福大学,已在 NeurIPS、ICML、ICLR 等顶级会议发表论文三十余篇,总引用量近两万次,多次担任 Area Chair 并组织 Workshop;其开发或主导的开源项目累计获得三万余颗 Star。
11/2/2025 5:51:00 PM
机器之心
Meta裁员、OpenAI重组:万字复盘谷歌起笔的AI史诗,如何被「群雄」改写剧本?
近期各大 AI 公司大动作频出,Meta FAIR 部门遭裁员、OpenAI 资本重组、AWS 大裁员……这一系列动荡表明 AI 行业正从「无限淘金热」转向残酷的「阵地战」。 资本开始重新评估价值,巨头们在激烈的军备竞赛中也不得不审视成本与效率。 那么,这场「阵地战」是怎么打起来的?
11/2/2025 5:46:00 PM
机器之心
少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了
本文作者来自上海交通大学、英国曼彻斯特大学与香港中文大学。 团队成员包括:徐博、王钰超、乐心怡(上海交通大学,自动化系),郭宇鹄、王昌凌(英国曼彻斯特大学,机械与航空航天工程学院),王文婷、任扬(香港中文大学,机械与自动化工程学系)。 表面重建的核心挑战,在于在少量视角下同时兼顾几何准确性、细节还原与结构完整性。
11/2/2025 5:36:00 PM
机器之心
别急着写代码了,先好好写文档吧!Gemini CLI产品负责人预言:未来的开发者可能根本不需要看代码,只需要写下意图
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)别急着写代码,先教AI怎么干活。 这是 Google Cloud Platform 开发者体验部门副总裁Keith Ballinger 最近在《The New Stack Agents》节目上说的一句话,也是一针见血地指出了当下AI开发的最大误区。 Ballinger 是少数依然亲自写代码的高管之一,同时深度参与了最新的 “智能体化” 编程工具的研发与使用。
11/2/2025 1:32:29 PM
听雨
最新外国「自研」大模型,都是套壳国产?
外国开发者:我们该开始学习中文了吗? 绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文? 本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并行协作多个智能体的新界面。
11/1/2025 8:51:00 PM
机器之心
5分钟上手,无照就能飞:91万「空中F1」已经排到了2027
马斯克看了都沉默。 几十年来人们一直幻想,要是有一天能直接飞去上班,不用再堵在路上就好了。 但现实远没那么简单,真正的个人飞行器并不像《杰森一家》动画里那样,只要背上装满易燃燃料的喷气包就能飞。
11/1/2025 8:45:00 PM
机器之心
上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型
程爽,上海人工智能实验室和浙江大学联培博士生一年级;卞一涵,美国马里兰大学硕士生二年级,上海人工智能实验室实习生;刘大卫,上海人工智能实验室和上海交通大学联培博士生一年级;齐弼卿,上海人工智能实验室研究员(指导老师)大模型推理速度慢、成本高,已成为限制其广泛应用的核心瓶颈。 其根源在于自回归(AR)模型「逐字生成」的串行模式。 近日,上海人工智能实验室针对该难题提出全新范式 SDAR (Synergistic Diffusion-AutoRegression)。
11/1/2025 8:40:00 PM
机器之心
AEPO:智能体熵平衡策略优化,让探索更稳,推理更深!
在智能体强化学习的快速发展中,如何在探索与稳定之间取得平衡已成为多轮智能体训练的关键。 主流的熵驱动式智能体强化学习(Agentic RL)虽鼓励模型在高不确定性处分支探索,但过度依赖熵信号常导致训练不稳、甚至策略熵坍塌问题。 为此,中国人民大学高瓴人工智能学院与快手 Klear 语言大模型团队联合提出 Agentic Entropy-Balanced Policy Optimization(AEPO),一种面向多轮智能体的熵平衡强化学习优化算法。
11/1/2025 8:27:00 PM
机器之心
我雇了个AI,替我读微信列表里“吃灰”的公众号文章
咱就是说,大家微信星标的那一溜儿公众号,真会点开看吗? 反正我是没有,除了偶尔出于强迫症点开星标账号清清红点,平时几乎不会全部点进去看它到底更新了啥…. 因为真的——读(太)!
11/1/2025 4:24:21 PM
一水
LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据
DeepAnalyze团队 投稿. 量子位 | 公众号 QbitAI. 你是否还在为复杂的文件和海量数据而苦恼?
11/1/2025 12:27:15 PM
梦晨
你的AI Twin即将上线,天禧AI 3.5版本重大升级!构建你的个人专属硅基队友
10月31日,以”AI有凌犀 赫然心动”为主题的联想天禧AI 一体多端秋季新品超能之夜正式落幕,联想集团高级副总裁、中国消费业务群总经理张华宣布,天禧个人超级智能体升级至3.5版本。 天禧个人超级智能体在历时两年左右的发展后,开始理解并适应每个人的行为习惯,正在实现从“助手”到“队友”的进化。 天禧AI的成长阶梯正式迈入其五级演进路线中的第三个,也是最重要的阶段,情感与个性开始涌现,多智能体协同调度,任务自主拆解和完成,这也是我们看见AI twin的第一束光。
11/1/2025 10:11:59 AM
量子位的朋友们
OpenAI CEO回应马斯克质疑:我只想在宇宙中留下印记
OpenAI 的首席执行官萨姆・奥特曼近日在社交媒体平台 X 上发表了一篇长文,回应了外界对 OpenAI 即将上市的质疑。 尤其是他与老对手埃隆・马斯克之间的争论,引起了广泛关注。 日前有报道称,OpenAI 正在考虑最早于明年下半年申请首次公开募股(IPO),预计融资至少600亿美元,目标估值高达1万亿美元,这将成为历史上最大的 IPO 之一。
10/31/2025 7:16:04 PM
AI在线
理想召回11411辆MEGA,宣布免费更换电池
一凡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto刚刚,理想宣布了对MEGA的召回。 涉及11411辆,理想汽车宣布为车主免费更换全新动力电池及相关配套设备。
10/31/2025 6:11:12 PM
一凡
新一代 AI 视频生成模型 LTX-2发布:完整叙事高清视频一键生成
在 AI 技术迅猛发展的背景下,Lightricks 公司近日发布了其最新研发的 AI 视频生成模型 ——LTX-2。 这一模型能够一次性生成长达20秒的完整4K 叙事高清视频,配有声音和口型同步,为视频创作带来了革命性的进展。 LTX-2的核心技术在于其音画同步生成能力,传统的 AI 视频生成工具往往只能生成无声视频,随后需要人工添加配音。
10/31/2025 5:21:45 PM
AI在线
大模型公司不搞浏览器搞Agent,实测找到原因了
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI如果Agent能操作命令行,就有了与整个计算机系统交互的能力。 也意味着一台计算机的几乎所有功能,都可以通过自然语言来驱动。
10/31/2025 4:57:59 PM
闻乐
Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAITransformer的时代,正在被改写。 月之暗面最新发布的开源Kimi Linear架构,用一种全新的注意力机制,在相同训练条件下首次超越了全注意力模型。
10/31/2025 4:49:31 PM
闻乐