AI在线 AI在线

理论

首个面向柔性衣物灵巧操作的仿真平台来了,北大、伯克利联合发布

本论文共同第一作者为王昱然、吴睿海、陈越,导师为北京大学董豪老师。 课题组致力于统一的物体表征操作研究,以实现具有可解释性和泛化能力的物体操作策略。 在机器人操作领域,柔性物体,尤其是衣物的操控始终是一个值得关注的难题。
5/28/2025 6:43:17 PM

Meta闪电分拆AI帝国!Llama团队一劈为二:一边狂卷AGI,一边死磕OpenAI

2025 年 5 月,据 Axios 报道,Meta 正式将其 AI 部门拆分为两个独立方向:面向消费者的AI产品团队,以及追求通用人工智能(AGI)的“AGI Foundations”基础组。 过去几年,Meta在AI领域的策略始终被认为偏“研究导向”:大模型Llama的发布频率、论文产出数量、开源社区活跃度,都表现出一种“与学界赛跑”的姿态。 但与此同时,用户端产品的AI体验却始终模糊——Llama虽强,却“藏”在模型库里,普通用户几乎无感。
5/28/2025 6:41:37 PM

刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立

小扎最近着实有点烦。 一是谷歌、OpenAI、Anthropic等竞争对手不断「上压力」,谷歌I/O大会、Claude 4出炉,而OpenAI的奥特曼牵手了Apple乔布斯时代的乔纳森做硬件;二是刚刚2岁的Llama(2023年开源),最初署名的14名作者走的走,创业的创业,选择留下的只有3人;三是Llama 4不仅翻车,Behemoth还面临跳票,即使是Scout、Maverick被开发者调侃为Llama 3.5;四是作为「技术老大」的Yann LeCun天天可劲地说LLM要完蛋,与当下LLM发展背道而驰。 终于,小扎「痛定思痛」决定重组Meta的AI团队!
5/28/2025 6:41:30 PM

突发!传字节内部禁用Cursor、Windsurf!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)刚刚得到消息,字节跳动相关部门正在禁用 Cursor、WindSurf 等 AI 开发软件。 有报道称,这一决定来源于字节跳动安全与风控部门发布的一封邮件。 邮件称,出于对防范数据泄露风险的考虑,自6月30日起,将在内部分批次禁用第三方AI开发软件,包括AI编程工具Cursor、Windsurf等,并将字节旗下的编程助手Trae作为替代方案。
5/28/2025 6:36:47 PM
云昭

硬核分享!构建单智能体已经Out了!大佬分享:架构设计如何推动可靠的多智能体编排

作者 | Nikhil Gupta,Atlassian AI产品管理负责人编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)时至今日,如果再提如何构建一个Agent,肯定已经过时了。 打造一个超级智能的单一模型已经不再是2025年的主旋律。 而真正的力量和令人兴奋的新领域,是让多个专业化的AI智能体协同运转起来。
5/28/2025 6:04:20 PM
云昭

55万人围观!这款代理意外燃爆了!产品感知力爆表!一张截图复刻苹果官网,一句话生成真运行App,Figma导入调整细节,要变天了

出品 | 51CTO技术栈(微信号:blog51cto)今天凌晨,一款Agent工具意外出圈了。 一位热衷 AI 摄影导演的 X 博主 @EHuanglu 分享了他试用一个名叫 HeroUI 的 AI 工具的经历,并放出了自己近日来生成的 6 个精美 App 或网站,精美程度堪比苹果、迪奥。 “我只用文字 prompt,就在几分钟内创建了一个完整的项目管理应用。
5/28/2025 5:55:16 PM
云昭

地瓜机器人完成1亿美元A轮融资,加速构建具身智能生态版图

2025 年 5 月 28 日,在独立运营一周年之际,地平线机器人-W旗下地瓜机器人宣布完成 1 亿美元 A 轮融资。 本轮融资获得海内外众多投资机构青睐,由高瓴资本、五源资本、线性资本、和暄资本、九合创投、Vertex Growth、砺思资本、敦鸿资产、沸点资本、梅花创投、黄浦江资本等投资机构共同参投,为地瓜机器人加速构建具身智能生态版图注入强劲动力。 自成立以来,地瓜机器人始终承载着「成为机器人时代的 Wintel 」的品牌初心,致力构建软硬一体、端云协同的全链路开发基础设施,让更智能的机器人开发更简单,并在商业生态上实现了从消费级机器人市场的规模化落地,新兴智能机器人的多元品类孵化,到与众多具身智能头部企业协同创新的全面跨越,全力推动机器人智能进化与规模化落地。
5/28/2025 1:25:14 PM

MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

仅需一个强化学习(RL)框架,就能实现视觉任务大统一? 现有RL对推理和感知任务只能二选一,但“大模型六小强”之一MiniMax表示:我全都要! 最新开源V-Triune(视觉三重统一强化学习系统)框架,使VLM首次能够在单个后训练流程中,联合学习和掌握视觉推理和感知任务。
5/28/2025 11:55:56 AM

多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!

表现最好的GPT-o4 mini,物理推理能力也远不及人类! 就在最近,来自香港大学、密歇根大学等机构的研究人员补齐了现有评估体系中的一处关键空白——评估多模态模型是否具备“物理推理能力”。 物理推理,即模型在面对真实或拟真的物理情境时,能否综合利用视觉信息、物理常识、数学建模进行判断和预测,被认为是通向具身智能的关键能力。
5/28/2025 11:55:28 AM

全靠Claude4!30年FAANG老工程师:AI帮我解决了四年老bug

AI 就像一头野驴,跑起来就不停。 人类花了几百万年才走上食物链顶端,而大模型只用了不到十年时间,已经能把你和刘亦菲 P 进一张自拍了。 奥!
5/28/2025 11:49:52 AM

强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B

近期的推理大模型(LRMs)通过强化学习(RL)展现出强大的推理能力,但这些改进主要体现在短上下文推理任务中。 相比之下,如何通过强化学习扩展 LRMs 以有效处理和推理长上下文输入,仍然是一个尚未解决的关键挑战。 来自阿里巴巴通义实验室的团队首先形式化定义长上下文推理强化学习范式,并识别出其中的两个核心挑战:次优的训练效率与不稳定的优化过程。
5/28/2025 11:46:52 AM

开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险

本文作者分别来自清华大学 CoAI 小组和墨尔本大学。 第一作者张哲昕为清华大学直博三年级学生,研究方向为大模型安全,主要合作者为孙玉豪,来自墨尔本大学,主要指导教师为清华大学王宏宁副教授与黄民烈教授。 基于开源模型继续在下游任务上使用私有下游数据进行微调,得到在下游任务表现更好的专有模型,已经成为了一类标准范式。
5/28/2025 11:46:18 AM

全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

大模型,真的懂物理推理吗? 就在刚刚,港大、密歇根大学、多伦多大学等机构的研究者用3000道物理题,给全球顶尖大模型来了一场大拷问。 结果,这些顶尖AI,毫无例外全部翻车了!
5/28/2025 11:44:24 AM

多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3%

多模态时代应如何评估模型的视觉输出能力? 来自清华大学、腾讯混元、斯坦福大学、卡耐基梅隆大学等顶尖机构的研究团队联合发布了RBench-V:一款针对大模型的视觉推理能力的新型基准测试。 过去的评估基准主要集中于评估多模态输入和纯文本推理过程。
5/28/2025 11:43:48 AM

GPA只有3.3,顶会一作两篇,成功杀进TOP 20 AI博士?小哥曝光关键秘诀

两篇顶会一作,在亚洲攻读硕士学位,2026年春季毕业。 这位网友表示,自己计划申请2026年秋季开学的博士项目。 他的条件是:本科GPA在3.2-3.3左右,不算很高,但有一些研究经验。
5/28/2025 11:43:06 AM

单卡即可微调大模型!内存占用仅1/8,性能依然拉满 | ICML 2025

诸如Qwen,GPT,DeepSeek R1等基础大模型已成为现代深度学习的基石。 然而,在应用于具体下游任务时,它们庞大的参数规模使得额外微调成本较高。 为了解决这一问题,近期的研究聚焦于低秩适应 (LoRA) 方法,通过保持基座模型参数冻结,仅对新增的小型轻量级适配器进行微调,从而降低微调成本。
5/28/2025 11:42:14 AM

AI为何读不懂钟表?模拟时钟暴露的认知短板与AI进化隐忧​

译者 | 朱先忠审校 | 重楼中国和西班牙研究人员发表的一篇新论文发现,即使是像GPT-4.1这样的先进多模态人工智能模型,也难以从模拟时钟图像中识别时间。 时钟中细微的视觉变化都可能导致严重的解读错误,而微调也只对熟悉的示例有效。 这一结果引发了人们对这些模型在现实世界任务中处理不熟悉图像时的可靠性的担忧。
5/28/2025 10:31:13 AM
朱先忠

o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守

八支「数学家天团」和o4-mini-medium同台竞技,谁会最终胜出? 最近,Epoch AI团队举办了一场竞赛,专门考察AI数学能力的进展。 这场比赛邀请了约40位数学精英,分成8组,每组由学科专家和优秀本科生组成。
5/28/2025 10:30:41 AM