AI在线 AI在线

AI

Windsurf打工人被谷歌做局24小时后获收购!华人AI编程明星出手,接收250名员工

AI编程赛道,局势突变。 距离谷歌以24亿美元挖走Windsurf创始团队仅仅72小时,AI编程智能体Devin开发商宣布,已经火速收购Windsurf剩余的全部资产和团队。 临时接任CEO的Windsurf前商务主管Jeff Wang感慨“过去72小时就像我职业生涯中最惊险刺激的过山车之旅。
7/15/2025 9:06:00 AM

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解

本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯混元 X 组。 本文的共同第一作者为清华大学自动化系本科生王嘉辉和博士生刘祖炎,本文的通讯作者为清华大学自动化系鲁继文教授。 多模态大模型通常是在大型预训练语言模型(LLM)的基础上扩展而来。
7/15/2025 9:00:00 AM

MIT满分学霸掏空AI初创,谷歌24亿收购黑幕曝光!数百员工血本无归

OpenAI收购Windsurf在即,突然半路杀出个谷歌!  但这波可不是收购,而是釜底抽薪:谷歌直接挖走了整个Windsurf领导层 前30位核心AI工程师! 为了这次挖角,谷歌豪掷24亿美元!
7/15/2025 8:52:00 AM

具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式

具身智能大脑 全球首个具身智能SaaS开源框架,智源研究院在具身智能领域发力了——“通用具身大脑”RoboBrain 2.0,面向真实物理环境,集感知、推理与规划于一体。 全新32B版本凭借时空认知能力的突破,在多项权威具身智能基准上全面刷新纪录。 RoboOS 2.0,作为全球首个具身智能SaaS开源框架,创新性集成MCP协议与无服务器架构,实现轻量化部署,打通智能大脑与异构本体协同通路。
7/15/2025 8:45:00 AM

OpenAgentSafety 框架:AI 智能体安全评估的创新实践

大家好,我是肆〇柒,在 AI 智能体快速发展的当下,它们潜在的安全风险也日益凸显。 现有的 AI 智能体安全评估方法存在诸多局限:多数评估依赖于简化现实复杂性的模拟环境,难以准确反映智能体在真实场景下的表现;许多评估仅关注单一领域,如仅测试智能体的网页浏览或代码编写能力,缺乏对多领域综合任务的考察;此外,多轮多用户交互在评估中的缺失,使得难以洞察智能体在复杂人际互动和长期任务执行中的表现与潜在风险。 由卡耐基梅隆大学和艾伦人工智能研究所联合提出的 OpenAgentSafety(OA-SAFETY)框架,通过支持智能体与真实工具(如文件系统、终端、浏览器、消息平台等)的交互,并模拟多样化用户意图(包括良性、恶意和模糊意图)以及多轮交互场景,全面覆盖八大关键安全风险类别,系统地揭示了智能体在实际应用中可能存在的安全隐患。
7/15/2025 4:00:00 AM
肆零柒

员工AI助手应用指南:在应对挑战中实现效益最大化

“处于这一曲线顶端的公司——我们称之为未来构建型公司,那些最为成熟的公司——正在看到实质性的成果:收入增长达到1.5倍,股东价值提升1.8倍,”Kropp说道,“这里存在价值,但我们还处于早期阶段。 ”部署、重塑、创新为了利用AI和智能体创造价值,公司需要确定重点领域,采用部署、重塑、创新的框架。 AI已经在每个企业中部署,未来几年内将集成智能体,但如果你只是给员工一个聊天机器人,你并没有改变工作的方式。
7/15/2025 1:00:00 AM
D1net编译

最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?

最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。 在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型——能解决特定问题,但难以迁移和扩展。 为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。
7/14/2025 4:36:00 PM
郑佳美

首次综述「边-云协同计算」,分布式智能与模型优化的最新进展

随着物联网(IoT)设备的激增和实时应用需求的增长,传统云计算面临延迟高、带宽受限等问题,促使边缘计算的兴起。 边缘-云协同计算(Edge-Cloud Collaborative Computing, ECCC)通过整合边缘节点和云端资源,构建了一个分布式计算范式,旨在实现高效、低延迟的智能处理。 人工智能(AI),特别是深度学习和大语言模型(LLMs)的快速发展,进一步推动了ECCC在分布式智能和模型优化领域的应用。
7/14/2025 4:19:54 PM

AI有味觉了:分辨可乐和咖啡,只需“尝一尝”丨Nature

AI现在有味觉了! 近日,科学家研发出一种人工味觉系统,不仅感知酸、甜、苦、咸准确率高达90%,甚至能分辨可乐和咖啡。 相关研究已发表于《美国国家科学院院刊》(PNAS),并作为新闻报道登上了《Nature》官网。
7/14/2025 2:44:50 PM

12人团队打造AI陪伴神器,半年内斩获3000万美元投资

靠AI陪伴,一个诞生才半年的APP就获得了3000万美元(约2.15亿人民币)融资? 这个APP名叫Tolan,今年2月才正式上线,而且整个公司只有12人。 自推出以来,Tolan的下载量已超过300万次,每月收入超过100万美元,累计10万付费用户。
7/14/2025 2:44:19 PM

看似加速,实则拖慢:AI 写代码让开发者效率倒退19%

美国METR研究所完成了一项针对AI编程工具影响的实验研究。 他们发现,经验丰富的开源开发者在使用AI编程工具时,完成任务的时间平均增长了19%。 图片这与开发者自己的感知完全相反。
7/14/2025 2:39:17 PM

英伟达&MIT等推出Long-RL,长视频训练速度翻倍

请想象……一个 AI—— 它要完整看完一场几十分钟的世界杯决赛,不只是数球门数,更要跨越上百个镜头的线索、情绪、战术细节,甚至要像人一样推断:谁会赢点球大战? 足球比赛预测分析预测《星际争霸 2》这样的即时战略游戏同样需要考虑许多不同的变量,难度也非常巨大。 星际争霸 2 比赛预测分析再换个场景:同样是 AI,在一场紧张的德州扑克超级豪客赛上,面对职业牌手的每一次下注、加注、弃牌,能否像一个顶尖牌手一样,推理出对手藏在手里的那两张底牌?
7/14/2025 2:38:45 PM

马斯克的Grok 4推月费2000元的AI奢侈品,是技术碾压还是抢钱游戏?

当马斯克宣布 Grok 4 的订阅价时,整个 AI 圈都倒吸一口凉气。 每月 300 美元(约合 2000 元人民币)的 SuperGrok Heavy 计划,把 AI 服务的定价天花板捅破了。 这个价格是什么概念?
7/14/2025 2:36:29 PM

AI研究员年薪3亿美元?Meta开出天价挖角背后的人才大战

2-3亿美元,四年合同,平均年薪7500万美元。 这不是NBA超级巨星的薪酬,也不是好莱坞顶级明星的片酬。 这是Meta向AI研究员开出的薪资包。
7/14/2025 2:34:09 PM
阿丸笔记

抱抱脸进军具身智能机器人: 5小时成交破百万,299美元起售

henry 发自 凹非寺. 量子位 | 公众号 QbitAIAI圈的“GitHub”居然开始卖机器人了! HuggingFace最新发布开源桌面机器人ReachyMini,5小时内卖出超13万欧元(约为人民币109万元)!
7/14/2025 2:19:42 PM
henry

密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25

清华大学团队 投稿. 量子位 | 公众号 QbitAI近年来,多模态大模型(MLLMs)发展迅猛,从看图说话到视频理解,似乎无所不能。 但你是否想过:它们真的“看懂”并“想通”了吗?
7/14/2025 2:05:43 PM
henry

用动作分块突破RL极限,伯克利引入模仿学习,超越离线/在线SOTA

如今,强化学习(Reinforcement Learning,RL)在多个领域已取得显著成果。 在实际应用中,具有长时间跨度和稀疏奖励特征的任务非常常见,而强化学习方法在这类任务中的表现仍难令人满意。 传统强化学习方法在此类任务中的探索能力常常不足,因为只有在执行一系列较长的动作序列后才能获得奖励,这导致合理时间内找到有效策略变得极其困难。
7/14/2025 1:47:29 PM

天塌了!Cursor和Windsurf用户零日漏洞曝光,一键劫持,数百万开发者开源插件噩梦,网友:零信任太重要了

编译 | 沈建苗审校 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)近日,一位来自 Koi Security 的安全研究员,偶然发现了一个深藏于当今 AI 编程工具基础架构中的严重零日漏洞。 如果该漏洞被利用,一个技术水平不高的攻击者就可能“一键”劫持超过一千万台设备。 Cursor 和 Windsurf 等 AI 编程助手日益流行,向全球开发者承诺“生产力加速”。
7/14/2025 12:24:07 PM
沈建苗