AI在线 AI在线

资讯列表

“反向收购”再现:谷歌24亿拿下 Windsurf 部分技术与核心团队

据 The Verge 报道,OpenAI 以30亿美元收购病毒式 AI 编码初创公司 Windsurf 的交易已于上周五告吹。 令人震惊的是,谷歌 DeepMind 迅速出手,成功吸纳了 Windsurf 首席执行官 Varun Mohan、联合创始人 Douglas Chen 以及该公司的一些顶尖研究人员。 谷歌发言人克里斯·帕帕斯(Chris Pappas)在给 TechCrunch 的声明中证实了这一消息,表示:“我们很高兴欢迎 Windsurf 团队的一些顶尖 AI 编码人才加入 Google DeepMind,以推进我们在代理编码方面的工作。
7/14/2025 9:11:51 AM
AI在线

ChatGPT助力揭露500万美元遗产欺诈,AI成法律维权新武器!

在一起长达十年的遗产纠纷案中,ChatGPT 成为了受害者 Rejeana Leatherwood 的得力助手,成功帮助她揭露了潜在的500万美元遗产欺诈。 故事的开端可以追溯到2015年,Rejeana 的父亲在墨西哥去世,随后,一位名叫 Irma 的女子声称自己是他的合法妻子,试图独占父亲的遗产。 在父亲去世后,Rejeana 和她的姐妹在毫不知情的情况下,被 Irma 迅速占有了父亲的遗产。
7/14/2025 9:11:46 AM
AI在线

Meta 收购语音 AI 初创公司 Play AI

Meta 证实已收购 Play AI,一家专注于利用人工智能生成人类声音的初创公司。 此举将进一步强化 Meta 在 AI 领域的布局,尤其是在其日益增长的 AI 角色、Meta AI、可穿戴设备和音频内容创作等项目上的能力。 据彭博社报道,Meta 发言人证实了此次收购。
7/14/2025 9:11:46 AM
AI在线

重磅发布!月之暗面推出万亿参数开源大模型Kimi K2

中国人工智能企业月之暗面近日重磅推出其最新的开源大语言模型 ——Kimi K2。 这一模型采用了混合专家架构,总参数量达到了惊人的1万亿,其中激活参数为320亿,表现出色,成为业内关注的焦点。 Kimi K2不仅在参数规模上令人惊叹,其智能体能力也十分强大。
7/14/2025 9:11:45 AM
AI在线

AI编程「反直觉」调研引300万围观!开发者坚信提速20%,实测反慢19%

随着大模型的崛起,AI编程领域正在发生翻天覆地的变化。 各种编程大模型、编程工具涌现,通过自动补全代码、自动 debug 等实用的功能为开发者的日常工作提供极大便利,并在一定程度上提升了开发效率。 不过,问题来了,AI 编程工具带来的影响真是如此吗?
7/14/2025 9:10:00 AM

从OpenAI叛逃谷歌!这位27岁小哥,成了奥特曼最忌惮的「秘密武器」

27岁的Logan Kilpatrick,堪称谷歌与开发者之间的「超级联络员」。 2024年,Kilpatrick从OpenAI跳槽谷歌,摇身一变成为谷歌AI赛道上的「秘密武器」。 这位年轻的技术天才,不仅掌管谷歌AI Studio,还以超强的个人魅力和开发者洞察力,成了谷歌AI的流量密码。
7/14/2025 9:03:00 AM

Lora微调实操演示(下):五次训练详解(免费GPU)

五月底写过一篇 Lora 微调的概念铺垫文章,这篇来结合阿里云的一个开源项目和免费试用 GPU 来做个完整的训练过程演示。 Lora微调实操教程(上):人话版概念详解(附案例)注:本篇演示的脚本部分在参考 aliyun_acp_learning 开源项目基础上有部分删减和调整。 后文相关配置和训练过程中的实际耗时也会进行标注说明。
7/14/2025 9:00:13 AM
韦东东

7B模型对标GPT-4o,全球首个医疗代码生成大模型训练平台来了

医疗AI场景复杂,需要“又懂医疗又懂编程”的agent。 但像GPT这样现成的大模型难以直接部署,该如何突破技术壁垒? 答案是:打造一个统一的训练平台,专门训练能够生成医疗代码的大模型。
7/14/2025 9:00:00 AM

攻克「恶意投毒」攻击!华南理工联合霍普金斯和UCSD,连登TPAMI、TIFS顶刊

虽然无法彻底解决维度诅咒带来的问题,根据理论证明,曼哈顿距离在高维空间中的识别能力要远远好于常用的欧式距离,可以缓解维度诅咒效应。 方法框架即便曼哈顿距离有着更好的识别效力,但是研究人员也不认为在识别后门攻击的时候曼哈顿就能完全替代欧氏距离。 除此以外,先前的工作已经表明[3],有的后门攻击会在欧氏距离上表现区分度,有的则会在余弦相似度(Cos 距离)上表现差异。
7/14/2025 8:57:00 AM

EasyCache:无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

论文作者团队简介:本文第一作者周鑫,共同第一作者梁定康,均为华中科技大学博士生,导师为白翔教授。 合作者包括华中科技大学陈楷锦、冯天瑞、林鸿凯,旷视科技陈习武、丁宜康、谭飞杨和香港大学赵恒爽助理教授。 在HunyuanVideo上,EasyCache在复杂场景下保持与原视频的一致外观,同时显著加速1.
7/14/2025 8:51:00 AM

无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer

我们终于摆脱 tokenization 了吗? 答案是:可能性无限大。 最近,Mamba 作者之一 Albert Gu 又发新研究,他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net,其用模型内部的动态分块过程取代 tokenization,从而自动发现和操作有意义的数据单元。
7/14/2025 8:50:00 AM

第一作者必须是AI!首个面向AI作者的学术会议来了,斯坦福发起

在 AI 已深度介入科研流程的今天,从提出假设到生成图表、撰写论文,它正逐步参与乃至重塑整个科学研究的方式。 但讽刺的是,尽管我们在 CVPR、NeurIPS、ICLR、ICML 甚至 ACL 等顶会中看到 AI 无处不在,却几乎没有任何一个会议或期刊承认 AI 的「作者身份」——AI 被广泛使用,却从未被名正言顺地署名。 这一局面,终于被打破了。
7/14/2025 8:47:00 AM

模拟大脑功能分化!北大与港中文发布Fast-in-Slow VLA,让“快行动”和“慢推理”统一协作

作者简介:由来自北京大学、香港中文大学、北京智源研究院、智平方的老师同学联合研究,作者包括博士生陈浩、刘家铭、顾晨阳、刘卓洋,通讯作者为北京大学仉尚航。 北京大学 HMI 实验室长期致力于具身智能和多模态学习领域的研究,欢迎关注。 快执行与慢思考:在机器人操控领域,实现高频响应与复杂推理的统一,一直是一个重大技术挑战。
7/14/2025 8:47:00 AM

氛围编程后,Karpathy又双叒有新「脑洞」!PDF将死,未来99%是AI氛围阅读

Karpathy大神这次继Vibe Coding氛围编程后,又想造全新概念了! 大神说他早就抱怨了很多次,未来99%的「Attention」(注意力)即将被AI,而非人类关注。 但是现在99.9%的互联网内容还是「写给人看的」,不论是网页、视频还是科研PDF论文。
7/14/2025 8:44:00 AM

ICCV2025 | 多视图生成新范式-利用自回归模型探索多视图生成

本文第一作者包括北京大学博士生胡珈魁与清华大学硕士生杨羽霄;通讯作者为北京大学助理教授卢闫晔与(前)百度视觉技术部刘家伦。 本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。 其目的是确保在生成当前视图的过程中,模型能够从所有先前的视图中提取有效的引导信息,从而增强多视图的一致性。
7/14/2025 8:42:00 AM

清华ICCV25丨密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板

近年来,多模态大模型(MLLMs)发展迅猛,从看图说话到视频理解,似乎无所不能。 但你是否想过:它们真的“看懂”并“想通”了吗? 模型在面对复杂的、多步骤的视觉推理任务时,能否像人类一样推理和决策?
7/14/2025 8:40:00 AM

ICML 2025 Oral!北大和腾讯优图破解AI生成图像检测泛化难题:正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能,AI 生图能力被拉上了一个新的高度,但你有没有想过,这光鲜亮丽的背后也隐藏着严峻的安全挑战:如何区分生成图像和真实图像? 尽管目前有很多研究已在尝试解决这个挑战,然而这个挑战深层次的泛化难题一直没有得到合理的探究,生成图像和真实图像的区别真的是简单的 「真假二分类 」吗? 近日,北京大学与腾讯优图实验室等机构的研究人员针对这一泛化难题做了一些深层次的探究,研究表明 AI 生成图像检测任务远比 「真假二分类 」复杂!
7/14/2025 8:39:00 AM

用AI写代码效率反降19%!246项任务实测,16位资深程序员参与

用AI,有经验的开发者反倒被拖慢了? 在一项基于真实开源项目的实验中,研究者发现使用AI工具不仅没有提升开发效率,反而让任务时间增加19%。 这简直与人们预测的结果完全相反。
7/14/2025 8:35:00 AM