资讯列表
Cursor 大胆挖人!Claude Code 核心人物转投竞争对手
在 AI 行业的竞争愈发激烈之际,最近发生了一起令人瞩目的 “挖人” 事件。 知名编程应用 Cursor 的开发商 Anysphere,成功挖走了 Anthropic 的两位核心人物:Claude Code 项目的开发负责人 Boris Cherny 和产品经理 Cat Wu。 这一动作不仅让业内人士大感意外,也让 Anthropic 与 Cursor 之间的合作关系变得复杂。
科学家们有话说!SciArena 平台上线,多维度评测大语言模型科学表现
一个名为 SciArena 的全新开放平台现已上线,旨在通过人类偏好评估大型语言模型(LLM)在科学文献任务中的表现。 早期结果已揭示不同模型之间存在显著的性能差距。 SciArena 由耶鲁大学、纽约大学和艾伦人工智能研究所的研究人员共同开发,旨在系统性评估专有和开源 LLM 处理科学文献任务的效果,填补了该领域系统性评估的空白。
Stability AI开源Stable Audio Open Small,手机秒变音频创作神器
Stability AI联合芯片巨头Arm正式开源Stable Audio Open Small,一款专为移动设备优化的341M参数文本到音频生成模型。 这款轻量化模型能在Arm CPU上本地运行,生成高质量立体声音频,标志着AI音频生成技术向边缘计算和移动设备的重大迈进。 技术亮点:轻量高效,移动端本地生成Stable Audio Open Small基于Stability AI此前发布的Stable Audio Open模型,通过深度优化,参数量从1.1B压缩至341M,显著降低了计算需求。
动画字幕翻车!Crunchyroll 新剧竟然用 AI 生成,内容让人哭笑不得
最近,Crunchyroll 推出的新动画《涅库罗若美子的宇宙恐怖秀》引发了不小的争议。 网友在 Reddit 上曝光,该动画的字幕中出现了大量错误,似乎是由人工智能(AI)生成的,导致观众对剧情产生了困惑。 更令人哭笑不得的是,字幕中竟然出现了 “ChatGPT 说” 等字样,显然是未经过严谨审核的结果。
OpenAI与甲骨文强强联手,打造星际之门数据中心计划
在人工智能领域,OpenAI 与甲骨文公司近日宣布了一项重磅合作,双方将加码 “星际之门” 计划,致力于在美国建立更多数据中心。 这一合作旨在满足日益增长的计算能力需求,助力 AI 技术的快速发展。 据知情人士透露,OpenAI 将从甲骨文的数据中心租用大量计算能力,预计将使用约4.5吉瓦的电力。
DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B
在人工智能领域,又一重磅消息传来。 今天凌晨,知名大模型训练平台 Together.ai 与 Agentica 联合推出了开源 AI Agent框架 DeepSWE。 这一创新系统是基于阿里最新开源的 Qwen3-32B 模型,完全通过强化学习进行训练。
MIT 研究发现:使用 AI 写作工具或降低大脑活跃度
近日,麻省理工学院媒体实验室发布了一项新的研究,揭示了使用人工智能工具(如 ChatGPT)进行写作任务可能导致大脑活跃度降低。 该研究标题为《你在使用 ChatGPT 时的大脑:使用 AI 助手进行论文写作任务时的认知债务累积》。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,研究人员分为三组进行实验:一组仅使用自己的大脑,另一组使用搜索引擎,最后一组使用大型语言模型(LLM),例如 ChatGPT。
超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制
多模态对齐模型近年来凭借对比学习范式在图像检索、文生图等任务中表现出色。 然而,主流框架(如 CLIP)需要从零训练文本和图像编码器,导致计算成本高昂,尤其在处理长文本或大规模数据时更加明显。 近期,相关工作尝试将预训练的大语言模型(LLM)作为文本编码器融入多模态对齐框架,并在分类和检索任务上观察到性能提升。
ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦
刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了! 在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。 这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!
周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性
将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。 当前主要的方法是基于人类反馈的强化学习(RLHF)。 该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。
AI Agent、传统聊天机器人有何区别?如何评测?这篇30页综述讲明白了
论文作者包括来自上海交通大学的朱家琛、芮仁婷、单榕、郑琮珉、西云佳、林江浩、刘卫文、俞勇、张伟楠,以及华为诺亚研究所的朱梦辉、陈渤、唐睿明。 本文第一作者是朱家琛,上海交通大学博士生,主要研究兴趣集中在大模型推理,个性化 Agent。 本文通讯作者是张伟楠,上海交通大学教授,研究方向包含强化学习、数据科学、机器人控制、推荐搜索等。
ElementPlusX + RuoyiAI:Vue3 首个 AI 开发模板开源了!
在 AI 技术飞速发展的今天,开发一款自己的 AI 应用成为了许多开发者的追求。 然而,从零开始搭建一个完整的 AI 开发环境,往往需要耗费大量的时间和精力。 为了帮助开发者快速进入 AI 开发领域,一个基于 Vue3.5 的全新 AI 开发模板——ruoyi-element-ai 正式开源了!
刚刚,神秘模型火了!网友:是OpenAI要开源?
刚刚,OpenRouter 上出现了一个神秘模型,该模型被命名为「Cypher Alpha」。 其可以免费使用,100 万 token 上下文,还具有推理能力。 注:OpenRouter 是一个大模型 API 路由器,旨在将各种 AI 模型和服务集成到一个统一的接口中。
联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型
这一名为MR BreezeASR 25的模型以 Apache 2.0 许可开源公布,不会出现将“发生什么事”听成“花生什么事”等类似识别错误。
让GUI智能体不再「过度执行」,上海交大、Meta联合发布OS-Kairos系统
本文第一作者是上海交通大学计算机学院三年级博士生程彭洲,研究方向为多模态大模型推理、AI Agent、Agent 安全等。 通讯作者为张倬胜助理教授和刘功申教授。 一、论文概述1.1 研究背景随着多模态大语言模型(Multimodal Large Language Models, MLLMs)的快速发展,越来越多的研究聚焦于构建能够在图形用户界面(GUI)中执行复杂任务的智能体。
前不久,苹果差点犯下最愚蠢的错误
8年资深研究员离职,整个核心团队威胁集体跳槽,数百万美元的挖角邮包 —— 这不是什么好莱坞大片的剧情,而是最近一周苹果AI部门正在经历的真实危机。 6月30日,Bloomberg爆出一个让整个科技圈都震惊的消息:苹果最核心的AI团队MLX,差点就这么没了。 具体发生了什么?
IEEE TPAMI 2025 | 北京大学提出LSTKC++,长短期知识解耦与巩固驱动的终身行人重识别
本文的第一作者为北京大学博士二年级学生徐昆仑,通讯作者为北京大学王选计算机研究所研究员、助理教授周嘉欢。 近日,北京大学王选计算机研究所周嘉欢团队在人工智能重要国际期刊 IEEE TPAMI 发布了一项最新的研究成果:LSTKC 。 该框架引入了长短期知识解耦与动态纠正及融合机制,有效保障了模型在终身学习过程中对新知识的学习和对历史知识的记忆。
字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相
设定角色,让AI照“本”生成主角不变的不同图像,对于各路AIGC工具来说一直是不小的挑战。 而现在,字节再进一步,最新发布多主体控制生成模型Xverse——既可以对设定好的每个主体进行精确控制,也不会破坏图像的生成质量。 多主体?