AI在线 AI在线

资讯列表

超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制

多模态对齐模型近年来凭借对比学习范式在图像检索、文生图等任务中表现出色。 然而,主流框架(如 CLIP)需要从零训练文本和图像编码器,导致计算成本高昂,尤其在处理长文本或大规模数据时更加明显。 近期,相关工作尝试将预训练的大语言模型(LLM)作为文本编码器融入多模态对齐框架,并在分类和检索任务上观察到性能提升。
7/3/2025 9:49:43 AM

ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦

刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了! 在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。 这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!
7/3/2025 9:46:37 AM

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。 当前主要的方法是基于人类反馈的强化学习(RLHF)。 该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。
7/3/2025 9:41:27 AM

AI Agent、传统聊天机器人有何区别?如何评测?这篇30页综述讲明白了

论文作者包括来自上海交通大学的朱家琛、芮仁婷、单榕、郑琮珉、西云佳、林江浩、刘卫文、俞勇、张伟楠,以及华为诺亚研究所的朱梦辉、陈渤、唐睿明。 本文第一作者是朱家琛,上海交通大学博士生,主要研究兴趣集中在大模型推理,个性化 Agent。 本文通讯作者是张伟楠,上海交通大学教授,研究方向包含强化学习、数据科学、机器人控制、推荐搜索等。
7/3/2025 9:38:48 AM

ElementPlusX + RuoyiAI:Vue3 首个 AI 开发模板开源了!

在 AI 技术飞速发展的今天,开发一款自己的 AI 应用成为了许多开发者的追求。 然而,从零开始搭建一个完整的 AI 开发环境,往往需要耗费大量的时间和精力。 为了帮助开发者快速进入 AI 开发领域,一个基于 Vue3.5 的全新 AI 开发模板——ruoyi-element-ai 正式开源了!
7/3/2025 9:36:35 AM
小4子

刚刚,神秘模型火了!网友:是OpenAI要开源?

刚刚,OpenRouter 上出现了一个神秘模型,该模型被命名为「Cypher Alpha」。 其可以免费使用,100 万 token 上下文,还具有推理能力。 注:OpenRouter 是一个大模型 API 路由器,旨在将各种 AI 模型和服务集成到一个统一的接口中。
7/3/2025 9:31:52 AM

联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型

这一名为MR BreezeASR 25的模型以 Apache 2.0 许可开源公布,不会出现将“发生什么事”听成“花生什么事”等类似识别错误。
7/3/2025 9:30:16 AM
溯波(实习)

让GUI智能体不再「过度执行」,上海交大、Meta联合发布OS-Kairos系统

本文第一作者是上海交通大学计算机学院三年级博士生程彭洲,研究方向为多模态大模型推理、AI Agent、Agent 安全等。 通讯作者为张倬胜助理教授和刘功申教授。 一、论文概述1.1 研究背景随着多模态大语言模型(Multimodal Large Language Models, MLLMs)的快速发展,越来越多的研究聚焦于构建能够在图形用户界面(GUI)中执行复杂任务的智能体。
7/3/2025 9:27:57 AM

前不久,苹果差点犯下最愚蠢的错误

8年资深研究员离职,整个核心团队威胁集体跳槽,数百万美元的挖角邮包 —— 这不是什么好莱坞大片的剧情,而是最近一周苹果AI部门正在经历的真实危机。 6月30日,Bloomberg爆出一个让整个科技圈都震惊的消息:苹果最核心的AI团队MLX,差点就这么没了。 具体发生了什么?
7/3/2025 9:19:28 AM
阿丸笔记

IEEE TPAMI 2025 | 北京大学提出LSTKC++,长短期知识解耦与巩固驱动的终身行人重识别

本文的第一作者为北京大学博士二年级学生徐昆仑,通讯作者为北京大学王选计算机研究所研究员、助理教授周嘉欢。 近日,北京大学王选计算机研究所周嘉欢团队在人工智能重要国际期刊 IEEE TPAMI 发布了一项最新的研究成果:LSTKC  。 该框架引入了长短期知识解耦与动态纠正及融合机制,有效保障了模型在终身学习过程中对新知识的学习和对历史知识的记忆。
7/3/2025 9:16:41 AM

字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相

设定角色,让AI照“本”生成主角不变的不同图像,对于各路AIGC工具来说一直是不小的挑战。 而现在,字节再进一步,最新发布多主体控制生成模型Xverse——既可以对设定好的每个主体进行精确控制,也不会破坏图像的生成质量。 多主体?
7/3/2025 9:09:51 AM

MoE那么大,几段代码就能稳稳推理 | 开源

混合专家网络模型架构(MoE)已经成为当前大模型的一个主流架构选择,以最近开源的盘古Pro MoE为例,其基于MoGE架构构建的混合专家架构,总参数量达720亿,激活参数量为160亿,专门针对昇腾硬件优化,在性能与效率上表现突出。 盘古还实现了在推理时做到又快又稳。 在技术特性上,盘古模型引入 “快思考” 和 “慢思考” 双系统,可根据问题复杂度自动切换响应模式,并在推理性能上实现突破——在昇腾800I A2上单卡推理吞吐性能达1148 tokens/s,经投机加速技术可提升至1528 tokens/s,显著优于同等规模稠密模型。
7/3/2025 9:05:40 AM

ChatGPT诞生内幕大曝光!发布前一晚还在纠结

ChatGPT诞生内幕最新大曝光:纳尼? ? 原来“ChatGPT”这个名字,直到发布前一晚才确定下来。
7/3/2025 9:01:49 AM

OpenAI 斥 Robinhood“代币”销售:警惕虚假股权,我们不曾授权!

据 AIbase 报道,OpenAI 近日通过其官方 X 新闻编辑室账户发表声明,严正澄清 Robinhood 出售的所谓“OpenAI 代币”并非该公司股权或股票,并明确表示其未与 Robinhood 合作,也未参与或认可此次代币销售。 此举是对 Robinhood 此前宣布将向欧盟民众出售包括 OpenAI 在内的私营公司“代币化股票”的回应。 OpenAI 周三在其新闻编辑室账户上强调:“这些‘OpenAI 代币’并非 OpenAI 股权。
7/3/2025 9:00:46 AM
AI在线

​OpenAI 暂停大规模使用谷歌 TPU 芯片,英伟达与 AMD 仍为核心供应商

OpenAI 最近宣布,尽管在初期阶段进行了测试,但不会大规模采用谷歌的 TPU 芯片。 TPU(张量处理单元)是谷歌专为机器学习任务设计的定制化 ASIC 芯片,旨在加速神经网络的训练与推理。 TPU 采用数据流驱动架构,能够实现高效的矩阵乘法流水线计算,从而减少内存访问延迟。
7/3/2025 9:00:46 AM
AI在线

​OpenAI 声明:Robinhood 推出的 “OpenAI 代币” 与我们无关

最近,加密交易平台 Robinhood 在欧洲推出了 OpenAI 和 SpaceX 的代币化股票,这一消息引发了广泛关注。 然而,OpenAI 迅速对此进行澄清,表示这些 “OpenAI 代币” 并不代表 OpenAI 的股权,并且与 Robinhood 没有任何合作关系。 OpenAI 通过社交媒体平台 X 发布了一则声明,明确指出:“这些‘OpenAI 代币’不是 OpenAI 的股权。
7/3/2025 9:00:46 AM
AI在线

Grok 4意外提前曝光,xAI巨额融资700亿,马斯克宣布“重写人类知识库”

马斯克旗下xAI的重磅炸弹Grok 4提前泄露了! 有开发者在xAI控制台的源代码中意外发现了两个全新模型Grok 4和Grok 4 Code。 图片与此同时,xAI刚刚完成了一轮100亿美元(约716亿人民币)的巨额融资。
7/3/2025 8:50:20 AM

社交平台 X 剖析社区注释:提高事实核查效率同时,存扩散错误信息风险

社交媒体 X 计划利用 AI 撰写社区注释(community notes),其目的是提高事实核查效率,但官方也承认存在明显风险。
7/3/2025 8:40:50 AM
故渊