AI在线 AI在线

数据

震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头

昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM

哥大学生全员AI作弊?小哥「创业逆袭」:不用AI等于输在起跑线!

Cluely创始人Roy Lee宣称,哥伦比亚大学几乎每位学生都使用AI工具作弊。 对此网友表示,「我上大学时,从未使用过AI。 那时候我们用的是脑子!
8/4/2025 9:08:00 AM

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

在人工智能模型规模持续扩大的今天,数据集蒸馏(Dataset Distillation,DD)方法能够通过使用更少的数据,达到接近完整数据的训练效果,提升模型训练效率,降低训练成本。 但是,通过数据集蒸馏训练的模型,要在安全性要求比较高的任务中(如医疗诊断、自动驾驶),实现不受干扰并保持性能效果,还有一定难度。 来自北京航空航天大学、上海人工智能实验室和英国利物浦大学的研究团队,提出了名为ROME的新方法,这是首次将信息瓶颈理论引入数据集蒸馏任务。
7/29/2025 9:10:00 AM

CEO卷走24亿,二号员工血亏99%!30亿Windsurf梦碎内幕曝光

Prem Qu Nair可能刚刚度过了一生中最跌宕起伏的时光。 他是原Windsurf的2号员工。 为了继续探索软件工程的未来,他从谷歌DeepMind离职,加入了AI初创Cognition。
7/28/2025 9:09:00 AM

Hinton上海演讲:大模型跟人类智能很像,警惕养虎为患

深度学习之父、诺奖得主Hinton在中国的首次公开演讲,实录来了! 演讲主题是《数字智能是否会取代生物智能》。 主要观点如下:人类有可能就是大语言模型,人类也会和大语言模型一样有幻觉。
7/27/2025 6:08:51 PM

训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

机器人能通过普通视频来学会实际物理操作了! 来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。 比如清理桌面垃圾,或者是从零食筐里找到人类想要的糖果。
7/25/2025 3:22:20 PM

亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

如何让机器人从看懂世界,到理解意图,再到做出动作,是具身智能领域当下最受关注的技术重点。 但真机数据的匮乏,正在使对应的视觉-语言-动作(VLA)模型面临发展瓶颈。 尽管业界已投入大量资源构建数据平台(如马斯克主导的“数据工厂”项目),现有真机数据规模仍较模型规模定律所需的上亿级训练样本相差三个数量级。
7/25/2025 9:31:49 AM

首个多模态工业信号基座模型FISHER,权重已开源,来自清华&上交等

近期,来自清华大学、上海交通大学、北京华控智加科技有限公司和华北电力大学的研究者联合发布首个多模态工业信号基座模型 FISHER,采用搭积木的方法对异质工业信号进行统一建模。 目前技术报告和权重均已开源,欢迎使用! 论文链接: 仓库:,越来越多的工业设备被安装上传感器以监控工作状态。
7/24/2025 11:38:40 AM

AI越训练,越会「满嘴跑火车」!普林伯克利重磅揭秘,RLHF竟是罪魁祸首?

你有没有觉得,AI有时候像在「满嘴跑火车」? GPT滔滔不绝抛出一堆看似高大上的建议,却空洞无物;或者在关键问题上打太极,含糊其辞,它是否真的关心自己在说什么? 最近,一项重磅研究《Machine Bullshit》火了。
7/24/2025 10:43:46 AM

碾压DeepSeek V3!阿里开源新版Qwen-3,屠榜级断层第一

今天凌晨1点,阿里巴巴开源了Qwen3系列新版本Qwen3-235B-A22B-2507。 比较意外的是,阿里已经停用了混合思考模型,新版Qwen3是一个非思维推理,又回到了指令微调模型,但性能非常强劲。 根据阿里公布的数据显示,新版Qwen3在知识、推理、代码、对齐、智能体、多语言测试6大类几十种测试基准中,全部大幅度超过了DeepSeek开源的新版V3-0324模型。
7/22/2025 10:43:25 AM

数百个虚拟人在线逃生!天大等发布:首个实时在线多智能体模拟方法

人群疏散模拟对于提高公共安全至关重要,也是构建逼真虚拟动态环境所需要的技术,其发展面临着复杂人类行为建模难的挑战。 现有的疏散模拟方法常以2D点表示人群,关注人群位置和轨迹,但忽略了复杂人类行为,如碰撞、交互、摔倒等,以及三维环境、个体行为能力的影响,导致模拟结果不真实。 而现有的三维运动生成方法和角色控制方法也无法同时保证实时性、合理性、个性化、动态感知、以及适用于任意场景和地形,如表1所示。
7/21/2025 11:51:58 AM

一篇被证明“理论有误”的论文,拿下了ICML2025时间检验奖

深度学习界的传奇论文,终于等来了它的“封神”时刻! 刚刚,ICML 2025会议上,2015年发表的Batch Normalization(批次归一化,简称BatchNorm)论文荣获时间检验奖。 这篇如今引用量超过6万次的开创性工作,是深度学习发展史上一个里程碑式的突破,极大地推动了深层神经网络的训练和应用。
7/16/2025 9:15:17 AM

12人团队打造AI陪伴神器,半年内斩获3000万美元投资

靠AI陪伴,一个诞生才半年的APP就获得了3000万美元(约2.15亿人民币)融资? 这个APP名叫Tolan,今年2月才正式上线,而且整个公司只有12人。 自推出以来,Tolan的下载量已超过300万次,每月收入超过100万美元,累计10万付费用户。
7/14/2025 2:44:19 PM

告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

DreamPRM 由加州大学圣地亚哥分校的研究团队开发,在数学推理权威测评榜MathVista上获得了第一名。 第一作者为博士生 Qi Cao,通讯作者为该校副教授 Pengtao Xie,团队其他成员还包括王睿一,Ruiyi Zhang 和 Sai Ashish Somayajula。 使用过程奖励模型(PRM)强化大语言模型的推理能力已在纯文本任务中取得显著成果,但将过程奖励模型扩展至多模态大语言模型(MLLMs)时,面临两大难题:由于多模态输入(图像 文本)构成高维连续与离散信号的混合空间,训练数据与测试数据的分布偏移(Distribution Shift)远超纯文本场景,导致一般过程奖励模型泛化能力显著下降。
7/11/2025 9:15:00 AM

首次!世界模型、动作模型融合,全自回归模型WorldVLA来了

岑俊,阿里巴巴达摩院具身智能大模型算法研究员,博士毕业于香港科技大学。 研究方向主要是:具身智能 VLA 模型,世界模型。 阿里巴巴达摩院提出了 WorldVLA, 首次将世界模型 (World Model) 和动作模型 (Action Model/VLA Model) 融合到了一个模型中。
7/4/2025 9:07:00 AM

图灵奖大佬向97年小孩哥汇报?小扎1亿年薪买新贵,老将痛诉熬夜捡GPU!

起猛了,看到LeCun给Alexandr Wang汇报了! 一个是图灵三巨头、多年学术泰斗,一个是靠着数据标注成功晋身亿万富翁的97年小孩哥,这个画面,实在是过于魔幻了。 为了Wang,小扎砸下了足足143亿美元,拿下整个Scale AI 49%股权。
7/4/2025 9:06:00 AM

华为多路径推理破解大模型数学瓶颈,准确率超97%|ICML 2025

大模型越来越大,通用能力越来越强,但一遇到数学、科学、逻辑这类复杂问题,还是常“翻车”。 为破解这一痛点,华为诺亚方舟实验室提出全新高阶推理框架 ——思维森林(Forest-of-Thought,FoT)。 该方法借鉴人类“多角度思考、反复验证”的认知方式,打破传统LLM的线性推理范式,通过构建多棵并行推理树,引入动态自我修正机制与多视角共识决策策略。
7/4/2025 8:53:00 AM

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。 当前主要的方法是基于人类反馈的强化学习(RLHF)。 该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。
7/3/2025 9:41:27 AM