数据

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等

近期，来自清华大学、上海交通大学、北京华控智加科技有限公司和华北电力大学的研究者联合发布首个多模态工业信号基座模型 FISHER，采用搭积木的方法对异质工业信号进行统一建模。目前技术报告和权重均已开源，欢迎使用！论文链接：仓库：，越来越多的工业设备被安装上传感器以监控工作状态。

7/24/2025 11:38:40 AM

AI越训练，越会「满嘴跑火车」！普林伯克利重磅揭秘，RLHF竟是罪魁祸首？

你有没有觉得，AI有时候像在「满嘴跑火车」？ GPT滔滔不绝抛出一堆看似高大上的建议，却空洞无物；或者在关键问题上打太极，含糊其辞，它是否真的关心自己在说什么？最近，一项重磅研究《Machine Bullshit》火了。

7/24/2025 10:43:46 AM

碾压DeepSeek V3！阿里开源新版Qwen-3，屠榜级断层第一

今天凌晨1点，阿里巴巴开源了Qwen3系列新版本Qwen3-235B-A22B-2507。比较意外的是，阿里已经停用了混合思考模型，新版Qwen3是一个非思维推理，又回到了指令微调模型，但性能非常强劲。根据阿里公布的数据显示，新版Qwen3在知识、推理、代码、对齐、智能体、多语言测试6大类几十种测试基准中，全部大幅度超过了DeepSeek开源的新版V3-0324模型。

7/22/2025 10:43:25 AM

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

人群疏散模拟对于提高公共安全至关重要，也是构建逼真虚拟动态环境所需要的技术，其发展面临着复杂人类行为建模难的挑战。现有的疏散模拟方法常以2D点表示人群，关注人群位置和轨迹，但忽略了复杂人类行为，如碰撞、交互、摔倒等，以及三维环境、个体行为能力的影响，导致模拟结果不真实。而现有的三维运动生成方法和角色控制方法也无法同时保证实时性、合理性、个性化、动态感知、以及适用于任意场景和地形，如表1所示。

7/21/2025 11:51:58 AM

一篇被证明“理论有误”的论文，拿下了ICML2025时间检验奖

深度学习界的传奇论文，终于等来了它的“封神”时刻！刚刚，ICML 2025会议上，2015年发表的Batch Normalization（批次归一化，简称BatchNorm）论文荣获时间检验奖。这篇如今引用量超过6万次的开创性工作，是深度学习发展史上一个里程碑式的突破，极大地推动了深层神经网络的训练和应用。

7/16/2025 9:15:17 AM

12人团队打造AI陪伴神器，半年内斩获3000万美元投资

靠AI陪伴，一个诞生才半年的APP就获得了3000万美元（约2.15亿人民币）融资？这个APP名叫Tolan，今年2月才正式上线，而且整个公司只有12人。自推出以来，Tolan的下载量已超过300万次，每月收入超过100万美元，累计10万付费用户。

7/14/2025 2:44:19 PM

告别数据「噪音」，UCSD大模型推理新方法DreamPRM充当「信号放大器」，登顶MathVista测评榜

DreamPRM 由加州大学圣地亚哥分校的研究团队开发，在数学推理权威测评榜MathVista上获得了第一名。第一作者为博士生 Qi Cao，通讯作者为该校副教授 Pengtao Xie，团队其他成员还包括王睿一，Ruiyi Zhang 和 Sai Ashish Somayajula。使用过程奖励模型（PRM）强化大语言模型的推理能力已在纯文本任务中取得显著成果，但将过程奖励模型扩展至多模态大语言模型（MLLMs）时，面临两大难题：由于多模态输入（图像文本）构成高维连续与离散信号的混合空间，训练数据与测试数据的分布偏移（Distribution Shift）远超纯文本场景，导致一般过程奖励模型泛化能力显著下降。

7/11/2025 9:15:00 AM

首次！世界模型、动作模型融合，全自回归模型WorldVLA来了

岑俊，阿里巴巴达摩院具身智能大模型算法研究员，博士毕业于香港科技大学。研究方向主要是：具身智能 VLA 模型，世界模型。阿里巴巴达摩院提出了 WorldVLA, 首次将世界模型 (World Model) 和动作模型 (Action Model/VLA Model) 融合到了一个模型中。

7/4/2025 9:07:00 AM

图灵奖大佬向97年小孩哥汇报？小扎1亿年薪买新贵，老将痛诉熬夜捡GPU！

起猛了，看到LeCun给Alexandr Wang汇报了！一个是图灵三巨头、多年学术泰斗，一个是靠着数据标注成功晋身亿万富翁的97年小孩哥，这个画面，实在是过于魔幻了。为了Wang，小扎砸下了足足143亿美元，拿下整个Scale AI 49%股权。

7/4/2025 9:06:00 AM

华为多路径推理破解大模型数学瓶颈，准确率超97%｜ICML 2025

大模型越来越大，通用能力越来越强，但一遇到数学、科学、逻辑这类复杂问题，还是常“翻车”。为破解这一痛点，华为诺亚方舟实验室提出全新高阶推理框架 ——思维森林（Forest-of-Thought，FoT）。该方法借鉴人类“多角度思考、反复验证”的认知方式，打破传统LLM的线性推理范式，通过构建多棵并行推理树，引入动态自我修正机制与多视角共识决策策略。

7/4/2025 8:53:00 AM

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

7/3/2025 9:41:27 AM

IEEE TPAMI 2025 | 北京大学提出LSTKC++，长短期知识解耦与巩固驱动的终身行人重识别

本文的第一作者为北京大学博士二年级学生徐昆仑，通讯作者为北京大学王选计算机研究所研究员、助理教授周嘉欢。近日，北京大学王选计算机研究所周嘉欢团队在人工智能重要国际期刊 IEEE TPAMI 发布了一项最新的研究成果：LSTKC 。该框架引入了长短期知识解耦与动态纠正及融合机制，有效保障了模型在终身学习过程中对新知识的学习和对历史知识的记忆。

7/3/2025 9:16:41 AM

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

围棋、德州扑克曾是AI崛起的试炼场，从AlphaGo到Libratus，人工智能不断刷新策略上限。但接下来的战场更难——Diplomacy：一款融合协作与竞争的七人博弈游戏，单轮动作空间高达10的64次方，其策略建模复杂度前所未有！为此，Meta曾推出智能体Cicero[Meta, Science 2022]，结合人类数据与策略搜索，在该领域实现突破，但其方法高度依赖超大规模均衡搜索与重资源训练，难以扩展与迁移。

7/2/2025 8:43:00 AM

首创Mid-training范式破解RL奥秘，Llama终于追平Qwen！

近期，一份来自上海创智学院、上海交通大学的前沿研究论文吸引了人工智能领域的广泛关注。该论文深入探讨了不同基础语言模型家族（如 Llama 和 Qwen）在强化学习（RL）训练中迥异表现的背后原因，并提出创新性的中期训练（mid-training）策略，成功地将 Llama 模型改造成高度适配强化学习的推理基础模型，显著缩小了其与天生擅长 RL 扩展的 Qwen 模型之间的性能差距，为下一代 reasoning 能力 AI 系统的开发提供了关键的科学基础和技术路径。论文发布后在社交媒体引发广泛关注，Meta AI 研究科学家、即将赴 UMass Amherst 任助理教授的 Wenting Zhao 率先盛赞：“Truly impressed by how an academic lab just figured out a lot of mysteries in mid-training to close the RL gap between Llama and Qwen。

7/1/2025 9:10:00 AM

资讯热榜

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型！刚刚，ChatGPT终于可以走遍整个互联网了！OpenAI深夜炸街：原生ChatGPT集成、即时理解、主动执行，浏览器赛道鲨疯了告别抽卡！Vidu Q2多图参考生视频功能重磅上线最强OCR竟然不是DeepSeek、Paddle！HuggingFace新作：六大顶尖开源OCR模型横评！继DS后又杀出匹黑马！ OpenAI首款ChatGPT浏览器发布！现在就能免费下载使用通义千问再放大招！Qwen3-VL 家族新增 2B 与 32B 模型，开源矩阵全面升级保姆级教程！教你用Coze工作流2分钟生成优质文章 OpenAI、Oracle 再加码 AI 基建:150亿美元 Lighthouse 园区启动建设

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法芯片 AI for Science 腾讯 Stable Diffusion Agent 苹果 Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 人形机器人研究 AI视频生成 RAG 大语言模型百度具身智能 Sora 工具 GPU 华为计算字节跳动 AI设计搜索大型语言模型 AGI 视频生成场景深度学习 DeepMind 架构视觉编程生成式AI 预测 Transformer AI模型伟达特斯拉 Copilot

数据

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等

AI越训练，越会「满嘴跑火车」！普林伯克利重磅揭秘，RLHF竟是罪魁祸首？

碾压DeepSeek V3！阿里开源新版Qwen-3，屠榜级断层第一

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

一篇被证明“理论有误”的论文，拿下了ICML2025时间检验奖

12人团队打造AI陪伴神器，半年内斩获3000万美元投资

告别数据「噪音」，UCSD大模型推理新方法DreamPRM充当「信号放大器」，登顶MathVista测评榜

首次！世界模型、动作模型融合，全自回归模型WorldVLA来了

图灵奖大佬向97年小孩哥汇报？小扎1亿年薪买新贵，老将痛诉熬夜捡GPU！

华为多路径推理破解大模型数学瓶颈，准确率超97%｜ICML 2025

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

IEEE TPAMI 2025 | 北京大学提出LSTKC++，长短期知识解耦与巩固驱动的终身行人重识别

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

首创Mid-training范式破解RL奥秘，Llama终于追平Qwen！

刚刚，马斯克切脑全场震撼！插脑只要1.5秒，26年治愈失明，28年全人类变AI

航空发动机用上大模型：解决复杂时序问题，性能超越ChatGPT-4o实现SOTA｜上交创智复旦

华为CloudMatrix重磅论文披露AI数据中心新范式，推理效率超NV H100

具身世界模型新突破，地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习

数据

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&amp;上交等

AI越训练，越会「满嘴跑火车」！普林伯克利重磅揭秘，RLHF竟是罪魁祸首？

碾压DeepSeek V3！阿里开源新版Qwen-3，屠榜级断层第一

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

一篇被证明“理论有误”的论文，拿下了ICML2025时间检验奖

12人团队打造AI陪伴神器，半年内斩获3000万美元投资

告别数据「噪音」，UCSD大模型推理新方法DreamPRM充当「信号放大器」，登顶MathVista测评榜

首次！世界模型、动作模型融合，全自回归模型WorldVLA来了

图灵奖大佬向97年小孩哥汇报？小扎1亿年薪买新贵，老将痛诉熬夜捡GPU！

华为多路径推理破解大模型数学瓶颈，准确率超97%｜ICML 2025

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

IEEE TPAMI 2025 | 北京大学提出LSTKC++，长短期知识解耦与巩固驱动的终身行人重识别

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

首创Mid-training范式破解RL奥秘，Llama终于追平Qwen！

刚刚，马斯克切脑全场震撼！插脑只要1.5秒，26年治愈失明，28年全人类变AI

航空发动机用上大模型：解决复杂时序问题，性能超越ChatGPT-4o实现SOTA｜上交创智复旦

华为CloudMatrix重磅论文披露AI数据中心新范式，推理效率超NV H100

具身世界模型新突破，地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等