模型

北大物院200人合作，金牌得主超50人！PHYBench：大模型究竟能不能真的懂物理？

本项目由北京大学物理学院朱华星老师、曹庆宏副院长统筹指导。基准设计、项目管理以及数据整合的主要工作由学生核心团队完成，核心成员包括仇是、郭绍阳、宋卓洋、孙韫博、蔡则宇、卫家燊、罗天宇等。项目还得到了北京计算科学研究中心罗民兴院士和人工智能研究院张牧涵老师的鼎力支持。

4/29/2025 9:08:00 AM 机器之心

猛击OpenAI o1、DeepSeek-R1！刚刚，阿里Qwen3登顶全球开源模型王座，深夜爆火

今天凌晨，从昨晚开始预热、备受全球 AI 圈关注的 Qwen3 系列模型终于正式亮相了！ Qwen3 模型依旧采用宽松的 Apache2.0 协议开源，全球开发者、研究机构和企业均可免费在 HuggingFace、魔搭社区等平台下载模型并商用，也可以通过阿里云百炼调用 Qwen3 的 API 服务。 HuggingFace 地址：地址：地址：：：，Qwen3 系列模型包含两款 MoE 模型以及六款密集模型，其中每一款又包含更多细分版本（比如基础版和量化版）：MoE 模型：Qwen3-235B-A22B 和 Qwen3-30B-A3B；其中 235B 和 30B 分别是总参数量，22B 和 3B 分别是激活参数量。

4/29/2025 9:06:00 AM 机器之心

ICLR 2025 Oral｜差分注意力机制引领变革，DIFF Transformer攻克长序列建模难题

近年来，Transformer 架构在自然语言处理领域取得了巨大成功，从机器翻译到文本生成，其强大的建模能力为语言理解与生成带来了前所未有的突破。然而，随着模型规模的不断扩大和应用场景的日益复杂，传统 Transformer 架构逐渐暴露出缺陷，尤其是在处理长文本、关键信息检索以及对抗幻觉等任务时，Transformer 常常因过度关注无关上下文而陷入困境，导致模型表现受限。为攻克这一难题，来自微软和清华的研究团队提出了 DIFF Transformer，一种基于差分注意力机制的创新基础模型架构。

4/29/2025 9:05:00 AM 机器之心

不用等R2了！第三方给新版DeepSeek V3添加深度思考，推理101秒破解7米甘蔗过2米门

DeepSeek即将发布R2？？坊间传闻越来越多了，且难辨真假。

4/29/2025 9:03:00 AM 量子位

阿里发布开源Qwen3，成本大幅降低仅需DeepSeek-R1的三分之一

阿里巴巴正式推出新一代通义千问模型 Qwen3（千问3），并宣布其开源。阿里云表示，千问3是国内首个 “混合推理模型”，同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R1，千问3的参数量仅为其三分之一，而部署成本大幅降低，使用仅需四张 H20显卡即可实现满血版的部署。

4/29/2025 9:00:40 AM AI在线

RAG性能暴增20%！清华等推出“以笔记为中心”的深度检索增强生成框架，复杂问答效果飙升

在当前大语言模型（LLMs）广泛应用于问答、对话等任务的背景下，如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力，成为 RAG（Retrieval-Augmented Generation）方向的核心挑战。来自清华大学、中国科学院大学、华南理工大学、东北大学、九星（AI9Stars）的联合研究团队提出了一项全新的适应式RAG方法——DeepNote。它首次引入“笔记（Note）”作为知识载体，实现更深入、更稳定的知识探索与整合，在所有任务上均优于主流RAG方法，相较于基础RAG性能提升高达 20.1%。

4/29/2025 8:54:53 AM

100年企业知识超10万文件，「内网版ChatGPT」血洗最卷行业！全员70%和AI共事

要说什么行业是地球上「最卷」的，咨询行业说第一，恐怕没有哪个行业敢称第二。在这个全球最精英、最高压的竞技场里，卷时间、卷精力、卷智力，现在要卷AI了！ ChatGPT已经无法满足世界上最「卷」的这批人了。

4/29/2025 8:40:00 AM 新智元

LLMs 防御升级：借函数调用机制打造无缝防御层

大语言模型（LLMs）展现出了令人惊叹的能力，其中函数调用功能更是让其如虎添翼。然而，这一强大功能也伴随着风险，恶意用户可能利用巧妙设计的提示进行隐秘操纵。本文将深入探讨如何将函数调用机制转化为一道无缝的防御层，有效检测和防范这些潜在威胁。

4/29/2025 8:18:48 AM 大模型之路

Qwen3正式确认本周发布，阿里云AI新篇章即将开启

阿里云Qwen团队通过社交平台正式确认，Qwen3系列模型将于本周内发布，标志着其旗舰大语言模型（LLM）与多模态能力的又一次重大升级。据AIbase了解，Qwen3将推出包括0.6B、4B、8B、30B-A3B在内的多种模型规模，支持高达256K的上下文长度，涵盖推理与非推理任务。社交平台上的热烈讨论凸显了其全球影响力，相关细节已通过Hugging Face与Qwen官网逐步公开。

4/28/2025 6:00:40 PM AI在线

Gemini-2.0夺冠！全球首个几何推理专项评测出炉，淘天集团出品

多模态大模型几何解题哪家强？首个从几何原理视角出发，全面评估多模态大模型几何解题能力的双语综合基准来了！ GeoSense，系统评测多模态大模型在几何原理识别和应用中的表现，评测基准的数据和评测代码均已开源。

4/28/2025 2:04:03 PM 量子位

AR智能革命！Satori系统读懂人类意图，科幻电影场景成现实

团队由 IEEE 会士，纽约大学教授 Claudio Silva 和纽约大学研究助理教授钱靖共同指导。论文由Chenyi Li和Guande Wu共同第一作者。在无数科幻电影中，增强现实（AR）通过在人们的眼前叠加动画、文字、图形等可视化信息，让人获得适时的、超越自身感知能力的信息。

4/28/2025 9:42:00 AM 机器之心

1亿图文对！格灵深瞳开源RealSyn数据集，CLIP多任务性能刷新SOTA

新的亿级大规模图文对数据集来了，CLIP达成新SOTA！格灵深瞳最新发布的高质量数据集RealSyn，不仅规模大——包含1亿组图文对，而且每张图片都同时关联多个真实和合成文本。所有的图像和句子都基于冗余进行了严格过滤，在确保数据质量的同时，引入基于簇的语义平衡采样策略，构建了可满足多样工作需求的三种规模大小的数据集：15M、30M、100M。

4/28/2025 9:14:00 AM 量子位

OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

GPT-4o生成的第一视角机器人打字图这次，来自Meta等机构的研究者，发现在多模态大语言模型（MLLMs）中，视觉词表存在维度冗余：视觉编码器输出的低维视觉特征，被直接映射到高维语言词表空间。研究者提出了一种简单而新颖的Transformer图像token压缩方法：Token-Shuffle。他们设计了两项关键操作：token混洗（token-shuffle）：沿通道维度合并空间局部token，用来减少输入token数；token解混（token-unshuffle）：在Transformer块后解构推断token，用来恢复输出空间结构。

4/28/2025 9:10:00 AM 新智元

毛骨悚然！o3精准破译照片位置，只靠几行Python代码？人类在AI面前已裸奔

OpenAI的o3发布以来，这个功能让不少网友觉得毛骨悚然——它能准确破解你的地理位置！就在刚刚，Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客，详尽推敲了o3究竟是如何猜测照片拍摄地点的。他将整个过程评价为：既超现实，又反乌托邦，仿佛几十年前的科幻小说突然变成现实！

4/28/2025 9:08:00 AM 新智元

ICLR 2025 | 无需训练加速20倍，清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

论文有两位共同一作。郑凯文为清华大学计算机系三年级博士生，何冠德为德州大学奥斯汀分校（UT Austin）一年级博士生。扩散模型（Diffusion Models）近年来在生成任务上取得了突破性的进展，不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现，推动了文本到图像、视频生成的技术革新。

4/28/2025 9:00:00 AM 机器之心

基于奖励驱动和自组织演化机制，全新框架ReSo重塑复杂推理任务中的智能协作

本文由上海人工智能实验室，悉尼大学，牛津大学联合完成。第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。通讯作者为上海人工智能实验室青年科学家白磊和牛津大学访问学者，悉尼大学博士生尹榛菲，团队其他成员还有 ailab 实习生薛翔元。

4/28/2025 8:50:00 AM 机器之心

英伟达华人硬核AI神器，「描述一切」秒变细节狂魔！仅3B逆袭GPT-4o

有了AI，谁还愿意用手配「字幕」？刚刚，英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model（DAM），仅3B参数。论文地址： Anything，上传一张图，圈哪点哪，它即可生成一段丰富的文字描述。

4/27/2025 9:54:48 AM

GPT-4.5功臣遭驱逐！奥特曼盛赞工作出色，美国深陷AI人才危机

GPT-4.5的核心研发成员，竟然要被驱逐出美国？！ OpenAI著名研究科学家Noam Brown爆料称，已经在美国居住了12年的加拿大籍AI研究员，现就职于OpenAI的Kai Chen，近日被美国拒发绿卡。

4/27/2025 9:26:00 AM 新智元

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉