模型

字节跳动发布新一代多模态大模型，挑战谷歌 Gemini 2.5 Pro

在人工智能领域竞争日益激烈的今天，字节跳动的 Seed 团队于5月13日正式发布了其最新的多模态大模型 Seed1.5-VL，旨在为智能体技术的进步铺平道路。该模型经过超过3万亿 tokens 的多模态数据预训练，不仅具备强大的通用多模态理解和推理能力，还显著降低了推理成本。与谷歌近期推出的 Gemini2.5Pro 相比，Seed1.5-VL 在性能上表现不相上下。

5/14/2025 12:00:52 PM AI在线

逆天改命！Flow-GRPO 让图像生成模型秒变 “大神”

家人们，今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了，它就像是给图像生成模型打了一针 “超级进化剂”，直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎么做到的吗?快搬好小板凳，听我细细道来!图像生成模型的 “成长烦恼”现在的图像生成模型，比如基于流匹配（Flow matching）的那些，理论基础那叫一个扎实，生成的高质量图像也让人眼前一亮。但它们也有自己的 “小烦恼”，遇到复杂场景，像要安排好多物体、处理各种属性和关系，或者是在图像里准确渲染文本的时候，就有点 “抓瞎” 了。

5/14/2025 11:00:52 AM AI在线

o3完爆人类医生，OpenAI基准直击AGI！

最强AI，已击败了人类医生。就在刚刚，全球60个国家，262名执业医生共同上阵，联手OpenAI打造出「最具AGI标志性」的AI健康系统评估标准——HealthBench。这个基准包含了5,000个基于现实场景的健康对话，每个对话都有医生定制的评分标准，来评估模型的响应。

5/14/2025 10:09:12 AM

腾讯混元携手科研机构推出首个多模态统一CoT奖励模型并开源

近日，腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下，正式推出了全新研究成果 —— 统一多模态奖励模型（Unified Reward-Think），并宣布全面开源。这一创新模型不仅具备了强大的长链推理能力，还首次实现了在视觉任务中 “思考” 的能力，使得奖励模型能够更准确地评估复杂的视觉生成与理解任务。统一多模态奖励模型的推出，标志着奖励模型在各类视觉任务中的应用达到了新的高度。

5/14/2025 10:01:03 AM AI在线

法律AI独角兽Harvey拥抱Anthropic与谷歌模型，打破OpenAI独家依赖

备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整，未来将整合 Anthropic 和谷歌的领先基础模型，结束了此前完全依赖 OpenAI 技术的局面。值得注意的是，Harvey 曾是 OpenAI 初创基金的明星投资项目之一，该基金旨在扶持基于 AI 技术（特别是 OpenAI 自研技术）的公司。尽管 Harvey 强调不会放弃 OpenAI，只是增加了更多模型和云服务选项，但此举无疑对 OpenAI 的竞争对手来说是一次重要的胜利。

5/14/2025 10:01:02 AM AI在线

3D人脸黑科技！Pixel3DMM：单张RGB图像秒变3D人脸，姿势表情精准还原，几何精度碾压竞品15%！

慕尼黑工业大学和伦敦大学学院提出了一款经过微调的 DINO ViT模型 Pixel3DMM，用于逐像素表面法线和 UV 坐标预测。从上到下，下图展示了 FFHQ 输入图像、估计的表面法线、根据预测的 UV 坐标估计的二维顶点，以及针对上述两个线索的 FLAME 拟合结果。使用Pixel3DMM 进行野外追踪。

5/14/2025 9:23:55 AM

谷歌开源基于物理模拟的气象模型，能预测暴雨、台风、大干旱

传统的通用循环模型（GCMs）在天气预报和气候模拟方面发挥了重要作用，但在处理特殊状态的小尺度时存在局限性，例如，处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化，会导致模型在匹配历史数据时的调参过程仍然依靠手动设置，且GCMs自身存在许多持续的错误和偏见。。所以为了克服这些困难，谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM，并已经开源提供给各大气象机构测试和使用。

5/14/2025 9:20:59 AM

Poe：DeepSeek使用率下降50%，快手崛起、OpenAI暴涨

今天凌晨，全球著名大模型整合应用平台Poe发布了，2025年春季AI模型使用趋势报告。结果显示，DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%，整体使用率下降超过50%；OpenAI由于在GPT-4o推出新的文生图功能后，例如，吉卜力风格、仿真自拍等类型图片，实现病毒式增长使用率暴涨。下面「AIGC开放社区」将从文本、视频、推理、图像和音频5大领域为大家解读这份报告。

5/14/2025 9:16:39 AM

首次！流匹配模型引入GRPO，GenEval几近满分，组合生图能力远超GPT-4o

本文由香港中文大学与快手可灵等团队联合完成。第一作者为香港中文大学 MMLab 博士生刘杰，他的研究方向为强化学习和生成模型，曾获 ACL Outstanding Paper Award。流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能，已成为图像生成（Stable Diffusion, Flux）和视频生成（可灵，WanX，Hunyuan）领域最先进模型的训练方法。

5/14/2025 9:15:00 AM

推理大模型1年内就会撞墙，性能无法再扩展几个数量级 | FrontierMath团队最新研究

一年之内，大模型推理训练可能就会撞墙。以上结论来自Epoch AI。这是一个专注于人工智能研究和基准测试的非营利组织，之前名动一时的FrontierMath基准测试（评估AI模型数学推理能力）就出自它家。

5/14/2025 9:07:00 AM

OpenAI首席科学家Nature爆料：AI自主发现新科学！世界模型和RL是关键

ChatGPT推出后，迅速震惊了全球。自那以后，OpenAI一直站在AI技术发展的最前沿。去年9月，他们推出o系列模型，再次引领AI推理的浪潮。

5/14/2025 9:03:00 AM

苹果推出革命性 AI 模型 Matrix3D：轻松将 3 张照片转化为 3D 场景

苹果机器学习团队与南京大学和香港科技大学合作，推出了一款名为 Matrix3D 的先进 AI 模型。该模型的主要功能是从少量的2D 照片中重建真实的物体和场景，为用户提供高质量的3D 输出。用户只需提供三张照片，Matrix3D 便能自动生成详细的3D 重建效果。

5/14/2025 9:01:02 AM AI在线

一句指令，无限宇宙！Matrix-Game硬核上线，秒杀SOTA

黑客帝国中的「矩阵」，已照进现实。指尖轻点，一个细节满满、物理规则完美运转的虚拟世界就此诞生。这个曾经只在科幻大片出现的场景，如今「空间智能」就帮人类实现了。

5/13/2025 3:16:48 PM 新智元

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

本文由来自香港城市大学、麦吉尔大学（McGill）、蒙特利尔人工智能实验室（MILA）、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、UCSB、香港中文大学等机构的多位研究者共同完成。第一作者为来自香港城市大学的博士生张启源和来自蒙特利尔人工智能实验室（MILA）的博士生吕福源。当训练成本飙升、数据枯竭，如何继续激发大模型潜能？

5/13/2025 3:13:28 PM 机器之心

AI 横扫医学问答，赢麻了？牛津大学团队实锤 AI 临床短板

原本以为，大模型考过了医学考试，离成为“AI医生”也就差临门一脚。没想到，牛津大学最新这项研究，却狠狠给了一记当头棒喝。图片论文地址：“AI诊断准确率高达99%！

5/13/2025 3:10:50 PM 文摘菌

OpenAI 发布 HealthBench：评估大型语言模型在医疗领域表现的新标准

近日，OpenAI 发布了一款名为 HealthBench 的开源评估框架，旨在测量大型语言模型（LLMs）在真实医疗场景中的表现和安全性。此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持，旨在弥补现有评估标准的不足，特别是在真实应用、专家验证和诊断覆盖方面。现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式，如多项选择考试。

5/13/2025 3:00:52 PM AI在线

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

一夜之间，老黄天塌了（doge）。全球首个分布式RL训练模型INTELLECT-2发布，它仅通过整合全球闲置或分散的计算资源，就完成了模型的强化学习训练，训练成本大大降低。其模型性能与DeepSeek-R1媲美！

5/13/2025 1:51:20 PM

AI无限生成《我的世界》，玩家动动键盘鼠标自主控制！国产交互式世界模型来了

用AI无限扩展《我的世界》，动动鼠标、键盘即可搞定！一直前进、砍掉树木，后面别有洞天的世界，都是由用户与环境交互、AI实时生成的。也就是说，在砍掉树木之前，树后面的内容还是不存在的。

5/13/2025 1:50:00 PM

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

模型

字节跳动发布新一代多模态大模型，挑战谷歌 Gemini 2.5 Pro

逆天改命！Flow-GRPO 让图像生成模型秒变 “大神”

o3完爆人类医生，OpenAI基准直击AGI！

腾讯混元携手科研机构推出首个多模态统一CoT奖励模型并开源

法律AI独角兽Harvey拥抱Anthropic与谷歌模型，打破OpenAI独家依赖

3D人脸黑科技！Pixel3DMM：单张RGB图像秒变3D人脸，姿势表情精准还原，几何精度碾压竞品15%！

谷歌开源基于物理模拟的气象模型，能预测暴雨、台风、大干旱

Poe：DeepSeek使用率下降50%，快手崛起、OpenAI暴涨

首次！流匹配模型引入GRPO，GenEval几近满分，组合生图能力远超GPT-4o

推理大模型1年内就会撞墙，性能无法再扩展几个数量级 | FrontierMath团队最新研究

OpenAI首席科学家Nature爆料：AI自主发现新科学！世界模型和RL是关键

​苹果推出革命性 AI 模型 Matrix3D：轻松将 3 张照片转化为 3D 场景

一句指令，无限宇宙！Matrix-Game硬核上线，秒杀SOTA

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

AI 横扫医学问答，赢麻了？牛津大学团队实锤 AI 临床短板

OpenAI 发布 HealthBench：评估大型语言模型在医疗领域表现的新标准

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

AI无限生成《我的世界》，玩家动动键盘鼠标自主控制！国产交互式世界模型来了

苹果推出革命性 AI 模型 Matrix3D：轻松将 3 张照片转化为 3D 场景