AI在线 AI在线

模型

逆天改命!Flow-GRPO 让图像生成模型秒变 “大神”

家人们,今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了,它就像是给图像生成模型打了一针 “超级进化剂”,直接让它们从 “青铜” 一路飙升到 “王者”。 想知道它是怎么做到的吗?快搬好小板凳,听我细细道来!图像生成模型的 “成长烦恼”现在的图像生成模型,比如基于流匹配(Flow matching)的那些,理论基础那叫一个扎实,生成的高质量图像也让人眼前一亮。 但它们也有自己的 “小烦恼”,遇到复杂场景,像要安排好多物体、处理各种属性和关系,或者是在图像里准确渲染文本的时候,就有点 “抓瞎” 了。
5/14/2025 11:00:52 AM
AI在线

o3完爆人类医生,OpenAI基准直击AGI!

最强AI,已击败了人类医生。 就在刚刚,全球60个国家,262名执业医生共同上阵,联手OpenAI打造出「最具AGI标志性」的AI健康系统评估标准——HealthBench。 这个基准包含了5,000个基于现实场景的健康对话,每个对话都有医生定制的评分标准,来评估模型的响应。
5/14/2025 10:09:12 AM

腾讯混元携手科研机构推出首个多模态统一CoT奖励模型并开源

近日,腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下,正式推出了全新研究成果 —— 统一多模态奖励模型(Unified Reward-Think),并宣布全面开源。 这一创新模型不仅具备了强大的长链推理能力,还首次实现了在视觉任务中 “思考” 的能力,使得奖励模型能够更准确地评估复杂的视觉生成与理解任务。 统一多模态奖励模型的推出,标志着奖励模型在各类视觉任务中的应用达到了新的高度。
5/14/2025 10:01:03 AM
AI在线

法律AI独角兽Harvey拥抱Anthropic与谷歌模型,打破OpenAI独家依赖

备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整,未来将整合 Anthropic 和谷歌的领先基础模型,结束了此前完全依赖 OpenAI 技术的局面。 值得注意的是,Harvey 曾是 OpenAI 初创基金的明星投资项目之一,该基金旨在扶持基于 AI 技术(特别是 OpenAI 自研技术)的公司。 尽管 Harvey 强调不会放弃 OpenAI,只是增加了更多模型和云服务选项,但此举无疑对 OpenAI 的竞争对手来说是一次重要的胜利。
5/14/2025 10:01:02 AM
AI在线

3D人脸黑科技!Pixel3DMM:单张RGB图像秒变3D人脸,姿势表情精准还原,几何精度碾压竞品15%!

慕尼黑工业大学和伦敦大学学院提出了一款经过微调的 DINO ViT模型 Pixel3DMM,用于逐像素表面法线和 UV 坐标预测。 从上到下,下图展示了 FFHQ 输入图像、估计的表面法线、根据预测的 UV 坐标估计的二维顶点,以及针对上述两个线索的 FLAME 拟合结果。 使用Pixel3DMM 进行野外追踪。
5/14/2025 9:23:55 AM

谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱

传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
5/14/2025 9:20:59 AM

Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨

今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。 结果显示,DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%;OpenAI由于在GPT-4o推出新的文生图功能后,例如,吉卜力风格、仿真自拍等类型图片,实现病毒式增长使用率暴涨。 下面「AIGC开放社区」将从文本、视频、推理、图像和音频5大领域为大家解读这份报告。
5/14/2025 9:16:39 AM

首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o

本文由香港中文大学与快手可灵等团队联合完成。 第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。
5/14/2025 9:15:00 AM

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

一年之内,大模型推理训练可能就会撞墙。 以上结论来自Epoch AI。 这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。
5/14/2025 9:07:00 AM

OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键

ChatGPT推出后,迅速震惊了全球。 自那以后,OpenAI一直站在AI技术发展的最前沿。 去年9月,他们推出o系列模型,再次引领AI推理的浪潮。
5/14/2025 9:03:00 AM

​苹果推出革命性 AI 模型 Matrix3D:轻松将 3 张照片转化为 3D 场景

苹果机器学习团队与南京大学和香港科技大学合作,推出了一款名为 Matrix3D 的先进 AI 模型。 该模型的主要功能是从少量的2D 照片中重建真实的物体和场景,为用户提供高质量的3D 输出。 用户只需提供三张照片,Matrix3D 便能自动生成详细的3D 重建效果。
5/14/2025 9:01:02 AM
AI在线

一句指令,无限宇宙!Matrix-Game硬核上线,秒杀SOTA

黑客帝国中的「矩阵」,已照进现实。 指尖轻点,一个细节满满、物理规则完美运转的虚拟世界就此诞生。 这个曾经只在科幻大片出现的场景,如今「空间智能」就帮人类实现了。
5/13/2025 3:16:48 PM
新智元

突破大模型推理瓶颈!首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道

本文由来自香港城市大学、麦吉尔大学(McGill)、蒙特利尔人工智能实验室(MILA)、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、UCSB、香港中文大学等机构的多位研究者共同完成。 第一作者为来自香港城市大学的博士生张启源和来自蒙特利尔人工智能实验室(MILA)的博士生吕福源。 当训练成本飙升、数据枯竭,如何继续激发大模型潜能?
5/13/2025 3:13:28 PM
机器之心

AI 横扫医学问答,赢麻了?牛津大学团队实锤 AI 临床短板

原本以为,大模型考过了医学考试,离成为“AI医生”也就差临门一脚。 没想到,牛津大学最新这项研究,却狠狠给了一记当头棒喝。 图片论文地址:“AI诊断准确率高达99%!
5/13/2025 3:10:50 PM
文摘菌

OpenAI 发布 HealthBench:评估大型语言模型在医疗领域表现的新标准

近日,OpenAI 发布了一款名为 HealthBench 的开源评估框架,旨在测量大型语言模型(LLMs)在真实医疗场景中的表现和安全性。 此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持,旨在弥补现有评估标准的不足,特别是在真实应用、专家验证和诊断覆盖方面。 现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式,如多项选择考试。
5/13/2025 3:00:52 PM
AI在线

全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它

一夜之间,老黄天塌了(doge)。 全球首个分布式RL训练模型INTELLECT-2发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大降低。 其模型性能与DeepSeek-R1媲美!
5/13/2025 1:51:20 PM

AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!国产交互式世界模型来了

用AI无限扩展《我的世界》,动动鼠标、键盘即可搞定! 一直前进、砍掉树木,后面别有洞天的世界,都是由用户与环境交互、AI实时生成的。 也就是说,在砍掉树木之前,树后面的内容还是不存在的。
5/13/2025 1:50:00 PM

Sakana AI 扔出重磅炸弹:让机器像人一样“持续思考”

人工智能领域最近迎来了一项引人关注的新进展。 总部位于东京的 Sakana AI 发表了一篇题为《连续思维机器》(Continuous Thought Machines)的论文,提出了一种旨在让机器模拟生物大脑复杂神经活动和“持续思考”能力的新模型。 这篇论文的核心观点是挑战当前深度学习中对时间动态的简化处理,试图将神经元层面的时序处理和同步机制重新引入,使“神经时序”成为人工智能模型的基础。
5/13/2025 11:00:52 AM
AI在线