AI在线 AI在线

理论

“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Vibe coding正火得一塌糊涂,但谁能想到,刚刚一位大佬已经把当红的AI编程神器Cursor和Windsurf背后的核心算法机制研究出来了! 今天凌晨,一位名为Nir Diamant的技术大牛发表了一篇高质量神文,可以说把Cursor和Windsurf的核心算法说得非常透彻,就像玩抖音的需要了解抖音推荐算法一样,正在Vibe Coding的我们,当然也得快速吃透跟自己对话的编程助手,究竟是怎样一个思维回路。 非常细节,值得各位收藏细读一番。
5/14/2025 4:39:21 PM
云昭

微软不松手,OpenAI 不回头

OpenAI走到了一个分水岭上,正试图把自己从一个设限的实验项目,转向一个可以在资本市场独立行走的企业体。 但它不能独行。 微软挡在前头,松不开手,也不愿撒手。
5/14/2025 3:07:18 PM
文摘菌

Poe 发布 AI 模型报告:GPT-4o 独占鳌头,Gemini 推理异军突起,快手可灵黑马搅局!

AI 模型市场,就像一场不停撤掉椅子的游戏,玩家们争抢着位置。 谁坐得稳,谁被挤下,数据在说话。 Poe 平台拿出了一份报告,打开一个窗口,让我们看看 2025 年 1 月到 5 月,这个市场的风云变幻。
5/14/2025 3:06:28 PM

字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

5 月 13 日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了 5 款模型和产品,包括豆包・视频生成模型 Seedance 1.0 lite、升级后的豆包 1.5・视觉深度思考模型,以及新版豆包・音乐模型。 同时,Data Agent 和 Trae 等产品也有了新进展。 其中,全场最吸睛的就是豆包 1.5・视觉深度思考模型(以下称 Seed 1.5-VL)。
5/14/2025 3:05:21 PM

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

3D点云处理(PCP)涉及多种任务,如分割、去噪、配准、重建等,传统方法通常是为每个任务设计专用模型,导致过程繁杂、成本高昂。 虽然多任务学习(MTL)能缓解模型数量问题,但在任务冲突、参数调优方面仍存在挑战。 近年来兴起的In-Context Learning(ICL,上下文学习)技术,是指大型语言模型在不进行显式参数更新的情况下,仅通过输入中的示例(即上下文信息)来完成新的任务。
5/14/2025 3:03:45 PM

ICML 2025 | 如何在合成文本数据时避免模型崩溃?

随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。 未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。 然而,这一趋势也带来了严峻挑战:合成数据如果不加控制地使用,可能引发 “模型崩溃”(Model Collapse)问题。
5/14/2025 1:23:19 PM

Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型

Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓! 采用了双模式架构,一个模型同时支持推理和非推理任务,根据需要自动切换。 训练和微调过程采取分段式策略,逐步构建模型能力。
5/14/2025 1:22:08 PM
量子位

o3完爆人类医生,OpenAI基准直击AGI!

最强AI,已击败了人类医生。 就在刚刚,全球60个国家,262名执业医生共同上阵,联手OpenAI打造出「最具AGI标志性」的AI健康系统评估标准——HealthBench。 这个基准包含了5,000个基于现实场景的健康对话,每个对话都有医生定制的评分标准,来评估模型的响应。
5/14/2025 10:09:12 AM

我花了整整两周,深度体验了五款最火的 AI 工具,发现它们都有个致命的问题......

Hello,大家好,我是 Sunday。 2025 年都来了,AI 工具已经不再是什么 “黑科技” 拉,而是实打实落地到我们每一个前端人日常开发流程中的 真 -- 提效神器。 但问题也来了,目前市面上 AI 工具越来越多,宣传都很猛,那么真的能用的到底几个呢?
5/14/2025 10:08:57 AM
程序员Sunday

突发,美商务部叫停「AI扩散规则」藏杀机!英伟达市值再破3万亿

《AI扩散规则》生效前夜,特朗普政府正式叫停。 13日晚,美商务部工业和安全局(BIS)宣布,撤销拜登签署的《AI扩散规则》(即将在5月15日生效)。 图片与此同时,他们又出台了加强全球半导体出口管制的新措施,这些限制可谓是又准又狠。
5/14/2025 9:57:42 AM
新智元

3D人脸黑科技!Pixel3DMM:单张RGB图像秒变3D人脸,姿势表情精准还原,几何精度碾压竞品15%!

慕尼黑工业大学和伦敦大学学院提出了一款经过微调的 DINO ViT模型 Pixel3DMM,用于逐像素表面法线和 UV 坐标预测。 从上到下,下图展示了 FFHQ 输入图像、估计的表面法线、根据预测的 UV 坐标估计的二维顶点,以及针对上述两个线索的 FLAME 拟合结果。 使用Pixel3DMM 进行野外追踪。
5/14/2025 9:23:55 AM

谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱

传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
5/14/2025 9:20:59 AM

ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式

该工作由通用人工智能研究院 × 北京大学联手打造。 第一作者郑欣悦为通用人工智能研究院研究员,共同一作为北京大学人工智能研究院博士生林昊苇,通讯作者为北京大学助理教授梁一韬和通用人工智能研究院研究员郑子隆。 开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。
5/14/2025 9:17:00 AM

Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨

今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。 结果显示,DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%;OpenAI由于在GPT-4o推出新的文生图功能后,例如,吉卜力风格、仿真自拍等类型图片,实现病毒式增长使用率暴涨。 下面「AIGC开放社区」将从文本、视频、推理、图像和音频5大领域为大家解读这份报告。
5/14/2025 9:16:39 AM

首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o

本文由香港中文大学与快手可灵等团队联合完成。 第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。
5/14/2025 9:15:00 AM

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

一年之内,大模型推理训练可能就会撞墙。 以上结论来自Epoch AI。 这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。
5/14/2025 9:07:00 AM

OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键

ChatGPT推出后,迅速震惊了全球。 自那以后,OpenAI一直站在AI技术发展的最前沿。 去年9月,他们推出o系列模型,再次引领AI推理的浪潮。
5/14/2025 9:03:00 AM

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

在多模态大模型快速发展的当下,如何精准评估其生成内容的质量,正成为多模态大模型与人类偏好对齐的核心挑战。 然而,当前主流多模态奖励模型往往只能直接给出评分决策,或仅具备浅层推理能力,缺乏对复杂奖励任务的深入理解与解释能力,在高复杂度场景中常出现 “失真失准”。 那么,奖励模型是否也能具备像人类一样的深度思考能力?
5/14/2025 8:51:00 AM