AI在线 AI在线

理论

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

开源社区的人应该对 vLLM 不陌生,它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和资源利用率(尤其是内存),同时兼容 Hugging Face 等流行模型库。 简单来说,vLLM 能让 GPT、Mistral、LLaMA 等主流模型系列跑得更快、消耗更少资源,取得这些效果的关键是其创新的注意力机制实现方案 ——PagedAttention。 近日,DeepSeek AI 研究者、深度学习系统工程师俞星凯从零开始构建了一个轻量级 vLLM 实现 ——Nano-vLLM,将代码简化到了 1200 行。
6/13/2025 2:16:37 PM

o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理

OpenAI“最新最强版”推理模型o3-pro,实际推理能力到底有多强? 全球首位全职提示工程师Riley Goodside来给它上难度:说出歌手Sabrina Carpenter的一首歌的歌名,回答这个问题时,每个单词最后一个字母连起来看,也能对应这首歌名。 图片结果,o3-pro在经过4分25秒的推理过后,成功给出正确答案。
6/13/2025 2:15:57 PM

视频扩散模型新突破!清华腾讯联合实现高保真3D生成,告别多视图依赖

三维场景是构建世界模型、具身智能等前沿科技的关键环节之一。 尽管Hunyuan3D、Rodin-v1.5、Tripo-v2.5等生成模型已在三维生成领域取得显著进展,但其往往聚焦在物体级别内容生成,难以实现复杂三维场景的构建。 清华大学联合腾讯提出Scene Splatter——从一张图像出发,基于自定义的相机轨迹探索三维场景。
6/13/2025 2:13:26 PM

苹果大模型智商归零论文刷屏,是革命,还是自曝式搬起石头打自己的脚?大牛犀利锐平:苹果真正的问题,不是论文写得刺耳,而是产品太难看

编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto). 近日,苹果被爆出了两个大事:一篇极具争议的论文,一场颇受质疑的新发布。 最吊诡的是,iOS26新发布的热度还没有一篇论文引起的反响更强烈!
6/13/2025 1:14:10 PM
云昭

TypeScript 杀疯了,开发 AI 应用新趋势!

随着 AI 技术的迅猛发展,越来越多开发者开始构建基于大模型(LLM)、多智能体协作、浏览器端推理等新型应用。 在这一浪潮中,TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态,正逐步成为现代 AI 应用开发的主流选择之一。 根据 Y Combinator 统计,约有 60% 至 70% 的 AI Agent 初创公司采用 TypeScript 开发。
6/13/2025 11:25:04 AM
CUGGZ

超越英伟达B200!AMD最强AI芯:1.6倍大内存、大模型推理快30%,奥特曼都来站台

AMD大招逆袭,最强AI芯片号称大模型推理比英伟达B200快30%! CEO苏姿丰与OpenAI奥特曼共同登台发布。 这次AMD发布了MI350X和MI355X两款GPU,采用3nm工艺,包含1850亿晶体管,配备HBM3E内存。
6/13/2025 11:24:39 AM

强化预训练(RPT):LLM 预训练新范式,当模型学会战略思考

大家好,我是肆〇柒。 在当下,大型语言模型(LLM)正以其卓越的能力在诸多任务中引人瞩目。 这些能力的提升,很大程度上得益于在大规模文本数据上的 next-token-prediction 自监督学习范式。
6/13/2025 9:29:51 AM
肆零柒

80%到25%逆转!大模型代码能力最新排名:Anthropic不再是唯一的神?

OpenRouter网站提供了一个很有意思的模型使用排行榜,它按照不同使用场景(如编程、写作等)进行了分类。 有人整理了其中“编程”类别的数据,并按模型提供商进行了分组,从中可以看出一些有趣的市场趋势。 数据显示,从2024年12月到2025年2月期间,Anthropic公司的模型在编程场景下的流量占比曾高达约80%,表现得相当强势。
6/13/2025 9:12:00 AM

CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

视频生成技术正以前所未有的速度革新着当前的视觉内容创作方式,从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。 那么,要如何评估AI生成的视频是否符合人类的审美和需求呢? Video-Bench视频评估框架,能够通过模拟人类的认知过程,建立起连接文本指令与视觉内容的智能评估体系。
6/13/2025 9:10:00 AM

LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代

如何让AI代码补全更懂开发者? 中兴通讯团队提出了两个新的评测指标,以及一套仓库级代码语料处理框架。 按照团队的说法,这套方法论不仅为评测代码大模型提供了新视角,也为提升模型在真实工业场景中的代码补全性能开辟了新路径。
6/13/2025 9:10:00 AM

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。 传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。 而现有的自动化综述生成方法面临诸多挑战:AI生成的综述结构往往缺乏连贯逻辑,组织结构较差,存在宽度和深度的结构失衡问题;在参考文献方面,经常无法引用真正相关和有影响力的文献,容易引用无关文献而忽略核心贡献;评估方式主要依赖LLM整体质量评估,缺乏对大纲质量、参考文献相关性等关键方面的细粒度分析。
6/13/2025 9:08:00 AM

黄仁勋发布量子计算专用CUDA!预言量子计算机几年内应用,但现在还离不开GB200

“量子计算正在到达一个拐点。 ”在GTC巴黎的演讲中,英伟达CEO黄仁勋对量子计算给出了新的论断。 这次,老黄一改此前“实用量子计算机还要20年”的观点,预言量子计算机的实际应用在几年内就能实现。
6/13/2025 9:06:00 AM

256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。 该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。 尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。
6/13/2025 9:03:00 AM

黄仁勋亲述:当年如何把“价值数十亿美金”的首台AI超算,亲手送给了OpenAI

老黄在法国巴黎最新演讲讲了一个小故事:OpenAI如何获得全世界第一台AI超级计算机。 如今,当人们谈论这一波人工智能的浪潮时,英伟达(NVIDIA)和OpenAI是两个无法绕开的名字。 前者是AI算力的基石,后者则用ChatGPT等产品引爆了全球的AI革命。
6/13/2025 9:02:18 AM

苹果AI发展深陷困境:Siri升级计划屡屡受挫,多次跳票面临尴尬境地

在科技行业全力奔赴 AI 未来的进程中,苹果公司却在 AI 赛道上举步维艰,尤其是其核心语音助手 Siri 的升级计划,更是麻烦不断,陷入了难以挣脱的泥沼。 自 2024 年苹果在全球开发者大会(WWDC)上首次展示 Siri 智能升级功能,试图重塑其在 AI领域的形象以来,这场 AI 革新之旅就充满了坎坷。 按照最初规划,新一代 Siri 功能将在 iOS 18.4 .
6/13/2025 8:53:44 AM
小菲

何恺明改进了谢赛宁的REPA:极大简化但性能依旧强悍

在建模复杂的数据分布方面,扩散生成模型表现出色,不过它的成果大体上与表征学习(representation learning)领域关联不大。 通常来说,扩散模型的训练目标包含一个专注于重构(例如去噪)的回归项,但缺乏为生成学习到的表征的显式正则化项。 这种图像生成范式与图像识别范式差异明显 —— 过去十年来,图像识别领域的核心主题和驱动力一直是表征学习。
6/13/2025 8:53:00 AM

CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务

共同第一作者包括:陈家棋,斯坦福大学访问学者,复旦大学硕士,研究方向为 LLM Agent和大一统模型;朱小烨,华南理工大学本科,研究方向为 LLM Agent、LLM 和强化学习;王越,康奈尔大学本科,研究方向为 LLM Agent、多模态语言模型。 指导老师:Julian McAuley(UCSD)、Li-jia Li (IEEE Fellow, LiveX AI)。 在人工智能内容创作蓬勃发展的今天,跨模态生成技术正在重塑艺术创作和视觉表达的边界。
6/13/2025 8:46:00 AM

CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

本文第一作者杜恒辉为中国人民大学二年级硕士生,主要研究方向为多模态大模型视听场景理解与推理,长视频理解等,师从胡迪副教授。 作者来自于中国人民大学,清华大学和北京腾讯 PCG AI 技术中心。 我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。
6/13/2025 8:45:00 AM