理论

1200行代码逆袭！DeepSeek工程师开源轻量级vLLM，吞吐量逼近原版

开源社区的人应该对 vLLM 不陌生，它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎，核心目标是提升 LLM 的推理速度（吞吐量）和资源利用率（尤其是内存），同时兼容 Hugging Face 等流行模型库。简单来说，vLLM 能让 GPT、Mistral、LLaMA 等主流模型系列跑得更快、消耗更少资源，取得这些效果的关键是其创新的注意力机制实现方案 ——PagedAttention。近日，DeepSeek AI 研究者、深度学习系统工程师俞星凯从零开始构建了一个轻量级 vLLM 实现 ——Nano-vLLM，将代码简化到了 1200 行。

6/13/2025 2:16:37 PM

o3-pro答高难题文字游戏引围观，OpenAI前员工讽刺苹果：这都不叫推理那什么叫推理

OpenAI“最新最强版”推理模型o3-pro，实际推理能力到底有多强？全球首位全职提示工程师Riley Goodside来给它上难度：说出歌手Sabrina Carpenter的一首歌的歌名，回答这个问题时，每个单词最后一个字母连起来看，也能对应这首歌名。图片结果，o3-pro在经过4分25秒的推理过后，成功给出正确答案。

6/13/2025 2:15:57 PM

视频扩散模型新突破！清华腾讯联合实现高保真3D生成，告别多视图依赖

三维场景是构建世界模型、具身智能等前沿科技的关键环节之一。尽管Hunyuan3D、Rodin-v1.5、Tripo-v2.5等生成模型已在三维生成领域取得显著进展，但其往往聚焦在物体级别内容生成，难以实现复杂三维场景的构建。清华大学联合腾讯提出Scene Splatter——从一张图像出发，基于自定义的相机轨迹探索三维场景。

6/13/2025 2:13:26 PM

苹果大模型智商归零论文刷屏，是革命，还是自曝式搬起石头打自己的脚？大牛犀利锐平：苹果真正的问题，不是论文写得刺耳，而是产品太难看

编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）. 近日，苹果被爆出了两个大事：一篇极具争议的论文，一场颇受质疑的新发布。最吊诡的是，iOS26新发布的热度还没有一篇论文引起的反响更强烈！

6/13/2025 1:14:10 PM

云昭

TypeScript 杀疯了，开发 AI 应用新趋势！

随着 AI 技术的迅猛发展，越来越多开发者开始构建基于大模型（LLM）、多智能体协作、浏览器端推理等新型应用。在这一浪潮中，TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态，正逐步成为现代 AI 应用开发的主流选择之一。根据 Y Combinator 统计，约有 60% 至 70% 的 AI Agent 初创公司采用 TypeScript 开发。

6/13/2025 11:25:04 AM

CUGGZ

超越英伟达B200！AMD最强AI芯：1.6倍大内存、大模型推理快30%，奥特曼都来站台

AMD大招逆袭，最强AI芯片号称大模型推理比英伟达B200快30%！ CEO苏姿丰与OpenAI奥特曼共同登台发布。这次AMD发布了MI350X和MI355X两款GPU，采用3nm工艺，包含1850亿晶体管，配备HBM3E内存。

6/13/2025 11:24:39 AM

强化预训练（RPT）：LLM 预训练新范式，当模型学会战略思考

大家好，我是肆〇柒。在当下，大型语言模型（LLM）正以其卓越的能力在诸多任务中引人瞩目。这些能力的提升，很大程度上得益于在大规模文本数据上的 next-token-prediction 自监督学习范式。

6/13/2025 9:29:51 AM

肆零柒

80%到25%逆转！大模型代码能力最新排名：Anthropic不再是唯一的神？

OpenRouter网站提供了一个很有意思的模型使用排行榜，它按照不同使用场景（如编程、写作等）进行了分类。有人整理了其中“编程”类别的数据，并按模型提供商进行了分组，从中可以看出一些有趣的市场趋势。数据显示，从2024年12月到2025年2月期间，Anthropic公司的模型在编程场景下的流量占比曾高达约80%，表现得相当强势。

6/13/2025 9:12:00 AM

CVPR2025视频生成统一评估架构，上交x斯坦福联合提出让MLLM像人类一样打分

视频生成技术正以前所未有的速度革新着当前的视觉内容创作方式，从电影制作到广告设计，从虚拟现实到社交媒体，高质量且符合人类期望的视频生成模型正变得越来越重要。那么，要如何评估AI生成的视频是否符合人类的审美和需求呢？ Video-Bench视频评估框架，能够通过模拟人类的认知过程，建立起连接文本指令与视觉内容的智能评估体系。

6/13/2025 9:10:00 AM

LeCun世界模型出2代了！62小时搞定机器人训练，开启物理推理新时代

如何让AI代码补全更懂开发者？中兴通讯团队提出了两个新的评测指标，以及一套仓库级代码语料处理框架。按照团队的说法，这套方法论不仅为评测代码大模型提供了新视角，也为提升模型在真实工业场景中的代码补全性能开辟了新路径。

6/13/2025 9:10:00 AM

AI自动写学术综述：10分钟生成6万字，成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用，特别是在研究文献快速增长的时代。传统的人工驱动综述写作需要研究者审阅大量文章，既耗时又难以跟上最新进展。而现有的自动化综述生成方法面临诸多挑战：AI生成的综述结构往往缺乏连贯逻辑，组织结构较差，存在宽度和深度的结构失衡问题；在参考文献方面，经常无法引用真正相关和有影响力的文献，容易引用无关文献而忽略核心贡献；评估方式主要依赖LLM整体质量评估，缺乏对大纲质量、参考文献相关性等关键方面的细粒度分析。

6/13/2025 9:08:00 AM

黄仁勋发布量子计算专用CUDA！预言量子计算机几年内应用，但现在还离不开GB200

“量子计算正在到达一个拐点。 ”在GTC巴黎的演讲中，英伟达CEO黄仁勋对量子计算给出了新的论断。这次，老黄一改此前“实用量子计算机还要20年”的观点，预言量子计算机的实际应用在几年内就能实现。

6/13/2025 9:06:00 AM

256块NPU训成8B视频模型、超越Sora等一众闭源！抖音内容技术团队开源ContentV

近日，抖音内容技术团队开源了 ContentV，一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上，使用 256 块 NPU，在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限，ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。

6/13/2025 9:03:00 AM

黄仁勋亲述：当年如何把“价值数十亿美金”的首台AI超算，亲手送给了OpenAI

老黄在法国巴黎最新演讲讲了一个小故事：OpenAI如何获得全世界第一台AI超级计算机。如今，当人们谈论这一波人工智能的浪潮时，英伟达（NVIDIA）和OpenAI是两个无法绕开的名字。前者是AI算力的基石，后者则用ChatGPT等产品引爆了全球的AI革命。

6/13/2025 9:02:18 AM

苹果AI发展深陷困境：Siri升级计划屡屡受挫，多次跳票面临尴尬境地

在科技行业全力奔赴 AI 未来的进程中，苹果公司却在 AI 赛道上举步维艰，尤其是其核心语音助手 Siri 的升级计划，更是麻烦不断，陷入了难以挣脱的泥沼。自 2024 年苹果在全球开发者大会（WWDC）上首次展示 Siri 智能升级功能，试图重塑其在 AI领域的形象以来，这场 AI 革新之旅就充满了坎坷。按照最初规划，新一代 Siri 功能将在 iOS 18.4 .

6/13/2025 8:53:44 AM

小菲