告别GPT！最强AI编程神器Cursor自研核心模型，速度快4倍，AI创业公司大佬：这是我用过最疯狂的模型之一！网友：性价比不俗

编辑 | 听雨出品 | 51CTO技术栈（微信号：blog51cto）这两天真是大事不断。 AI 编程工具 Cursor 背后的初创公司 Anysphere，在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。 Composer 是一款专为生产级环境设计的高性能编程模型，旨在让 AI 能更快、更精准地执行真实软件开发任务。

编辑 | 听雨

出品 | 51CTO技术栈（微信号：blog51cto）

这两天真是大事不断。

AI 编程工具 Cursor 背后的初创公司 Anysphere，在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。

Composer 是一款专为生产级环境设计的高性能编程模型，旨在让 AI 能更快、更精准地执行真实软件开发任务。这意味着 Cursor 不再只是调用第三方模型（如 GPT 或 Claude），而是进入了自主构建核心模型的新阶段。

值得注意的是，Composer 已在 Cursor 自家工程团队的日常开发中投入使用，这表明它的稳定性与成熟度已经达到了可生产的水准。

告别GPT！最强AI编程神器Cursor自研核心模型，速度快4倍，AI创业公司大佬：这是我用过最疯狂的模型之一！网友：性价比不俗

极速模型：30秒内完成大多数交互

Cursor 表示，Composer 在大多数任务中可在 30 秒内完成响应，同时在复杂代码库中仍保持高水平的逻辑推理与理解能力。

知名开发者、t3.gg的创始人兼CEO Theo在 X 上表示：Composer是我用过最疯狂的模型之一！又快又聪明。

图片

官方介绍Composer“比同类智能模型快 4 倍”，并专为 Agentic 工作流而设计——也就是多个自主代理可协作完成编码、规划、测试与审查等任务。

Cursor 研究员 Sasha Rush 在 X上分享了 Composer 的基准性能图表，展示了其在多个模型类别中的领先表现。

图片

Cursor 为 Composer 构建了名为 Cursor Bench 的内部基准体系，数据来自真实开发者在平台上的代理请求。

该测试不仅评估代码正确性，还考察模型是否遵循项目的既有抽象层次、代码风格与工程实践。

结果显示，Composer 达到了前沿级（frontier-level）编程智能，生成速度高达每秒 250 个 token ——这约是现有“快速推理模型”的两倍，且比同类顶级模型快四倍。

官方将测试模型划分为以下几类：

Best Open（如 Qwen Coder、GLM 4.6）
Fast Frontier（如 Haiku 4.5、Gemini Flash 2.5）
Frontier 7/2025（年中最佳模型）
Best Frontier（GPT-5、Claude Sonnet 4.5）

Composer 在智能水平上接近中端 Frontier 模型，但在生成速度上居所有模型之首。

在此之前，Cursor 以其独特的 “vibe coding” 模式受到欢迎 —— 用户只需用自然语言描述功能，即便不是开发者，也能让 AI 自动生成代码。

旧版 Cursor 主要基于第三方模型，如 OpenAI、Anthropic、Google 和 xAI 等。而 Composer 的出现，标志着 Cursor 拥有了自有核心智能模型，但用户仍可选择这些外部模型进行对比使用。

模型架构：强化学习 + Mixture-of-Experts

Cursor 研究员 Sasha Rush 在 X 上透露，Composer 是一个基于强化学习（RL）训练的专家混合模型（MoE）：

“我们使用强化学习训练了一个大型 MoE 模型，使它能在真实编程任务中表现出色，同时保持极高速度。”

图片

Image

Rush 进一步解释说，Cursor 团队在设计 Composer 时，与 Cursor 的开发环境同步共建，以确保模型能在生产级规模下高效运行：

“与其他机器学习系统不同，编程智能体几乎不能抽象出实验环境。我们让模型与产品共同设计，使其能在必要规模下运行。”

Allen Institute for AI的机器学习研究员Nathan Lambert也对 Composer 模型强化学习（RL）训练成果大加赞赏：

“我特别喜欢这种漂亮的强化学习训练缩放曲线图。相比推理阶段的缩放曲线（inference-time scaling plots），这种图往往被忽视了。”

图片

真实任务驱动的训练方式

Composer 并非在静态数据集上训练，而是在真实的工程场景中学习。训练期间，模型运行在完整的代码库中，能使用一整套生产工具，包括：

文件编辑
语义搜索
终端命令

每次训练迭代，模型都会解决一个具体任务 —— 可能是生成代码修改、编写方案、或给出精准解释。

强化学习环节同时优化正确性与效率：Composer 学会了如何合理使用工具、并行处理任务、减少冗余输出。在训练后期，模型甚至出现了“自发行为”，例如：

自动运行单元测试
修复语法/规范错误
进行多步代码搜索

这种设计让 Composer 能在与用户相同的开发环境中运作，完全贴合真实编程场景，支持版本控制、依赖管理与迭代测试。

从原型 “Cheetah” 到正式版 Composer

Composer 的诞生基于早期内部原型 Cheetah，Cheetah 主要用于验证低延迟推理的可行性。

Rush 在 X 上写道：

“Cheetah 是该模型的 v0 版本，主要测试速度。Composer 的速度与之相同，但智能程度高出许多。”

图片

Cursor（Anysphere）的联合创始人兼 CEO Aman Sanger也表示：Cheetah 是 Composer-1 的早期原型。

图片

Cheetah 的成功让 Cursor 意识到：“响应速度是开发者信任与使用体验的关键。”

Composer 在保持速度的同时，显著提升了推理能力与任务泛化水平。

一位早期测试者表示：

“它快到让我可以一直保持在思考循环中工作。”

Composer 延续了这种实时交互的体验，并拓展到多步骤编码、重构与测试任务。

Cursor 2.0 集成：多代理协作与安全执行

Composer 深度集成于 Cursor 2.0 的全新多智能体平台中。用户可最多同时运行 8 个代理，每个代理在独立的工作区（通过 git worktree 或远程机器）中执行任务。开发者可以让多个代理并行尝试同一任务，并对比结果后择优采用。

图片

Cursor内部开发者 Jason Ginsberg 在X上评价：在 Cursor 里运行一个网页 Agent 的感觉，更像是在作画而不是写代码。

图片

此外，Cursor 2.0 还带来了多项配套升级：

内嵌浏览器（正式版）：代理可在 IDE 内直接运行与测试代码，并将 DOM 信息传递给模型。
改进的代码审查界面：可跨多文件查看模型修改，提升审阅效率。
安全沙盒终端（正式版）：代理运行的 shell 命令在沙盒中隔离执行，确保本地安全。
语音模式（Voice Mode）：支持语音指令触发与管理智能体。

训练基础设施：为强化学习而重构

为支持大规模 RL 训练，Cursor 自研了强化学习训练架构：

基于 PyTorch + Ray 的异步分布式系统；
开发了专用 MXFP8 MoE 内核，结合专家并行与混合分片数据并行；
可在上千张 NVIDIA GPU 上低精度原生训练；
避免了训练后量化的复杂性，显著提高推理效率。

训练过程中，Composer 在云端运行数十万并行沙盒环境，每个都是独立的开发工作区。为承载这些动态工作负载，Cursor 重写了虚拟机调度器，使训练环境与生产环境完全打通。

企业功能与订阅体系

Cursor 针对企业用户也提供了 Composer 的管理与安全功能：

管理员可集中控制终端沙盒策略、Git 访问与网络权限；
支持 Hooks 分发、团队规则管理与操作审计日志；
提供团队层级的使用监控与性能分析。

价格层级：

个人用户：从免费版（Hobby）到 Ultra（$200/月）；
团队版起价 $40/人/月，企业用户可定制合规与访问方案。

模型来源的疑问

不过，开源工具Datasette的创建者、Django 框架联合创始人Simon Willson 以及一些网友都注意到了一个细节，那就是官方说明中并没有解释模型的来源：

他们是否从零开始训练模型？还是基于某个现有的开源模型（例如 Qwen 或 GLM 系列）进行微调？

Sasha Rush 最近在 Hacker News 上回答了一些相关问题，但在谈到模型基础时态度仍然相当含糊。

当有人直接提问：“Composer 是否是在某个开源基础模型上微调得到的？”Sasha 的回答是：

“我们的主要关注点在于强化学习后的训练（RL post-training）。我们认为这才是让模型成为强大交互式代理的最佳途径。”

另外，Sasha 还否认了一个流传已久的传闻：有用户猜测早期的 Cursor 预览模型 Cheetah 是基于 xAI 的 Grok 构建的。对此 Sasha 回应：

“那完全是假的（Straight up untrue）。”

Composer 在 AI 编程中的意义

与 GitHub Copilot 或 Replit Agent 不同，Composer 的核心创新在于：它并非一个“被动补全引擎”，而是一个能主动规划、执行与验证代码的高交互智能体。

这种让模型在真实开发环境中训练、运行、验证的思路，是迈向自主软件开发的关键一步。

Rush 总结道：

“要让模型在现实中可靠运行，就必须让它在真实环境中学习。它不仅要会写代码，更要学会在上下文中测试与改进。”

网友评价：响应速度快，性价比不俗

Composer-1 发布后，Reddit社区反响也是相当热烈。很多网友一致认为它“速度极快、交互顺滑”，并且在解决特定编程任务时非常智能。

图片

有网友表示，自己卡了一周的问题，Composer几分钟内就解决了。

图片

还有网友对比测试了对比测试了 Claude 4.5 Sonnet 和 Composer-1，结论是：

Composer 比 Sonnet快了3分钟完成任务
虽然 token 用量多了 20%，但价格便宜 73%
每 1K token 成本便宜约 4.5 倍

图片

另外，已经有手快的网友整理了不同模型的API定价表，可以看出Composer的性价比还是很高的。

图片

此外，也有一些开发者质疑多 Agent 并行开发的模式，认为实用性有限，容易浪费 Token等等。

图片

Cursor 2.0 现已开放下载，你可以访问 cursor.com 获取最新版本。大家都快去体验起来！

那么评论区的各位大佬：

你觉得Composer的表现如何呢？

有哪些你觉得好用的功能或设计？

参考链接：

https://cursor.com/cn/blog/2-0

https://cursor.com/cn/blog/composer

https://venturebeat.com/ai/vibe-coding-platform-cursor-releases-first-in-house-llm-composer-promising

https://simonwillison.net/2025/Oct/29/cursor-composer/

告别GPT！最强AI编程神器Cursor自研核心模型，速度快4倍，AI创业公司大佬：这是我用过最疯狂的模型之一！网友：性价比不俗

极速模型：30秒内完成大多数交互

模型架构：强化学习 + Mixture-of-Experts

真实任务驱动的训练方式

从原型 “Cheetah” 到正式版 Composer

Cursor 2.0 集成：多代理协作与安全执行

企业功能与订阅体系

模型来源的疑问

Composer 在 AI 编程中的意义

网友评价：响应速度快，性价比不俗

参考链接：

相关资讯

OpenAI 投的代码工具 Cursor“叛变”了：默认使用 Claude，程序员叫好

如何用Cursor+Claude两个神器，两步完成APP开发？

AI编程实战！零基础小白如何用Cursor独立开发网站？