AI在线 AI在线

告别GPT!最强AI编程神器Cursor自研核心模型,速度快4倍,AI创业公司大佬:这是我用过最疯狂的模型之一!网友:性价比不俗

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)这两天真是大事不断。 AI 编程工具 Cursor 背后的初创公司 Anysphere,在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。 Composer 是一款专为生产级环境设计的高性能编程模型,旨在让 AI 能更快、更精准地执行真实软件开发任务。

编辑 | 听雨

出品 | 51CTO技术栈(微信号:blog51cto)

这两天真是大事不断。

AI 编程工具 Cursor 背后的初创公司 Anysphere,在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。

Composer 是一款专为生产级环境设计的高性能编程模型,旨在让 AI 能更快、更精准地执行真实软件开发任务。这意味着 Cursor 不再只是调用第三方模型(如 GPT 或 Claude),而是进入了自主构建核心模型的新阶段。

值得注意的是,Composer 已在 Cursor 自家工程团队的日常开发中投入使用,这表明它的稳定性与成熟度已经达到了可生产的水准。

告别GPT!最强AI编程神器Cursor自研核心模型,速度快4倍,AI创业公司大佬:这是我用过最疯狂的模型之一!网友:性价比不俗

极速模型:30秒内完成大多数交互

Cursor 表示,Composer 在大多数任务中可在 30 秒内完成响应,同时在复杂代码库中仍保持高水平的逻辑推理与理解能力。

知名开发者、t3.gg的创始人兼CEO Theo在 X 上表示:Composer是我用过最疯狂的模型之一!又快又聪明。

图片图片

官方介绍Composer“比同类智能模型快 4 倍”,并专为 Agentic 工作流 而设计——也就是多个自主代理可协作完成编码、规划、测试与审查等任务。

Cursor 研究员 Sasha Rush 在 X上分享了 Composer 的基准性能图表,展示了其在多个模型类别中的领先表现。

图片图片

Cursor 为 Composer 构建了名为 Cursor Bench 的内部基准体系,数据来自真实开发者在平台上的代理请求。

该测试不仅评估代码正确性,还考察模型是否遵循项目的既有抽象层次、代码风格与工程实践。

结果显示,Composer 达到了前沿级(frontier-level)编程智能,生成速度高达每秒 250 个 token ——这约是现有“快速推理模型”的两倍,且比同类顶级模型快四倍。

官方将测试模型划分为以下几类:

  • Best Open(如 Qwen Coder、GLM 4.6)
  • Fast Frontier(如 Haiku 4.5、Gemini Flash 2.5)
  • Frontier 7/2025(年中最佳模型)
  • Best Frontier(GPT-5、Claude Sonnet 4.5)

Composer 在智能水平上接近中端 Frontier 模型,但在生成速度上居所有模型之首。

在此之前,Cursor 以其独特的 “vibe coding” 模式受到欢迎 —— 用户只需用自然语言描述功能,即便不是开发者,也能让 AI 自动生成代码。

旧版 Cursor 主要基于第三方模型,如 OpenAI、Anthropic、Google 和 xAI 等。而 Composer 的出现,标志着 Cursor 拥有了自有核心智能模型,但用户仍可选择这些外部模型进行对比使用。

模型架构:强化学习 + Mixture-of-Experts

Cursor 研究员 Sasha Rush 在 X 上透露,Composer 是一个基于强化学习(RL) 训练的专家混合模型(MoE):

“我们使用强化学习训练了一个大型 MoE 模型,使它能在真实编程任务中表现出色,同时保持极高速度。”

图片图片

ImageImage

Rush 进一步解释说,Cursor 团队在设计 Composer 时,与 Cursor 的开发环境同步共建,以确保模型能在生产级规模下高效运行:

“与其他机器学习系统不同,编程智能体几乎不能抽象出实验环境。我们让模型与产品共同设计,使其能在必要规模下运行。”

Allen Institute for AI的机器学习研究员Nathan Lambert也对 Composer 模型强化学习(RL)训练成果大加赞赏:

“我特别喜欢这种漂亮的强化学习训练缩放曲线图。相比推理阶段的缩放曲线(inference-time scaling plots),这种图往往被忽视了。”

图片图片

真实任务驱动的训练方式

Composer 并非在静态数据集上训练,而是在真实的工程场景中学习。训练期间,模型运行在完整的代码库中,能使用一整套生产工具,包括:

  • 文件编辑
  • 语义搜索
  • 终端命令

每次训练迭代,模型都会解决一个具体任务 —— 可能是生成代码修改、编写方案、或给出精准解释。

强化学习环节同时优化正确性与效率:Composer 学会了如何合理使用工具、并行处理任务、减少冗余输出。在训练后期,模型甚至出现了“自发行为”,例如:

  • 自动运行单元测试
  • 修复语法/规范错误
  • 进行多步代码搜索

这种设计让 Composer 能在与用户相同的开发环境中运作,完全贴合真实编程场景,支持版本控制、依赖管理与迭代测试。

从原型 “Cheetah” 到正式版 Composer

Composer 的诞生基于早期内部原型 Cheetah,Cheetah 主要用于验证低延迟推理的可行性。

Rush 在 X 上写道:

“Cheetah 是该模型的 v0 版本,主要测试速度。Composer 的速度与之相同,但智能程度高出许多。”

图片图片

Cursor(Anysphere) 的联合创始人兼 CEO Aman Sanger也表示:Cheetah 是 Composer-1 的早期原型。

图片图片

Cheetah 的成功让 Cursor 意识到:“响应速度是开发者信任与使用体验的关键。”

Composer 在保持速度的同时,显著提升了推理能力与任务泛化水平。

一位早期测试者表示:

“它快到让我可以一直保持在思考循环中工作。”

Composer 延续了这种实时交互的体验,并拓展到多步骤编码、重构与测试任务。

Cursor 2.0 集成:多代理协作与安全执行

Composer 深度集成于 Cursor 2.0 的全新多智能体平台中。用户可最多同时运行 8 个代理,每个代理在独立的工作区(通过 git worktree 或远程机器)中执行任务。开发者可以让多个代理并行尝试同一任务,并对比结果后择优采用。

图片图片

Cursor内部开发者 Jason Ginsberg 在X上评价:在 Cursor 里运行一个网页 Agent 的感觉,更像是在作画而不是写代码。

图片图片

此外,Cursor 2.0 还带来了多项配套升级:

  • 内嵌浏览器(正式版):代理可在 IDE 内直接运行与测试代码,并将 DOM 信息传递给模型。
  • 改进的代码审查界面:可跨多文件查看模型修改,提升审阅效率。
  • 安全沙盒终端(正式版):代理运行的 shell 命令在沙盒中隔离执行,确保本地安全。
  • 语音模式(Voice Mode):支持语音指令触发与管理智能体。

训练基础设施:为强化学习而重构

为支持大规模 RL 训练,Cursor 自研了强化学习训练架构:

  • 基于 PyTorch + Ray 的异步分布式系统;
  • 开发了专用 MXFP8 MoE 内核,结合专家并行与混合分片数据并行;
  • 可在上千张 NVIDIA GPU 上低精度原生训练;
  • 避免了训练后量化的复杂性,显著提高推理效率。

训练过程中,Composer 在云端运行 数十万并行沙盒环境,每个都是独立的开发工作区。为承载这些动态工作负载,Cursor 重写了虚拟机调度器,使训练环境与生产环境完全打通。

企业功能与订阅体系

Cursor 针对企业用户也提供了 Composer 的管理与安全功能:

  • 管理员可集中控制终端沙盒策略、Git 访问与网络权限;
  • 支持 Hooks 分发、团队规则管理与操作审计日志;
  • 提供团队层级的使用监控与性能分析。
价格层级:
  • 个人用户:从 免费版(Hobby) 到 Ultra($200/月);
  • 团队版起价 $40/人/月,企业用户可定制合规与访问方案。

模型来源的疑问

不过,开源工具Datasette的创建者、Django 框架联合创始人Simon Willson 以及一些网友都注意到了一个细节,那就是官方说明中并没有解释模型的来源:

他们是否从零开始训练模型?还是基于某个现有的开源模型(例如 Qwen 或 GLM 系列)进行微调?

Sasha Rush 最近在 Hacker News 上回答了一些相关问题,但在谈到模型基础时态度仍然相当含糊。

当有人直接提问:“Composer 是否是在某个开源基础模型上微调得到的?”Sasha 的回答是:

“我们的主要关注点在于 强化学习后的训练(RL post-training)。我们认为这才是让模型成为强大交互式代理的最佳途径。”

另外,Sasha 还否认了一个流传已久的传闻:有用户猜测早期的 Cursor 预览模型 Cheetah 是基于 xAI 的 Grok 构建的。对此 Sasha 回应:

“那完全是假的(Straight up untrue)。”

Composer 在 AI 编程中的意义

与 GitHub Copilot 或 Replit Agent 不同,Composer 的核心创新在于:它并非一个“被动补全引擎”,而是一个能主动规划、执行与验证代码的高交互智能体。

这种让模型在真实开发环境中训练、运行、验证的思路,是迈向自主软件开发的关键一步。

Rush 总结道:

“要让模型在现实中可靠运行,就必须让它在真实环境中学习。它不仅要会写代码,更要学会在上下文中测试与改进。”

网友评价:响应速度快,性价比不俗

Composer-1 发布后,Reddit社区反响也是相当热烈。很多网友一致认为它“速度极快、交互顺滑”,并且在解决特定编程任务时非常智能。

图片图片

有网友表示,自己卡了一周的问题,Composer几分钟内就解决了。

图片图片

还有网友对比测试了对比测试了 Claude 4.5 Sonnet 和 Composer-1,结论是:
  • Composer 比 Sonnet快了3分钟完成任务
  • 虽然 token 用量多了 20%,但价格便宜 73%
  • 每 1K token 成本便宜约 4.5 倍

图片图片

另外,已经有手快的网友整理了不同模型的API定价表,可以看出Composer的性价比还是很高的。

图片图片

此外,也有一些开发者质疑多 Agent 并行开发的模式,认为实用性有限,容易浪费 Token等等。

图片图片

Cursor 2.0 现已开放下载,你可以访问 cursor.com 获取最新版本。大家都快去体验起来!

那么评论区的各位大佬:

你觉得Composer的表现如何呢?

有哪些你觉得好用的功能或设计?

参考链接:

https://cursor.com/cn/blog/2-0

https://cursor.com/cn/blog/composer

https://venturebeat.com/ai/vibe-coding-platform-cursor-releases-first-in-house-llm-composer-promising

https://simonwillison.net/2025/Oct/29/cursor-composer/

相关资讯

OpenAI 投的代码工具 Cursor“叛变”了:默认使用 Claude,程序员叫好

我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是 Claude-3.5-Sonnet 来接待。
8/15/2024 3:09:43 PM
汪淼

如何用Cursor+Claude两个神器,两步完成APP开发?

最近在 X 上看到了一些人在用 Claude 3.7 Sonnet 生成 App 原型图的尝试,受到启发,发现这么生成不同界面的原型图再让 Cursor 基于原型图开发 App 会是很好的尝试。 尤其是,你也可以不两步直接生成,而是在过程中更可视化地思考你要生成的原型,这对于非专业的产品经理来说,会是好得多的方式。 我今天做了些尝试后,效果让我感到惊艳。
3/11/2025 12:45:03 AM
果汁

AI编程实战!零基础小白如何用Cursor独立开发网站?

自 24 年 11 月起,我开始动手打造一个专注于 AI 视频作品展示 的网站。 在 AI 的助力下,我独立完成了 前后端与插件开发,成功落地了人生第一款真正意义上的个人作品。 目前,网站已收录 300 优秀 AI 视频。
3/28/2025 6:30:34 AM
Bay的设计奥德赛
  • 1