AI在线 AI在线

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

美国顶流AI产品“套壳”中国开源大模型,这事儿上“热搜”了(doge)。 𝕏网友都在感叹:大家都认为中国大模型正在迎头赶上。 不,它们已经赶上了。

美国顶流AI产品“套壳”中国开源大模型,这事儿上“热搜”了(doge)。

𝕏网友都在感叹:大家都认为中国大模型正在迎头赶上。不,它们已经赶上了。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

事情是这么个事情:

AI编程TOP应用Cursor和Windsurf最近不是前后脚发了新模型嘛。前者打出“自家首个编码模型”、“智能体编程最佳方式”的旗号,后者自称“速度新标杆”。

您猜怎么着?

有网友发现,Cursor的这个Composer-1怎么干着干着活就唠起中文来了?

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

Windsurf的SWE-1.5背后,则很有可能是智谱的GLM 4.6……

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

“基于领先开源模型”

Cursor自家首个模型Composer随着Cursor 2.0新版本发布,是一个“编程智能体模型”。

官方的说法是,该模型专为在Cursor中进行低延迟的代理式编码而打造,大多数任务都能在30秒内完成。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

同样,Windsurf的新模型SWE-1.5也主打一个快速:

和芯片厂商Cerebras合作,速度能达到每秒950个token,是Claude Haiku 4.5的6倍,Sonnet 4.5的13倍。

基础模型方面,Cursor官方有点支支吾吾:

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

Windsurf这边则明确写了:SWE-1.5是在“领先的开源模型基础上”,使用定制Agent框架和真实环境中的端到端强化学习打造的。

至于是哪家开源模型,Windsurf也没有明说。

但在Hacker News上,有人直接点明:Cursor和Windsurf新模型背后都是智谱的GLM。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

此言并非空穴来风,Cursor这个新模型被发现,会推理着推理着就开始说中文:

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

还有人发现,Cursor Composer-1和DeepSeek用的是同样的分词器。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

Windsurf这边,还被直接套话,“狼人自爆”:我是由智谱开发的GLM。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

事情一发酵,网友们炸了锅。

歪果网友be like:我们应该开始学中文了?

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

还有国内网友调侃:这边一开源,那边就自研。(doge)

理性来说,中国在开源领域确实走在前列。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

事实上,中国的开源模型在各种开源性能榜单上占满TOP5、甚至TOP10早已不是新闻。下载量上也可见一斑——Qwen3是HuggingFace上下载量最高的模型之一。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

并且不仅物美,还很价廉。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

那么对于不少初创公司而言,问题就只剩下……

DeepSeek,Qwen,还是GLM?(手动狗头)

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

不过,也有人认为,这与“套壳”无关,是训练语料的事。

Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜

Anyway,对于初创公司而言,在现在这个阶段,从0开始花费数百上千万美刀去训练模型,本就是不符合商业逻辑的事。

在越来越强大且越来越便宜的开源模型基础上构建应用、打造垂类模型已经成为理性之选。

而现在,恰恰是中国开源力量,站在舞台中央。

相关资讯

微软等开源AIOpsLab,可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了,一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务,实现故障的自动化检测、定位和解决问题。 还具备高度的可观测性,能够收集和分析关键的遥测数据,确保对系统状态和应用环境的深入洞察。
1/27/2025 9:51:24 AM
AIGC开放社区

DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注,位居应用商店排行榜首位并改变了股市。 随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B,该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3,并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。 性能表现:小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数(约为GPT-4的1/25),却在关键测试中碾压对手:文生图质量:在GenEval测试中以80%准确率击败DALL-E 3(67%)和Stable Diffusion 3(74%)复杂指令理解:在DPG-Bench测试中达84.19%准确率,能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答:视觉问答准确率超越GPT-4V,MMBench测试得分79.2分接近专业分析模型技术突破:像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片,如同让厨师同时设计菜单和炒菜。
2/7/2025 11:00:00 AM
AIGC Studio

李飞飞、DeepSeek为何偏爱这个国产模型?

斯坦福李飞飞团队的一篇论文,近来在AI圈子掀起了一场飓风。 他们仅用1000个样本,在16块H100上监督微调26分钟,训出的新模型s1-32B,竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力! 团队也再次证明了测试时Scaling的威力。
2/8/2025 9:30:00 AM
新智元
  • 1