AI在线 AI在线

80%到25%逆转!大模型代码能力最新排名:Anthropic不再是唯一的神?

OpenRouter网站提供了一个很有意思的模型使用排行榜,它按照不同使用场景(如编程、写作等)进行了分类。 有人整理了其中“编程”类别的数据,并按模型提供商进行了分组,从中可以看出一些有趣的市场趋势。 数据显示,从2024年12月到2025年2月期间,Anthropic公司的模型在编程场景下的流量占比曾高达约80%,表现得相当强势。

OpenRouter网站提供了一个很有意思的模型使用排行榜,它按照不同使用场景(如编程、写作等)进行了分类。有人整理了其中“编程”类别的数据,并按模型提供商进行了分组,从中可以看出一些有趣的市场趋势。

图片

数据显示,从2024年12月到2025年2月期间,Anthropic公司的模型在编程场景下的流量占比曾高达约80%,表现得相当强势。这一数据也从侧面印证了当时的普遍观察:开发者们确实非常喜欢使用Claude 3.5。

图片

但之后,市场格局发生了变化。随着谷歌Gemini 2.5 Pro以及(在较小程度上)GPT-4.1的发布,这两个模型开始抢占Anthropic的市场份额,导致其占比一度跌至25%以下。

这几天,Anthropic发布了新一代的Claude 4模型,特别是其中的Sonnet模型,帮助其份额实现了大幅回升。尽管如此,其市场份额也远未回到之前约80%的巅峰水平。

当然,需要注意的是,OpenRouter的数据并不能完全代表整个市场,其使用量数据可能会因为少数大客户的集中使用或偶然的流量高峰而出现偏差。但这个趋势仍然说明了一个事实:激烈的市场竞争对用户来说是件好事。

OpenRouter是一个大型语言模型(LLM)的聚合器(Aggregator)或路由器(Router)

它本身不开发自己的模型,而是作为一个中间层平台,将来自不同顶级提供商(如OpenAI、Google、Anthropic、deepseek、Meta等)的众多模型整合到一个统一的API接口后面。

它的核心特点和作用包括:

  • 统一的API接口:开发者只需要使用OpenRouter的API,就可以调用来自不同公司的模型。它的API格式通常与OpenAI的格式兼容,这意味着你如果写过调用GPT-4的代码,几乎可以无缝切换到调用Claude 3、Gemini Pro或其他模型,大大降低了开发和切换成本
  • 访问众多模型:通过一个账户,你就可以使用市面上几乎所有主流和一些小众的AI模型。这对于需要比较不同模型性能、或者希望根据任务选择最合适模型的开发者来说非常方便
  • 统一计费和成本管理:你不需要去每个模型提供商那里单独注册、申请API Key和绑定信用卡。所有模型的用量都会在OpenRouter上统一计费,你只需要充值到一个账户即可,并且可以清晰地看到不同模型的花费
  • 智能路由功能 (Auto-Routing):这是它“路由器”名字的由来。OpenRouter提供一个特殊的“auto”模型,当你向它发送请求时,它可以根据你的提示词自动判断并选择当前性价比最高或性能最好的模型来处理,帮助用户实现成本和效果的平衡
  • 模型排行榜和发现新模型:OpenRouter会根据真实的用户使用数据生成模型排行榜。这不仅能反映市场趋势,也帮助开发者发现一些新发布或表现优异的小众模型。

相关资讯

截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」

OpenAI的首席执行官Sam Altman最近宣布,2025年将推出「虚拟员工计划」,代号Operator,AI智能体能够自主执行任务,如写代码、预订旅行等,成为企业中的「数字同事」。 抢在OpenAI发布Operator之前,清华、复旦和斯坦福的研究者联合提出了名为Eko的 Agent开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。 AI智能体能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。
1/22/2025 3:17:43 PM
新智元

817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式

在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。 特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。 然而,来自上海交通大学的最新研究却给出了一个令人震惊的答案:仅需 817 条精心设计的样本,就能让模型在数学竞赛级别的题目上超越当前许多最先进模型。
2/7/2025 9:00:00 AM
机器之心

DeepSeek 私有部署最强指南:满血推理,异构多机分布式,国产显卡无缝支持!

还还在为DeepSeek模型部署的各种难题抓狂? 各种教程的下载分片、合并模型、编译环境……这些繁琐的操作是不是让你头大? DeepSeek R1 火了,私有部署需求暴增,教程满天飞,但实际操作起来却麻烦得要命!
2/13/2025 10:12:27 AM
AI寒武纪
  • 1