AI在线 AI在线

月之暗面回应 Kimi K2 模型 API 速度慢:正在优化推理效率,也在加卡加机器

AI在线 7 月 15 日消息,月之暗面今晚发文回应 Kimi K2 模型 API 速度慢:“主要问题是访问量大 模型体积大。 我们正在全力优化推理效率,也在加卡加机器。 ”同时,月之暗面还提到 KimiK2 是完全开源的,大家也可以通过其他模型供应商接入使用(比如硅基流动、无问芯穹等)。

AI在线 7 月 15 日消息,月之暗面今晚发文回应 Kimi K2 模型 API 速度慢:“主要问题是访问量大 + 模型体积大。我们正在全力优化推理效率,也在加卡加机器。预计这几天内速度会有明显提升。”

同时,月之暗面还提到 KimiK2 是完全开源的,大家也可以通过其他模型供应商接入使用(比如硅基流动、无问芯穹等)。也欢迎自行部署。

月之暗面回应 Kimi K2 模型 API 速度慢:正在优化推理效率,也在加卡加机器

据AI在线此前报道,月之暗面 7 月 11 日正式发布 Kimi K2 模型,并同步开源。Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。

Kimi K2 的 API 服务现已全面上线,支持最长 128K 上下文,具备更强的通用性与工具调用能力。计费方案如下:

  • 每百万输入 tokens:4 元

  • 每百万输出 tokens:16 元

相关资讯

月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务

AI在线 7 月 11 日消息,月之暗面今晚正式发布 Kimi K2 模型,并同步开源。 Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。 在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。
7/11/2025 11:00:41 PM
汪淼

深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?

没想到,Kimi 的首个基础大模型开源这么快就来了。 昨晚,月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格是 16 元人民币 / 百万 token 输出。 这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术节点。
7/12/2025 9:23:00 PM
机器之心

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。
2/27/2025 2:22:00 PM
郑佳美
  • 1