月之暗面回应 Kimi K2 模型 API 速度慢：正在优化推理效率，也在加卡加机器

作者：浩渺 2025-07-15 07:52

AI在线 7 月 15 日消息，月之暗面今晚发文回应 Kimi K2 模型 API 速度慢：“主要问题是访问量大模型体积大。我们正在全力优化推理效率，也在加卡加机器。 ”同时，月之暗面还提到 KimiK2 是完全开源的，大家也可以通过其他模型供应商接入使用（比如硅基流动、无问芯穹等）。

AI在线 7 月 15 日消息，月之暗面今晚发文回应 Kimi K2 模型 API 速度慢：“主要问题是访问量大 + 模型体积大。我们正在全力优化推理效率，也在加卡加机器。预计这几天内速度会有明显提升。”

同时，月之暗面还提到 KimiK2 是完全开源的，大家也可以通过其他模型供应商接入使用（比如硅基流动、无问芯穹等）。也欢迎自行部署。

据AI在线此前报道，月之暗面 7 月 11 日正式发布 Kimi K2 模型，并同步开源。Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型，总参数 1T，激活参数 32B。

Kimi K2 的 API 服务现已全面上线，支持最长 128K 上下文，具备更强的通用性与工具调用能力。计费方案如下：

每百万输入 tokens：4 元
每百万输出 tokens：16 元

Kimi K2高速版发布输出速度提升至每秒40 Tokens

Kimi开放平台发布Kimi K2 高速版。新款模型命名为kimi-k2-turbo-preview，参数规模与现有kimi-k2 保持一致，但输出速度由每秒10 Tokens提升至每秒40 Tokens，显著提升使用效率。此次升级旨在优化用户体验，满足更高实时性需求的应用场景。

8/1/2025 2:12:08 PM AI在线

Kimi K2 高速版kimi-k2-turbo-preview发布输出每秒 40 Tokens

kimi-k2-turbo-preview，即Kimi K2高速版正式发布。据悉，该高速版模型在参数设置上与原版kimi-k2保持一致，但在性能上实现了显著提升，输出速度从原先的每秒10Tokens大幅跃升至每秒40Tokens，为用户带来更加流畅高效的使用体验。为庆祝Kimi K2高速版的发布，官方特别推出限时5折特惠活动，该优惠将持续至9月1日，之后将恢复原价。

8/1/2025 2:12:12 PM AI在线

Kimi K2 High-Speed Version Released, Output Speed Increased to 40 Tokens per Second

The Kimi Open Platform has launched Kimi K2 Speed Edition. The new model is named kimi-k2-turbo-preview, with the same parameter scale as the existing kimi-k2, but the output speed has increased from 10 Tokens per second to 40 Tokens per second, significantly improving usage efficiency. This upgrade aims to optimize user experience and meet application scenarios requiring higher real-time performance.

8/2/2025 4:35:53 PM AI在线

月之暗面回应 Kimi K2 模型 API 速度慢：正在优化推理效率，也在加卡加机器

相关资讯

Kimi K2高速版发布 输出速度提升至每秒40 Tokens

Kimi K2 高速版kimi-k2-turbo-preview发布 输出每秒 40 Tokens

Kimi K2 High-Speed Version Released, Output Speed Increased to 40 Tokens per Second

Kimi K2高速版发布输出速度提升至每秒40 Tokens

Kimi K2 高速版kimi-k2-turbo-preview发布输出每秒 40 Tokens