月之暗面
Claude不让我们用!国产平替能顶上吗?
这几天,全球 AI 代码生成的竞争格局,迎来了新的拐点。 在编程领域,曾被视为王者的 Anthropic,似乎正在一步步失去昔日的锋芒,地位开始动摇。 这一方面源于 OpenAI GPT-5 系列模型的强势崛起,在与 Claude Code 的对战中大有「后来者居上」之势,AI 大神 Karpathy 现身说法并开始安利 GPT-5 Pro 的强大代码能力。
9/7/2025 4:45:00 PM
机器之心
Kimi K2-0905 上线 Discord,仍无思考与视觉能力
9月5日,月之暗面(Moonshot AI) 在其官方 Discord 发布新版本 Kimi K2-0905 模型。 据介绍,新版本重点提升了 编程能力,同时在 创意写作 方面也有增强。 这是是继2025年7月发布全球首个人工智能开源万亿参数模型Kimi K2之后的又一重要进展。
9/4/2025 12:30:57 PM
AI在线
Kimi K2 高速版 AI 模型再提速,输出速度达每秒 100 Tokens
近日,月之暗面发布了有关 Kimi K2 高速版 AI 模型的最新消息。 经过工程师们的努力,Kimi K2 turbo-preview 模型的输出速度得到了显著提升,目前稳定输出速度已达到每秒 60 Tokens,最高可达每秒 100 Tokens。 这一进步标志着该模型在处理数据时的效率大幅提高,用户在应用时能够体验到更为流畅的服务。
8/22/2025 6:21:26 PM
AI在线
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
AI在线 8 月 1 日消息,月之暗面今日发布 Kimi K2 高速版 ——Kimi-K2-turbo-preview,模型参数与 Kimi-K2 一致,但输出速度由每秒 10 Tokens 提升至每秒 40 Tokens。 据介绍,该模型目前限时 5 折特惠,9 月 1 日恢复原价,折扣后的价格:模型每百万 tokens 输入价格(缓存命中)2 元,输入价格(缓存未命中)8 元,输出价格 32 元。 据AI在线此前报道,月之暗面 7 月 11 日正式发布 Kimi K2 模型,并同步开源。
8/1/2025 1:49:43 PM
浩渺
月之暗面回应 Kimi K2 模型 API 速度慢:正在优化推理效率,也在加卡加机器
AI在线 7 月 15 日消息,月之暗面今晚发文回应 Kimi K2 模型 API 速度慢:“主要问题是访问量大 模型体积大。 我们正在全力优化推理效率,也在加卡加机器。 ”同时,月之暗面还提到 KimiK2 是完全开源的,大家也可以通过其他模型供应商接入使用(比如硅基流动、无问芯穹等)。
7/15/2025 7:52:08 PM
浩渺
Perplexity CEO 称赞月之暗面,希望基于 Kimi K2 进行后训练
AI在线 7 月 13 日消息,美国 AI 初创公司 Perplexity 的 CEO 阿拉温德(Aravind Srinivas)今日发文称,月之暗面 Kimi K2 模型在测试中良好表现,公司后续可能会基于 K2 进行后训练。 Live Mint 今年 1 月报道显示,此前 DeepSeek R1 也曾被 Perplexity 用于模型训练。 Kimi K2 是月之暗面 Kimi 昨日刚发布的旗下首个万亿参数开源模型,强调代码能力和通用 Agent 任务能力。
7/13/2025 2:27:46 PM
问舟
深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
没想到,Kimi 的首个基础大模型开源这么快就来了。 昨晚,月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格是 16 元人民币 / 百万 token 输出。 这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术节点。
7/12/2025 9:23:00 PM
机器之心
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
AI在线 7 月 11 日消息,月之暗面今晚正式发布 Kimi K2 模型,并同步开源。 Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。 在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。
7/11/2025 11:00:41 PM
汪淼
月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测
近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。 这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。 Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。
6/21/2025 10:01:04 AM
AI在线
Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。
6/21/2025 8:34:54 AM
清源
开源新星 Kimi-Dev-72B:打破代码修复界限的 AI 神器
最近,备受关注的开源大型语言模型 Kimi-Dev-72B 正式上线,成为开发者们的新宠。 这款模型由 “月之暗面” 团队开发,专门为解决代码问题而设计,旨在提升编程效率。 Kimi-Dev-72B 在近期的 SWE-bench Verified 测试中展现了非凡的实力,尤其在修复 Docker 环境中的代码缺陷方面,表现得尤为出色。
6/17/2025 7:01:20 PM
AI在线
小米向月之暗面转让多枚“Kimi”商标
小米近日将多枚“Kimi”商标转让给北京月之暗面公司,后者为AI助手Kimi的开发者。此次转让或为小米优化非核心商标资源,月之暗面近期动作频繁,包括与小红书合作等。#小米商标转让# #AI助手Kimi#
6/3/2025 10:51:50 AM
远洋
月之暗面 Kimi 推出首个内容社区,开启用户互动新模式
月之暗面近日宣布正在进行其首个内容社区产品的灰度测试,旨在提升用户体验和留存率。 这款名为 Kimi 的产品早在去年底就开始了小范围的试用,目前终于迎来了更广泛的测试阶段。 据澎湃新闻报道,月之暗面是一家成立于2023年3月的公司,由有着清华背景的杨植麟团队领导。
4/15/2025 12:02:18 PM
AI在线
推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。
2/27/2025 2:22:00 PM
郑佳美
月之暗面推出新优化器Muon,计算效率大幅提升
近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。 这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库,引发了业内的高度关注和讨论。 Muon 优化器最初由 OpenAI 的研究者 Keller Jordan 等人在2024年提出,针对小规模模型训练时表现优异。
2/24/2025 3:53:00 PM
AI在线
月之暗面 Kimi 开源 Moonlight:30 亿 / 160 亿参数混合专家模型
“我们的模型不仅突破了当前的Pareto前沿,还在训练所需的FLOP数大幅减少的情况下,达到了比以往模型更优的性能。”
2/24/2025 8:53:18 AM
清源
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数,参阅报道《刚刚! DeepSeek 梁文锋亲自挂名,公开新注意力架构 NSA》。 但其实就在同一天,月之暗面也发布了一篇主题类似的论文,并且同样巧合的是,月之暗面创始人兼 CEO 杨植麟也是该论文的署名作者之一。
2/19/2025 3:02:25 PM
机器之心
月之暗面Kimi暂停大规模投流 战略重心转向底层模型
国内大模型初创公司月之暗面(Moonshot AI)近日因大幅削减市场投放预算再次引发业界关注。 据界面新闻报道,月之暗面已暂停多个安卓渠道及第三方广告平台的投放。 此前,月之暗面以激进的市场策略著称,2024年9月起每月在营销和流量获取上的投入高达近2亿元,重点投放平台包括小红书、B站、知乎等。
2/19/2025 9:27:00 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
苹果
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
生成
人形机器人
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
MCP