月之暗面
Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍
                        闻乐 发自 凹非寺. 量子位 | 公众号 QbitAITransformer的时代,正在被改写。 月之暗面最新发布的开源Kimi Linear架构,用一种全新的注意力机制,在相同训练条件下首次超越了全注意力模型。
                    
                    10/31/2025 4:49:31 PM
                        闻乐
                    刚刚,Kimi开源新架构,开始押注线性注意力
                        Kimi 押注线性注意力,MiniMax 青睐全注意力,究竟哪条路能走得更远? 在智能体时代,推理的计算需求正成为一个核心瓶颈,尤其是在长时程和强化学习场景中。 此时,标准注意力机制中存在的低效问题变得更加突出。
                    
                    10/31/2025 1:00:00 PM
                        机器之心
                    Kimi k2性能被赞超越 GPT-5,月之暗面再获数亿美元重磅融资
                        据ZFinance消息, 国内大模型明星创业公司月之暗面(Moonshot AI)近日传出重磅消息,据 ZF 获悉,该公司即将完成新一轮数亿美元的融资。 此次融资距离月之暗面公开披露的上一轮约3亿美元融资仅过去不久(上一次公开信息为2024年8月),显示出资本市场对该公司的信心再次高涨。 这家曾被誉为“中国最受期待的大模型公司”之一的企业,在今年初曾一度因 DeepSeek 的爆发而显得沉寂,其主力产品 Kimi 几乎淡出公众视线。
                    
                    10/24/2025 9:41:39 AM
                        AI在线
                    Claude不让我们用!国产平替能顶上吗?
                        这几天,全球 AI 代码生成的竞争格局,迎来了新的拐点。 在编程领域,曾被视为王者的 Anthropic,似乎正在一步步失去昔日的锋芒,地位开始动摇。 这一方面源于 OpenAI GPT-5 系列模型的强势崛起,在与 Claude Code 的对战中大有「后来者居上」之势,AI 大神 Karpathy 现身说法并开始安利 GPT-5 Pro 的强大代码能力。
                    
                    9/7/2025 4:45:00 PM
                        机器之心
                    Kimi K2-0905 上线 Discord,仍无思考与视觉能力
                        9月5日,月之暗面(Moonshot AI) 在其官方 Discord 发布新版本 Kimi K2-0905 模型。 据介绍,新版本重点提升了 编程能力,同时在 创意写作 方面也有增强。 这是是继2025年7月发布全球首个人工智能开源万亿参数模型Kimi K2之后的又一重要进展。
                    
                    9/4/2025 12:30:57 PM
                        AI在线
                    Kimi K2 高速版 AI 模型再提速,输出速度达每秒 100 Tokens 
                        近日,月之暗面发布了有关 Kimi K2 高速版 AI 模型的最新消息。 经过工程师们的努力,Kimi K2 turbo-preview 模型的输出速度得到了显著提升,目前稳定输出速度已达到每秒 60 Tokens,最高可达每秒 100 Tokens。 这一进步标志着该模型在处理数据时的效率大幅提高,用户在应用时能够体验到更为流畅的服务。
                    
                    8/22/2025 6:21:26 PM
                        AI在线
                    月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
                        AI在线 8 月 1 日消息,月之暗面今日发布 Kimi K2 高速版 ——Kimi-K2-turbo-preview,模型参数与 Kimi-K2 一致,但输出速度由每秒 10 Tokens 提升至每秒 40 Tokens。 据介绍,该模型目前限时 5 折特惠,9 月 1 日恢复原价,折扣后的价格:模型每百万 tokens 输入价格(缓存命中)2 元,输入价格(缓存未命中)8 元,输出价格 32 元。 据AI在线此前报道,月之暗面 7 月 11 日正式发布 Kimi K2 模型,并同步开源。
                    
                    8/1/2025 1:49:43 PM
                        浩渺
                    月之暗面回应 Kimi K2 模型 API 速度慢:正在优化推理效率,也在加卡加机器
                        AI在线 7 月 15 日消息,月之暗面今晚发文回应 Kimi K2 模型 API 速度慢:“主要问题是访问量大   模型体积大。 我们正在全力优化推理效率,也在加卡加机器。 ”同时,月之暗面还提到 KimiK2 是完全开源的,大家也可以通过其他模型供应商接入使用(比如硅基流动、无问芯穹等)。
                    
                    7/15/2025 7:52:08 PM
                        浩渺
                    Perplexity CEO 称赞月之暗面,希望基于 Kimi K2 进行后训练
                        AI在线 7 月 13 日消息,美国 AI 初创公司 Perplexity 的 CEO 阿拉温德(Aravind Srinivas)今日发文称,月之暗面 Kimi K2 模型在测试中良好表现,公司后续可能会基于 K2 进行后训练。 Live Mint 今年 1 月报道显示,此前 DeepSeek R1 也曾被 Perplexity 用于模型训练。 Kimi K2 是月之暗面 Kimi 昨日刚发布的旗下首个万亿参数开源模型,强调代码能力和通用 Agent 任务能力。
                    
                    7/13/2025 2:27:46 PM
                        问舟
                    深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
                        没想到,Kimi 的首个基础大模型开源这么快就来了。 昨晚,月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格是 16 元人民币 / 百万 token 输出。 这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术节点。
                    
                    7/12/2025 9:23:00 PM
                        机器之心
                    月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
                        AI在线 7 月 11 日消息,月之暗面今晚正式发布 Kimi K2 模型,并同步开源。 Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。 在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。
                    
                    7/11/2025 11:00:41 PM
                        汪淼
                    月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测
                        近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。 这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。 Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。
                    
                    6/21/2025 10:01:04 AM
                        AI在线
                    Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
                        Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。
                    
                    6/21/2025 8:34:54 AM
                        清源
                    开源新星 Kimi-Dev-72B:打破代码修复界限的 AI 神器
                        最近,备受关注的开源大型语言模型 Kimi-Dev-72B 正式上线,成为开发者们的新宠。 这款模型由 “月之暗面” 团队开发,专门为解决代码问题而设计,旨在提升编程效率。 Kimi-Dev-72B 在近期的 SWE-bench Verified 测试中展现了非凡的实力,尤其在修复 Docker 环境中的代码缺陷方面,表现得尤为出色。
                    
                    6/17/2025 7:01:20 PM
                        AI在线
                    小米向月之暗面转让多枚“Kimi”商标
                        小米近日将多枚“Kimi”商标转让给北京月之暗面公司,后者为AI助手Kimi的开发者。此次转让或为小米优化非核心商标资源,月之暗面近期动作频繁,包括与小红书合作等。#小米商标转让# #AI助手Kimi#
                    
                    6/3/2025 10:51:50 AM
                        远洋
                    月之暗面 Kimi 推出首个内容社区,开启用户互动新模式
                        月之暗面近日宣布正在进行其首个内容社区产品的灰度测试,旨在提升用户体验和留存率。 这款名为 Kimi 的产品早在去年底就开始了小范围的试用,目前终于迎来了更广泛的测试阶段。 据澎湃新闻报道,月之暗面是一家成立于2023年3月的公司,由有着清华背景的杨植麟团队领导。
                    
                    4/15/2025 12:02:18 PM
                        AI在线
                    推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
                        2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。
                    
                    2/27/2025 2:22:00 PM
                        郑佳美
                    月之暗面推出新优化器Muon,计算效率大幅提升
                        近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。 这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库,引发了业内的高度关注和讨论。 Muon 优化器最初由 OpenAI 的研究者 Keller Jordan 等人在2024年提出,针对小规模模型训练时表现优异。
                    
                    2/24/2025 3:53:00 PM
                        AI在线
                    
        资讯热榜
    
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                