月之暗面
Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。
6/21/2025 8:34:54 AM
清源
开源新星 Kimi-Dev-72B:打破代码修复界限的 AI 神器
最近,备受关注的开源大型语言模型 Kimi-Dev-72B 正式上线,成为开发者们的新宠。 这款模型由 “月之暗面” 团队开发,专门为解决代码问题而设计,旨在提升编程效率。 Kimi-Dev-72B 在近期的 SWE-bench Verified 测试中展现了非凡的实力,尤其在修复 Docker 环境中的代码缺陷方面,表现得尤为出色。
6/17/2025 7:01:20 PM
AI在线
小米向月之暗面转让多枚“Kimi”商标
小米近日将多枚“Kimi”商标转让给北京月之暗面公司,后者为AI助手Kimi的开发者。此次转让或为小米优化非核心商标资源,月之暗面近期动作频繁,包括与小红书合作等。#小米商标转让# #AI助手Kimi#
6/3/2025 10:51:50 AM
远洋
月之暗面 Kimi 推出首个内容社区,开启用户互动新模式
月之暗面近日宣布正在进行其首个内容社区产品的灰度测试,旨在提升用户体验和留存率。 这款名为 Kimi 的产品早在去年底就开始了小范围的试用,目前终于迎来了更广泛的测试阶段。 据澎湃新闻报道,月之暗面是一家成立于2023年3月的公司,由有着清华背景的杨植麟团队领导。
4/15/2025 12:02:18 PM
AI在线
推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。
2/27/2025 2:22:00 PM
郑佳美
月之暗面推出新优化器Muon,计算效率大幅提升
近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。 这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库,引发了业内的高度关注和讨论。 Muon 优化器最初由 OpenAI 的研究者 Keller Jordan 等人在2024年提出,针对小规模模型训练时表现优异。
2/24/2025 3:53:00 PM
AI在线
月之暗面 Kimi 开源 Moonlight:30 亿 / 160 亿参数混合专家模型
“我们的模型不仅突破了当前的Pareto前沿,还在训练所需的FLOP数大幅减少的情况下,达到了比以往模型更优的性能。”
2/24/2025 8:53:18 AM
清源
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数,参阅报道《刚刚! DeepSeek 梁文锋亲自挂名,公开新注意力架构 NSA》。 但其实就在同一天,月之暗面也发布了一篇主题类似的论文,并且同样巧合的是,月之暗面创始人兼 CEO 杨植麟也是该论文的署名作者之一。
2/19/2025 3:02:25 PM
机器之心
月之暗面Kimi暂停大规模投流 战略重心转向底层模型
国内大模型初创公司月之暗面(Moonshot AI)近日因大幅削减市场投放预算再次引发业界关注。 据界面新闻报道,月之暗面已暂停多个安卓渠道及第三方广告平台的投放。 此前,月之暗面以激进的市场策略著称,2024年9月起每月在营销和流量获取上的投入高达近2亿元,重点投放平台包括小红书、B站、知乎等。
2/19/2025 9:27:00 AM
AI在线
Kimi大幅削减广告预算,DeepSeek崛起令月之暗面压力倍增
在国内 AI 领域,Kimi 曾是备受关注的创业产品,但随着 DeepSeek 的崛起,这一局面正悄然改变。 近日,月之暗面公司宣布将大幅削减 Kimi 的广告投放预算,暂停多个安卓渠道的推广以及与第三方广告平台的合作,这一决策显然是对 DeepSeek 迅猛发展的直接反应。 根据界面新闻的报道,DeepSeek 在短短数十天内成功吸引了3500万日活跃用户,而 Kimi 在过去一年多的时间内投入大量资金,日活跃用户却未能突破千万。
2/18/2025 5:09:00 PM
AI在线
消息称 Kimi 大砍投放预算,DeepSeek 冲击之下月之暗面暂缓“烧钱”投广告
月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。(界面新闻)
2/18/2025 4:41:14 PM
汪淼
月之暗面宣布推出新模型 Kimi Latest:始终使用最新模型,名称保持不变
kimi-latest 将对标 Kimi 智能助手当前使用的模型,随智能助手产品更新而同步升级(模型名称始终为 kimi-latest)。
2/18/2025 3:30:16 PM
汪淼
月之暗面:一年前就验证过长思维链,因成本高先搞了长文本
月之暗面研究员 Flood Sung 近日分享了 k1.5 模型背后的完整思考过程,并透露称,2024 年 9 月 12 号 OpenAI o1 发布带来的震撼效果,令自己陷入了 Long-CoT 的有效性反思中。
2/18/2025 9:15:26 AM
文猛
月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向
2 月 15 日下午消息,据媒体报道,月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。
2/15/2025 4:51:20 PM
凌辰
月之暗面发布 Kimi k1.5 多模态思考模型,实现 SOTA 级多模态推理能力
官方表示,在 short-CoT 模式下,Kimi k1.5 的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平,领先达到 550%。
1/20/2025 10:26:19 PM
清源
Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强
最直接的实测例子是:当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上传后,k1 居然能识别图片中的文字,生动解读背后的物理、天文学等科学知识,从而回答用户的提问并给出清晰完整的推理思考过程。 例如,当我们上传杨振宁的手稿并向 k1 提问,k1 给出了超乎小编知识范畴所能辨真伪的答案:这是杨振宁的手稿图片——这是我们的询问:这是物理学家杨振宁的手稿照片,请你一步一步分析,杨振宁在计算什么,他可能在想什么,当时可能是什么背景? 这是 k1 的回答:上下滑动查看长图虽然小编既不懂电磁场、也不懂粒子动力学,但看完 k1 的答案着实大吃一惊!
12/16/2024 6:37:00 PM
张进
Kimi又上新!抢先实测视觉思考模型k1,甚至比o1更聪明
用强化学习,改变大模型技术范式。 国产大模型,正在引领 AI 技术新方向。 今天上午,月之暗面 Kimi 正式发布了视觉思考模型 k1,并已经上线了最新版的网页版以及安卓和 iOS APP。
12/16/2024 3:50:00 PM
机器之心
Kimi 发布视觉思考模型 k1:试题拍照给出答题思考全过程
月之暗面 Kimi 今日发布视觉思考模型 k1。该模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。
12/16/2024 9:48:10 AM
汪淼
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉