AI在线 AI在线

月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能登顶人类终极考试

国产大模型再放“王炸”。 月之暗面(Moonshot AI)于本周四正式开源其迄今最强的思考型大模型——Kimi K2Thinking,不仅在权威基准“人类终极考试”(HLE)中以44.9%的得分力压GPT-5、Grok-4、Claude4.5等国际闭源巨头,更以仅460万美元(约合3277万元人民币)的训练成本,掀起一场高性价比AI革命。 这一成绩尤为震撼之处在于其极致的成本控制。

国产大模型再放“王炸”。月之暗面(Moonshot AI)于本周四正式开源其迄今最强的思考型大模型——Kimi K2Thinking,不仅在权威基准“人类终极考试”(HLE)中以44.9%的得分力压GPT-5、Grok-4、Claude4.5等国际闭源巨头,更以仅460万美元(约合3277万元人民币)的训练成本,掀起一场高性价比AI革命。

这一成绩尤为震撼之处在于其极致的成本控制。据CNBC援引知情人士透露,Kimi K2Thinking的训练投入远低于DeepSeek V3的560万美元,更是与OpenAI动辄数十亿美元的研发开支形成鲜明对比。在AI行业普遍陷入“算力军备竞赛”的背景下,月之暗面用事实证明:更强的智能,未必依赖更贵的投入。

Kimi AI 、月之暗面

不止于性能,更在于开放

与多数闭源模型不同,月之暗面选择全面开源:不仅公开模型权重,还同步发布完整训练脚本、数据配比方案及评估工具链,并明确允许商用。这意味着开发者可零成本复现、微调甚至部署企业级应用,极大降低AI落地门槛。在当前开源生态亟需高质量中文思考模型的背景下,Kimi K2Thinking无疑填补了关键空白。

所谓“思考模型”,强调的不仅是语言生成,更是复杂推理、多步规划与知识整合能力。人类终极考试(HLE)正是衡量模型是否具备类人综合智能的严苛测试,涵盖逻辑、常识、数学、伦理等多维度挑战。Kimi K2在此项登顶,标志着国产模型已从“答得快”迈向“想得深”的新阶段。

AIbase认为,月之暗面此举不仅是一次技术突破,更是对全球大模型发展路径的重新定义:开源、高效、可商用的组合,或将推动AI从“巨头游戏”回归“开发者生态”。当460万美元就能训练出超越GPT-5的模型,AI的未来,或许正由更聪明、更务实的中国团队书写。

相关资讯

印度成OpenAI第二大市场,Altman访印承诺深化合作

OpenAI CEO Sam Altman本周抵达印度进行访问,重点强调了印度作为该公司第二大市场的重要地位。 据透露,OpenAI在印度的用户群在过去一年实现翻倍增长。 此次访问期间,Altman会见了印度信息技术部长Ashwini Vaishnaw,并预计将与总理莫迪会面。
2/9/2025 8:58:25 AM
AI在线

阿里开源通义DeepResearch,性能超OpenAI、DeepSeek旗舰模型

9月17日凌晨,阿里开源旗下首个深度研究Agent模型——通义DeepResearch。 该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩(State-of-the-art),超越OpenAI Deep Research、DeepSeek-V3.1等Agent模型。 目前,通义DeepResearch的模型、框架和方案均已全面开源,用户可在Github、Hugging Face和魔搭社区社区下载模型和代码。
9/17/2025 5:12:00 PM
新闻助手

月之暗面发布 Kimi k1.5 多模态思考模型,实现 SOTA 级多模态推理能力

官方表示,在 short-CoT 模式下,Kimi k1.5 的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平,领先达到 550%。
1/20/2025 10:26:19 PM
清源
  • 1