AI在线 AI在线

月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测

近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。 这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。 Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。

近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。

Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。它不仅能够主动澄清问题、深入思考,还能自主规划关键词进行搜索,并筛选出高质量的信息。在处理任务时,Kimi-Researcher平均会进行23步推理,规划74个关键词,并找到206个网址,最终只保留信息质量最高的前3.2%内容。这一过程确保了研究成果的详实与可溯源性。

微信截图_20250621094225.png

除了强大的信息搜索与筛选能力外,Kimi-Researcher还能自主调用浏览器、代码等工具,处理原始数据并自动生成分析结论。其交付成果包括一份信息详实、可溯源的深度研究报告,以及一个可交互、可分享的动态可视化报告。这些报告不仅长度在万字以上,平均引用约26个高质量信源,还支持在线生成链接并分享,极大地方便了用户的展示与协作需求。

为了验证Kimi-Researcher的真实能力,月之暗面为其安排了一场高难度的“考试”——Humanity’s Last Exam(HLE)。这套专为AI设计的高难度benchmark覆盖了上百个专业领域,从数学、物理、医学到政治、历史,全面考察模型在复杂知识任务中的解决能力。Kimi-Researcher在完全零结构、无流程设计的设置下,取得了Pass@1准确率26.9%、Pass@4准确率40.17%的优异成绩,超越了多个知名AI模型,达到了目前已知的最高水平之一。

在真实场景的应用中,Kimi-Researcher同样展现出了出色的表现。无论是算法同学寻找高价值的benchmark、运营同学研究行业内的公司发展,还是法务朋友快速了解各国数据隐私法规,Kimi-Researcher都能在短时间内生成结构清晰、信息全面的报告,为用户提供有力的支持。

月之暗面表示,Kimi-Researcher是通过端到端强化学习训练出来的Agent模型,具有零结构、自适应的特点。它没有复杂的提示词或预设流程,而是完全依靠模型自身的试错与学习来应对复杂任务。这种设计使得Kimi-Researcher在面对信息冲突、工具切换和环境变化时,能够展现出强大的适应性与泛化能力。

目前,Kimi-Researcher正处于小范围灰度测试阶段。用户可以通过访问kimi.com申请内测资格,并在获得权限后打开Kimi对话框下方的“深度研究”按钮开始使用。

相关资讯

月之暗面推出kimi-latest:可第一时间体验kimi最新模型

2月18日,北京月之暗面科技有限公司宣布在Kimi开放平台推出最新模型——kimi-latest,旨在为开发者和企业用户提供更强大、更稳定的AI生成能力。 自2024年1月31日Kimi开放平台公测以来,moonshot-v1系列模型一直是Kimi智能助手的核心支持。 然而,随着Kimi智能助手的快速迭代,开发平台用户对模型稳定性和功能的需求逐渐分化,促使月之暗面科技推出这一新模型。
2/18/2025 3:12:00 PM
AI在线

Kimi 最新模型 k1.6 登顶,编程能力超越 GPT o3mini、o1

月之暗面联合创始人张予彤在朋友圈表示,“k1.6 还没有发布,但看到 LiveCodeBench 的成绩感到开心,期待智能模型的持续进化。”
2/27/2025 4:51:00 PM
汪淼

Kimi k1.6模型曝光:编程能力超越GPT-3,引领AI新风潮

最近,来自全球知名动态基准测试平台 LiveCodeBench 的信息显示,Kimi 最新发布的 k1.6模型在编程能力方面表现卓越,已经超越了 OpenAI 的 GPT-3(包括 o3mini 和 o1等版本),登上了性能排行榜的第一名。 这一消息无疑为科技界带来了激动与期待。 据月之暗面的研究员 Flood 透露,k1.6是在 k1.5的基础上进行训练和优化的,目前其性能仍在不断提升中。
2/27/2025 5:07:00 PM
AI在线
  • 1