首页 > 快讯 > 在月背世界，Kimi发布了Kimi-Researcher深度研究助手并启动内部测试

在月背世界，Kimi发布了Kimi-Researcher深度研究助手并启动内部测试

发布时间：2025-06-21 10:16:33 | 责任编辑：张毅 | 浏览量：1,844 次

《在月背世界，Kimi发布了Kimi-Researcher深度研究助手并启动内部测试》相关软件官网

近日，月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher（深度研究）正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型，旨在为用户提供高效、深入的深度研究服务。
Kimi-Researcher在面对问题时，展现出强大的自主规划与执行能力。它不仅能够主动澄清问题、深入思考，还能自主规划关键词进行搜索，并筛选出高质量的信息。在处理任务时，Kimi-Researcher平均会进行23步推理，规划74个关键词，并找到206个网址，最终只保留信息质量最高的前3.2%内容。这一过程确保了研究成果的详实与可溯源性。
除了强大的信息搜索与筛选能力外，Kimi-Researcher还能自主调用浏览器、代码等工具，处理原始数据并自动生成分析结论。其交付成果包括一份信息详实、可溯源的深度研究报告，以及一个可交互、可分享的动态可视化报告。这些报告不仅长度在万字以上，平均引用约26个高质量信源，还支持在线生成链接并分享，极大地方便了用户的展示与协作需求。
为了验证Kimi-Researcher的真实能力，月之暗面为其安排了一场高难度的“考试”——Humanity’s Last Exam（HLE）。这套专为AI设计的高难度benchmark覆盖了上百个专业领域，从数学、物理、医学到政治、历史，全面考察模型在复杂知识任务中的解决能力。Kimi-Researcher在完全零结构、无流程设计的设置下，取得了Pass@1准确率26.9%、Pass@4准确率40.17%的优异成绩，超越了多个知名AI模型，达到了目前已知的最高水平之一。
在真实场景的应用中，Kimi-Researcher同样展现出了出色的表现。无论是算法同学寻找高价值的benchmark、运营同学研究行业内的公司发展，还是法务朋友快速了解各国数据隐私法规，Kimi-Researcher都能在短时间内生成结构清晰、信息全面的报告，为用户提供有力的支持。
月之暗面表示，Kimi-Researcher是通过端到端强化学习训练出来的Agent模型，具有零结构、自适应的特点。它没有复杂的提示词或预设流程，而是完全依靠模型自身的试错与学习来应对复杂任务。这种设计使得Kimi-Researcher在面对信息冲突、工具切换和环境变化时，能够展现出强大的适应性与泛化能力。
目前，Kimi-Researcher正处于小范围灰度测试阶段。用户可以通过访问kimi.com申请内测资格，并在获得权限后打开Kimi对话框下方的“深度研究”按钮开始使用。

在月背世界，Kimi发布了Kimi-Researcher深度研究助手并启动内部测试

月之暗面旗下的Kimi于2025年6月20日晚间宣布其首个Agent——Kimi-Researcher（深度研究）开启小范围灰度测试。Kimi-Researcher是通过端到端强化学习训练出来的Agent模型，未来月之暗面将逐步开源其基础预训练模型以及强化学习后的模型。

Kimi-Researcher的特点

任务执行流程自主规划：对于每一个问题，Kimi-Researcher都会自主规划任务执行流程，最终交付完整结果。
深度研究能力：
- 澄清问题：理解问题时主动反问，构建更清晰的问题空间。
- 深入思考：每个任务平均进行23步推理，自主梳理并解决需求。
- 主动搜索：每个任务平均规划74个关键词，找到206个网址，由模型判断并筛选出信息质量最高的前3.2%内容，剔除冗余、低质信息。
- 调用工具，交付结果：自主调用浏览器、代码等工具，处理原始数据、自动生成分析结论，端到端完成交付。
异步执行：采用异步执行方式，用更多时间逐步推理、检索和撰写内容。
高质量交付成果：
- 深度研究报告：报告平均长度在万字以上，平均引用约26个高质量、可溯源的信源，所有引用都内嵌在正文中，点击即可跳转，并高亮原文，便于验证与追溯。
- 动态可视化报告：结构化排版、思维导图，让趋势、异常等重要信息一眼可见；无需阅读全文，也能迅速把握整体结构与核心结论；支持在线生成链接并分享，方便展示。

Kimi-Researcher的性能表现

在专为AI设计的高难度benchmark“人类最后一次考试（Humanity's Last Exam，HLE）”中，Kimi-Researcher在完全零结构、无流程设计的设置下，Pass@1准确率为26.9%，Pass@4准确率为40.17%。这一表现超过了Claude 4 Opus（10.7%）、Gemini 2.5 Pro（21.6%），略高于OpenAI Deep Research（26.6%），和Gemini-Pro的Deep Research Agent（26.9%）打平，是目前已知最高水平之一。在红杉中国发布的xbench基准测试中，Kimi-Researcher在DeepSearch任务中取得69%的平均通过率，领先该榜中其他模型。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。