首页 > 快讯 > 在月背世界,Kimi发布了Kimi-Researcher深度研究助手并启动内部测试

在月背世界,Kimi发布了Kimi-Researcher深度研究助手并启动内部测试

发布时间:2025-06-21 10:16:33 | 责任编辑:张毅 | 浏览量:10 次

近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。
Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。它不仅能够主动澄清问题、深入思考,还能自主规划关键词进行搜索,并筛选出高质量的信息。在处理任务时,Kimi-Researcher平均会进行23步推理,规划74个关键词,并找到206个网址,最终只保留信息质量最高的前3.2%内容。这一过程确保了研究成果的详实与可溯源性。
除了强大的信息搜索与筛选能力外,Kimi-Researcher还能自主调用浏览器、代码等工具,处理原始数据并自动生成分析结论。其交付成果包括一份信息详实、可溯源的深度研究报告,以及一个可交互、可分享的动态可视化报告。这些报告不仅长度在万字以上,平均引用约26个高质量信源,还支持在线生成链接并分享,极大地方便了用户的展示与协作需求。
为了验证Kimi-Researcher的真实能力,月之暗面为其安排了一场高难度的“考试”——Humanity’s Last Exam(HLE)。这套专为AI设计的高难度benchmark覆盖了上百个专业领域,从数学、物理、医学到政治、历史,全面考察模型在复杂知识任务中的解决能力。Kimi-Researcher在完全零结构、无流程设计的设置下,取得了Pass@1准确率26.9%、Pass@4准确率40.17%的优异成绩,超越了多个知名AI模型,达到了目前已知的最高水平之一。
在真实场景的应用中,Kimi-Researcher同样展现出了出色的表现。无论是算法同学寻找高价值的benchmark、运营同学研究行业内的公司发展,还是法务朋友快速了解各国数据隐私法规,Kimi-Researcher都能在短时间内生成结构清晰、信息全面的报告,为用户提供有力的支持。
月之暗面表示,Kimi-Researcher是通过端到端强化学习训练出来的Agent模型,具有零结构、自适应的特点。它没有复杂的提示词或预设流程,而是完全依靠模型自身的试错与学习来应对复杂任务。这种设计使得Kimi-Researcher在面对信息冲突、工具切换和环境变化时,能够展现出强大的适应性与泛化能力。
目前,Kimi-Researcher正处于小范围灰度测试阶段。用户可以通过访问kimi.com申请内测资格,并在获得权限后打开Kimi对话框下方的“深度研究”按钮开始使用。

在月背世界,Kimi发布了Kimi-Researcher深度研究助手并启动内部测试

月之暗面旗下的Kimi于2025年6月20日晚间宣布其首个Agent——Kimi-Researcher(深度研究)开启小范围灰度测试。Kimi-Researcher是通过端到端强化学习训练出来的Agent模型,未来月之暗面将逐步开源其基础预训练模型以及强化学习后的模型。

Kimi-Researcher的特点

  • 任务执行流程自主规划:对于每一个问题,Kimi-Researcher都会自主规划任务执行流程,最终交付完整结果。

  • 深度研究能力

    • 澄清问题:理解问题时主动反问,构建更清晰的问题空间。

    • 深入思考:每个任务平均进行23步推理,自主梳理并解决需求。

    • 主动搜索:每个任务平均规划74个关键词,找到206个网址,由模型判断并筛选出信息质量最高的前3.2%内容,剔除冗余、低质信息。

    • 调用工具,交付结果:自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。

  • 异步执行:采用异步执行方式,用更多时间逐步推理、检索和撰写内容。

  • 高质量交付成果

    • 深度研究报告:报告平均长度在万字以上,平均引用约26个高质量、可溯源的信源,所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。

    • 动态可视化报告:结构化排版、思维导图,让趋势、异常等重要信息一眼可见;无需阅读全文,也能迅速把握整体结构与核心结论;支持在线生成链接并分享,方便展示。

Kimi-Researcher的性能表现

在专为AI设计的高难度benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher在完全零结构、无流程设计的设置下,Pass@1准确率为26.9%,Pass@4准确率为40.17%。这一表现超过了Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于OpenAI Deep Research(26.6%),和Gemini-Pro的Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的xbench基准测试中,Kimi-Researcher在DeepSearch任务中取得69%的平均通过率,领先该榜中其他模型。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复