仅全球7人可胜!全新Gemini 3 Deep Think发布:革新编程及科研排名
发布时间:2026-02-13 14:38:12 | 责任编辑:张毅 | 浏览量:3 次
Google 旗下的 Gemini3Deep Think 今日迎来重磅升级。这款主打深度推理的模型不仅在编程领域展现出“世界冠军级”实力,更在科学研究和硬核工程领域刷新了多项目标,标志着 AI 推理能力进入全新维度。
Gemini3Deep Think 的核心战绩:
编程封神:在算法竞赛平台 Codeforces 上刷出了 3455Elo 的惊人高分。这意味着它已跻身人类顶级行列,全球目前仅有7名人类选手能击败它。作为对比,一年前最强的 o3模型得分仅为2727。
科研“最强大脑”:该模型展现出极强的逻辑严密性,曾发现一篇高深物理数学论文中连人类同行评审都遗漏的细微漏洞。此外,它还成功证明了“Erdős 猜想”中的多个难题。
从草图到实物:在工程领域,它可以直接将一张手绘草图分析并渲染成高保真的3D 模型文件(如笔记本支架),使物理零部件的建模效率提升了10倍。
基准测试全线突破:在“人类最后考试”(HLE)中拿下了48.4% 的成绩,并在 ARC-AGI-2基准上以84.6% 的高准确率遥遥领先。
目前,Google 已向 AI Ultra 订阅用户开放了新版体验,并首次通过 API 向部分研究人员和企业开放。此次 Gemini 的史诗级进化,被视为对竞争对手推理模型的有力回击。
这是一篇关于全球仅 7 人能赢它!全新 Gemini 3 Deep Think 发布:血洗编程与科研榜单的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
