首场大模型挑战赛即将启动,谷歌、DeepSeek与Kimi等将集体亮相
发布时间:2025-08-05 14:49:37 | 责任编辑:吴昊 | 浏览量:79 次
在全球 AI 研究的浪潮中,谷歌发起的首届大模型对抗赛引发了广泛关注。此次比赛将于8月5日至7日在 Kaggle Game Arena 举行,汇聚了包括 DeepSeek、Kimi 等在内的八款顶尖 AI 模型,竞争将以国际象棋为舞台,展开激烈的对抗。
此次参赛的模型包括 OpenAI 的 o4-mini、DeepSeek-R1、Kimi K2Instruct、Gemini2.5Pro(谷歌)、Claude Opus4(Anthropic)、Grok4(xAI)及 Gemini2.5Flash 等,每一款模型都代表了当前 AI 领域的最前沿技术。组织方特别邀请了世界顶级国际象棋专家进行解说,为比赛增添了专业性与观赏性。
比赛的组织方表示,这场对抗赛的初衷在于推动 AI 模型在真实对抗环境中的表现评估。随着 AI 技术的迅猛发展,现有的基准测试方法已难以有效区分模型的真实能力,Kaggle Game Arena 正是为了解决这一问题而设立的。通过在策略游戏中的实际对抗,研究者能够更全面地评估模型的表现。
比赛将采用全员对抗赛制,确保统计结果的可靠性。每对模型之间将进行多场对战,最终的排名将根据对战结果进行严格评定。为了保证透明度,比赛的执行框架和环境将全部开源,观众将能够实时查看对阵表及比赛进展。
比赛将采用单败淘汰制,每场对决包含四局,首先获得两分的模型将晋级。如果对局打成平局,双方将进行加赛决胜局。比赛过程中,每个模型将面临文本输入的挑战,无法调用外部工具如国际象棋引擎进行辅助,增加了比赛的复杂性与趣味性。
谷歌 DeepMind 联合创始人 Demis Hassabis 表示:“游戏一直是检验 AI 能力的重要试炼场。我们对 Kaggle Game Arena 能推动 AI 进步感到无比兴奋。随着更多游戏与挑战的加入,AI 的能力必将快速提升!”
随着比赛的临近,观众们对最终结果充满期待,大家热切讨论哪款模型将在这场对抗赛中脱颖而出。无论结果如何,此次比赛都将为 AI 模型的评估方法带来新的思路,并推动相关技术的不断进步。
是的,首届大模型对抗赛已于今天(2025年8月5日)正式开战,由谷歌在 Kaggle Game Arena 主办,为期三天,至8月7日结束。
此次比赛吸引了8款全球顶尖的大语言模型参赛,包括:
-
谷歌 Gemini 2.5 Pro / Flash
-
OpenAI o4-mini / o3
-
DeepSeek-R1
-
Kimi K2 Instruct(月之暗面)
-
Claude Opus 4(Anthropic)
-
Grok 4(xAI)
比赛形式为国际象棋文本对抗赛,模型仅通过自然语言输入进行对弈,不得调用任何外部棋类引擎或工具。赛制为单败淘汰制,每场对决含4局,先赢2局者晋级。
本次比赛亮点包括:
-
全程公开直播(YouTube/Kaggle)
-
国际象棋大师实时解说(如Hikaru Nakamura)
-
全开源环境,确保透明性和可复现性
这不仅是模型间首次“真刀真枪”的实战比拼,也被视为对传统基准测试的一次重要突破。首日比赛已于今日开打,赛程安排如下:
-
8月5日:8进4
-
8月6日:半决赛
-
8月7日:决赛与冠军揭晓
实时对阵表和排行榜可查看:Kaggle Chess Tournament
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。