世界中文AI模型大赛!国际顶尖选手夺魁,国内新秀初现锋芒!
发布时间:2026-02-04 15:20:22 | 责任编辑:吴昊 | 浏览量:2 次
近日,SuperCLUE 发布了2025年度中文大模型基准测评报告,吸引了众多科技爱好者的目光。在此次评测中,共有23个国内外大模型参与角逐,涵盖数学推理、科学推理和代码生成等六大核心维度。评测结果显示,海外闭源模型依旧占据领先地位,尤其是 Anthropic 的 Claude-Opus-4.5-Reasoning,以68.25分高居榜首,成为了此次评测的佼佼者。
紧随其后的是谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2(high),分别以65.59分和64.32分位列第二和第三,海外巨头们的实力依然令人瞩目。不过,值得一提的是,国产大模型在此次评测中也展现出惊人的实力,特别是开源模型 Kimi-K2.5-Thinking 和闭源模型 Qwen3-Max-Thinking,分别以61.50分和60.61分荣获第四和第六名的好成绩。
在细分领域中,国产模型表现尤为突出。Kimi-K2.5-Thinking 在代码生成任务中以53.33分的优异成绩夺得了冠军,而 Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 并列,以80.87分的成绩荣登榜首。这些成绩表明,国产模型正逐步从 “跟跑” 向 “并跑” 迈进,展现出强大的追赶能力。
从整体来看,海外闭源模型仍然领先于国产模型,但国产开源模型却表现出色,在 Top5中占据了绝对优势,显示出国产开源模型的强劲实力与发展潜力。随着科技的不断进步和国内研发的加速,未来的中文大模型领域或将迎来更多惊喜与挑战。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
