豆包强势夺冠,视觉大模型赛道迎来新变局,国产阵营实现全面超越
发布时间:2026-04-29 10:57:52 | 责任编辑:张毅 | 浏览量:2 次
SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果,标志着国内人工智能领域的一次重大突破。在此次评测中,字节跳动的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的优异成绩荣获总榜第一,成功超越了谷歌的 Gemini-3.1-Pro-Preview,后者得分为 89.35 分。
本次测评涵盖了国内外 17 款主流视觉语言模型,国产模型表现出色,不仅在榜单中占据多个前列名次,阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova、以及智谱 GLM 等均表现不俗。相比之下,OpenAI 的 GPT-5.4 和其他一些海外知名模型则只能排在中游位置,显示出国产模型的强劲上升势头。
评测的内容涉及三个主要维度:基础认知、视觉推理和视觉应用,涵盖了多达 25 项具体任务,包括通用识别和医疗影像等。评测结果显示,国产模型在基础认知和数据分析上表现尤为突出,得分普遍超过 90 分,展现了成熟而稳定的能力。然而,在视觉推理及工业、医疗等专业应用领域,国内模型仍然有待进一步提升,某些专业场景的得分相对较低。
划重点:
🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分获评第一,超越谷歌 Gemini-3.1-Pro-Preview。
📊 国产模型在基础认知和数据分析上得分普遍超过 90 分,表现稳定。
🛠️ 在视觉推理及专业应用领域,国产模型仍需提升,部分场景得分偏低。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
