发布仅一周,阿里通义千问3取得全球开源模型榜首
发布时间:2025-05-07 10:53:25 | 责任编辑:张毅 | 浏览量:31 次
近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。
据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。这一榜单由著名图灵奖得主、Meta 首席 AI 科学家杨立昆联合纽约大学等多个机构共同发布,全面评估大模型的数学、推理、编程及语言理解等多个维度。由于其采用动态更新的题库,通义千问3被誉为 “全球首个无法作弊的模型基准测试”。
图源备注:图片由AI生成
通义千问3的正式发布是在4月29日。该模型的参数量仅为 DeepSeek-R1的三分之一,成本大幅降低,同时性能却超越了包括 OpenAI 在内的多款全球顶尖模型。千问3是国内首个 “混合推理模型”,它结合了 “快思考” 和 “慢思考” 两种模式,能够在处理简单问题时快速响应,而在面对复杂问题时进行多步骤深入思考,这样不仅提高了算力的使用效率,也显著节省了资源。
另外,通义千问3的部署成本也非常友好,用户只需四张 H20就能实现千问3的满血版部署,显存占用仅为性能相近模型的三分之一。这一显著的性能提升,充分证明了阿里巴巴在大模型领域的创新能力与技术实力。
通义千问3的发布,将推动更多企业与开发者参与到开源 AI 模型的构建中,为行业的发展注入新的活力。随着大模型技术的不断进步,我们期待未来将有更多实用而创新的应用出现。
阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)在上线仅7天后,便登顶全球开源模型榜首。这一成就得益于其在国际权威大模型测评榜LiveBench的最新排名中获得的优异成绩。LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆联合纽约大学等机构推出,从数学、推理、编程、语言理解等多个复杂维度全面评估大模型。
千问3在指令遵循(Instruction Following)这一关键能力上超越了o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,位列全球第一。此外,千问3的参数量仅为DeepSeek-R1的三分之一,但性能却全面超越了包括OpenAI-o1在内的多款全球顶尖模型。千问3是国内首个“混合推理模型”,结合了“快思考”和“慢思考”两种模式,能够在处理简单问题时快速响应,而在面对复杂问题时进行多步骤深入思考,大大节省了算力消耗。
千问3的开源进一步推动了全球AI技术的发展。其采用宽松的Apache 2.0协议开源,全球开发者可在Hugging Face、ModelScope等平台免费下载商用。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。