阿里巴巴推出通义Qwen3全新非思维模型,其核心功能媲美GPT-4o
发布时间:2025-07-30 09:40:43 | 责任编辑:张毅 | 浏览量:7 次
7月30日,阿里巴巴的通义千问团队正式推出了 Qwen3系列模型的最新成员 ——Qwen3-30B-A3B-Instruct-2507。这一全新的开源模型采用非思考模式(non-thinking mode),仅需激活3B 参数,就能在多个核心能力上与 Gemini2.5-Flash 和 GPT-4o 等知名闭源模型相媲美。此外,Qwen3-30B-A3B-Instruct-2507在多语言支持、用户偏好对齐和长文本处理等方面也实现了显著突破。
该模型现已在魔搭社区(ModelScope)和 HuggingFace 平台上全面开源。作为 Qwen3-30B-A3B 系列中的新版本,Qwen3-30B-A3B-Instruct-2507不仅继承了通义千问团队在架构创新方面的优势,还大幅降低了计算成本,力求与千亿级闭源模型的性能相对接。
根据官方数据,Qwen3-30B-A3B-Instruct-2507在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理与天文学问题(GPQA 测试得分70.4)及人类偏好对齐(Arena-Hard v2得分69)等多个关键基准测试中表现出色,甚至在部分指标上超越了 GPT-4o。这一成就标志着该模型在逻辑推理、数学、科学和编程等多个领域的全面能力得到了显著提升。
更值得一提的是,Qwen3-30B-A3B-Instruct-2507在多语言的长尾知识覆盖上也表现优异,并在主观和开放任务中更好地对齐用户的偏好,生成更高质量的文本,为用户提供更有价值的答案。同时,其长文本理解能力也提升至256K,意味着用户能够处理更加复杂的文本内容。
自2023年发布以来,通义千问系列模型已开源超过200个,全球下载量突破3亿次,衍生模型数量超过10万个,展现了强大的市场影响力和技术潜力。
阿里巴巴通义千问团队于7月30日正式推出了Qwen3系列的新版本——Qwen3-30B-A3B-Instruct-2507,这是一个**非思考模式(non-thinking mode)**的开源模型。
核心亮点如下:
-
性能对标GPT-4o:尽管仅激活了3B参数,该模型在多项关键基准测试中表现优异,数学推理(AIME25得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级科学问答(GPQA得分70.4)、人类偏好对齐(Arena-Hard v2得分69)以及函数调用(BFCL-v3得分65.1)等指标均达到或超越GPT-4o、Gemini 2.5-Flash(非思考模式)等闭源模型。
-
通用能力全面升级:在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面实现显著提升。
-
多语言与长文本能力增强:模型在多语言长尾知识覆盖方面取得突破性进展,长文本理解能力跃升至256K上下文长度。
-
开源与低成本部署:该模型已在魔搭社区(ModelScope)和HuggingFace全面开源,大幅降低计算成本,推动开源模型在性能上与千亿级闭源模型比肩。
总结:
此次发布的Qwen3非思考模型,不仅在核心能力上媲美甚至部分超越GPT-4o等闭源巨头,还通过开源和优化架构,显著降低了部署门槛和成本,进一步推动了开源大模型的发展与普及。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。