首页 > 快讯 > 阿里推出了通义Qwen3语言模型,开源技术再创新高!

阿里推出了通义Qwen3语言模型,开源技术再创新高!

发布时间:2025-05-06 18:17:55 | 责任编辑:张毅 | 浏览量:3 次

在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。
此次发布的旗舰模型 Qwen3-235B-A22B 以其2350亿个参数的规模在多个基准测试中展现出强大的竞争力,超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等顶级模型。此外,Qwen3-30B-A3B 作为小型 MoE 模型,其激活参数数量仅为 QwQ-32B 的10%,但性能却显著提升,甚至是 Qwen3-4B 这样的迷你模型也能与 Qwen2.5-72B-Instruct 相媲美。
此次开源的还有多个 Dense 模型,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,所有模型均在 Apache2.0许可下开放使用。用户可以在 Hugging Face、ModelScope 及 Kaggle 等平台上获取到这些经过后训练的模型,适用于各种开发和研究需求。针对不同的使用场景,推荐使用 SGLang 和 vLLM 等框架进行部署。
Qwen3模型支持两种思考模式,分别是 “思考模式” 和 “非思考模式”。思考模式允许模型逐步推理,适合复杂问题,而非思考模式则提供快速响应,适合简单问题。这样的灵活设计使用户能够根据需求调节模型的 “思考” 深度。
在语言支持方面,Qwen3支持119种语言和方言,极大地拓宽了其国际应用的潜力。为了提升预训练的质量,Qwen3的数据集相比前一代 Qwen2.5几乎翻了一番,达到了约36万亿个 token,涵盖了多样化的语言数据。
Qwen3的发布将为大型基础模型的研究和开发带来新的机遇,助力全球研究人员和开发者利用这一先进技术构建创新的解决方案。
划重点:
🌟 Qwen3-235B-A22B 在基准测试中表现卓越,开创语言模型新局面。
🌍 Qwen3支持119种语言,满足全球用户需求,扩展国际应用。
🔧 模型开源,用户可在多个平台轻松获取和部署,促进研究与开发。

阿里推出了通义Qwen3语言模型,开源技术再创新高!

阿里通义千问3(Qwen3)语言模型于2025年4月29日正式上线并开源,其开源实力再升级,主要体现在以下几个方面:

技术创新与性能突破

  • 混合推理模式:Qwen3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型。对于简单需求,模型可以低算力“秒回”答案;对于复杂问题,则可以进行多步骤的“深度思考”,大大节省算力消耗。

  • 强大性能表现:Qwen3的参数量仅为DeepSeek-R1的1/3,但性能全面超越R1、OpenAI-o1等全球顶尖模型。在国际权威大模型测评榜LiveBench上,Qwen3斩获全球开源模型冠军,并且在指令遵循这一关键能力上超越了o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,位列全球第一。

  • 多语言支持:Qwen3支持119种语言和方言,极大地拓宽了其国际应用的潜力。

开源与成本优势

  • 丰富的开源模型:此次开源的模型包含8款不同尺寸,包括Qwen3-235B-A22B、Qwen3-30B-A3B、Qwen3-32B等。这些模型均在Apache 2.0许可下开放使用,用户可以在Hugging Face、ModelScope和Kaggle等平台上获取。

  • 低部署成本:Qwen3的部署成本大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

应用与体验升级

  • 多平台接入:Qwen3已经上线通义App和通义网页版,用户可以在这些平台上体验其智能能力,涵盖逻辑推理、编程、翻译等多个场景。此外,阿里巴巴旗下的智能搜索产品“夸克”也将全线接入Qwen3。

  • 灵活的思考模式:Qwen3支持“思考模式”和“非思考模式”,用户可以根据具体任务控制模型的“思考”深度,这种灵活设计使模型能够更好地适应不同场景的需求。

阿里通义千问3的上线和开源,不仅展示了其强大的技术实力,也为全球研究人员和开发者提供了新的机遇,助力构建创新的解决方案。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复