首页 > 快讯 > Qwen3优化性能与效率：MoE技术应用显著减少部署费用

Qwen3优化性能与效率：MoE技术应用显著减少部署费用

发布时间：2025-04-29 15:27:38 | 责任编辑：吴昊 | 浏览量：284 次

阿里云旗下通义千问（Qwen）团队正式发布Qwen3系列模型，共推出8款不同规格的模型，覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型，也是首个配备混合思维模式的国产模型。
Qwen3系列包含6款Dense模型和2款MoE模型:
所有模型均支持128K上下文窗口，并配备了可手动控制的"thinking"开关，实现混合思维模式。
Qwen3系列在同尺寸开源模型中性能领先，尤其是旗舰模型Qwen3-235B-A22B:
小型MoE模型Qwen3-30B-A3B同样令人惊艳:
最小的0.6B模型专为移动设备优化，进一步扩展了Qwen3的应用范围。
Qwen3发布后立即获得了众多平台的"0day级支持":
在线体验:
本地部署:
API接入:
特殊部署:
Qwen3的核心优势包括:
Qwen3的发布标志着中国开源大模型进入新阶段，在性能与部署效率方面实现了双重突破。有兴趣的开发者可通过官方技术博客（https://qwenlm.github.io/blog/qwen3/）了解更多技术细节。

阿里巴巴在2025年4月29日发布了新一代通义千问模型Qwen3系列，标志着其在AI领域取得了重大突破。Qwen3系列模型凭借混合专家（MoE）架构，在性能与效率方面实现了双赢，同时大幅降低了部署成本。

技术突破

Qwen3采用了混合专家（MoE）架构，总参数量达到2350亿，但激活参数仅为220亿。这种架构通过“动态资源分配”，在处理简单任务时启用“非思考模式”，能够低算力“秒级响应”；而在处理复杂逻辑、数学推理等任务时切换到“思考模式”，通过多步骤深度推理输出结果。这种双模式设计不仅提升了模型的效率，还在多个权威基准测试中展现了卓越的性能。

性能表现

Qwen3在多个关键测试中表现优异。例如，在奥数水平的AIME25测评中，Qwen3-235B-A22B斩获81.5分，刷新了开源模型的纪录；在代码能力测试LiveCodeBench中，它突破70分大关，超越了Grok3；在模型人类偏好对齐评估ArenaHard中，Qwen3以95.6分的成绩超越了OpenAI-o1和DeepSeek-R1。

部署成本

Qwen3的部署成本显著降低。旗舰模型Qwen3-235B-A22B仅需4张H20 GPU即可实现本地部署，显存占用仅为性能相近模型的三分之一。相比之下，性能相近的DeepSeek-R1需要8到16张H20显卡。此外，Qwen3-30B-A3B模型激活参数仅为30亿，却能达到上代320亿参数密集模型的性能，部署成本仅为DeepSeek R1的35%。

应用场景

Qwen3系列包含8款不同规格的模型，覆盖从移动设备到大型服务器的全部应用场景。其中，最小的0.6B模型专为移动设备优化，而旗舰模型则适合对安全性有要求、对性能有极致要求的企业级应用。此外，Qwen3还支持119种语言和方言，进一步扩展了其应用范围。

开源与生态

Qwen3系列模型全部开源，并采用Apache 2.0协议，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用。这一举措极大地降低了AI应用的开发门槛，加速了整个行业的发展。

总结

Qwen3的发布不仅标志着中国开源大模型进入新阶段，还在性能与部署效率方面实现了双重突破。其混合专家架构和混合推理模式为AI应用提供了更高效、更经济的解决方案，有望推动AI技术在更多领域的广泛应用。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。