首页 > 快讯 > 非思考模式下通义千问开源版本Qwen3-30B-A3B-Instruct-2507的探索

非思考模式下通义千问开源版本Qwen3-30B-A3B-Instruct-2507的探索

发布时间：2025-07-30 08:32:37 | 责任编辑：张毅 | 浏览量：649 次

7月29日，Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升，标志着该模型在非思考模式（non-thinking mode）下仅激活3B参数，就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。
新版本的Qwen3-30B-A3B-Instruct-2507在通用能力上取得了巨大进步，涵盖了指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个方面。这一改进不仅提升了模型的多功能性，还使其在处理复杂任务时表现得更加智能和高效。此外，该模型在多语言的长尾知识覆盖方面也取得了显著进步，能够更好地理解和生成多种语言的文本，这对于全球化的应用场景来说是一个巨大的优势。
在主观和开放性任务中，新模型与用户偏好的对齐更加紧密，能够生成更高质量的文本，为用户提供更有帮助的回答。这一改进使得模型在与用户的交互中更加自然和人性化，能够更好地满足用户的需求。同时，长文本理解能力也得到了显著提升，达到了256K，这进一步增强了模型的上下文理解能力，使其能够处理更长的文本输入，从而更好地理解和生成复杂的文本内容。
为了方便开发者和研究人员使用和测试这一新模型，开发团队已经在魔搭社区和HuggingFace等平台开源了Qwen3-30B-A3B-Instruct-2507。此外，开发团队还邀请用户前往QwenChat（chat.qwen.ai）直接体验这一新版本的强大功能。这一举措不仅展示了开发团队对模型性能的信心，也为用户提供了直接体验和反馈的机会，有助于进一步优化和改进模型。

阿里通义千问于 7 月 30 日推出 Qwen3-30B-A3B 模型的最新版本 Qwen3-30B-A3B-Instruct-2507，该模型采用非思考模式（non-thinking mode），长文本理解能力提升至 256K，仅激活 3B 参数，性能即可媲美 Gemini 2.5-Flash（non-thinking） 和 GPT-4o 等闭源模型。此外，该模型参数总量为 305 亿，激活参数为 33 亿，支持 262,144 tokens 的原生长上下文长度，专注于提升指令遵循、逻辑推理、数学、科学、编程和工具使用等通用能力，并显著增加了多语言长尾知识覆盖，使其在主观和开放式任务中更符合用户偏好，提供更高质量的文本生成。值得注意的是，该模型仅支持非思考模式，输出中不会生成 <think> 块，且无需再指定 enable_thinking=False。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：乐聚机器人获巨额投资，随着首款5G-A人形机器人开放源码鸿蒙及大额融资，未来智能制造将由其引领！

下一篇：谷歌推出NotebookLM视频概览功能，优化学习体验

非思考模式下通义千问开源版本Qwen3-30B-A3B-Instruct-2507的探索

最新Ai信息

最新Ai工具

热门AI推荐