首页 > 快讯 > 非思考模式下通义千问开源版本Qwen3-30B-A3B-Instruct-2507的探索

非思考模式下通义千问开源版本Qwen3-30B-A3B-Instruct-2507的探索

发布时间:2025-07-30 08:32:37 | 责任编辑:张毅 | 浏览量:17 次

7月29日,Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升,标志着该模型在非思考模式(non-thinking mode)下仅激活3B参数,就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。
新版本的Qwen3-30B-A3B-Instruct-2507在通用能力上取得了巨大进步,涵盖了指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个方面。这一改进不仅提升了模型的多功能性,还使其在处理复杂任务时表现得更加智能和高效。此外,该模型在多语言的长尾知识覆盖方面也取得了显著进步,能够更好地理解和生成多种语言的文本,这对于全球化的应用场景来说是一个巨大的优势。
在主观和开放性任务中,新模型与用户偏好的对齐更加紧密,能够生成更高质量的文本,为用户提供更有帮助的回答。这一改进使得模型在与用户的交互中更加自然和人性化,能够更好地满足用户的需求。同时,长文本理解能力也得到了显著提升,达到了256K,这进一步增强了模型的上下文理解能力,使其能够处理更长的文本输入,从而更好地理解和生成复杂的文本内容。
为了方便开发者和研究人员使用和测试这一新模型,开发团队已经在魔搭社区和HuggingFace等平台开源了Qwen3-30B-A3B-Instruct-2507。此外,开发团队还邀请用户前往QwenChat(chat.qwen.ai)直接体验这一新版本的强大功能。这一举措不仅展示了开发团队对模型性能的信心,也为用户提供了直接体验和反馈的机会,有助于进一步优化和改进模型。

非思考模式下通义千问开源版本Qwen3-30B-A3B-Instruct-2507的探索

阿里通义千问于 7 月 30 日推出 Qwen3-30B-A3B 模型的最新版本 Qwen3-30B-A3B-Instruct-2507,该模型采用非思考模式(non-thinking mode),长文本理解能力提升至 256K,仅激活 3B 参数,性能即可媲美 Gemini 2.5-Flash(non-thinking)GPT-4o 等闭源模型。此外,该模型参数总量为 305 亿,激活参数为 33 亿,支持 262,144 tokens 的原生长上下文长度,专注于提升指令遵循、逻辑推理、数学、科学、编程和工具使用等通用能力,并显著增加了多语言长尾知识覆盖,使其在主观和开放式任务中更符合用户偏好,提供更高质量的文本生成。值得注意的是,该模型仅支持非思考模式,输出中不会生成 <think> 块,且无需再指定 enable_thinking=False

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐