首页 > 快讯 > 阿里推出Qwen3-4B：轻量但强大，AI运算直达手机！

阿里推出Qwen3-4B：轻量但强大，AI运算直达手机！

发布时间：2025-08-07 10:51:02 | 责任编辑：张毅 | 浏览量：69 次

阿里巴巴通义千问团队推出全新Qwen3-4B系列模型，包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型（SLM）技术的重要突破，为移动端AI应用开辟了新的发展路径。
新发布的模型最大特色在于实现了性能与体积的平衡优化。尽管参数规模相对较小，但这些模型能够高效运行在智能手机等移动设备上，有效解决了传统大模型对硬件资源的高依赖问题。
在技术规格方面，Qwen3-4B-Instruct-2507在通用能力上取得显著进展。该模型具备更强的指令理解和执行能力，响应速度明显提升，特别适用于内容创作和工具调用等实际应用场景。值得注意的是，模型的上下文处理能力已扩展至256K，使其能够处理长文本任务，这在同规模模型中表现突出。
性能对比数据显示，Qwen3-4B-Instruct-2507已经超越了闭源小型模型GPT-4.1-nano的表现水平，同时接近同厂牌大规模模型Qwen3-30B-A3B（非推理版本）的能力，这一成就为移动端AI应用提供了强有力的技术支撑。
在专业推理能力方面，Qwen3-4B-Thinking-2507展现出色表现。该模型在权威数学推理评测AIME25中获得81.3分的高分，显示出强大的数学和逻辑推理能力。这一成绩与中等规模的Qwen3-30B-Thinking模型相当，证明了小型模型在复杂问题求解方面的潜力。
从产业发展角度看，Qwen3-4B系列的发布对Agentic AI（智能代理）技术发展具有重要意义。随着模型轻量化程度的提高和性能的优化，AI助手能够更好地集成到各类移动应用中，为用户提供更加便捷的智能服务体验。
这一技术进展反映出当前AI行业的重要趋势:在追求模型能力不断提升的同时，如何实现资源效率的最大化正成为关键技术挑战。阿里通义千问在小型高效模型方面的突破，为整个行业提供了有价值的技术路径参考。
对于普通用户而言，这意味着未来将能在个人移动设备上享受到接近大型模型水准的AI服务，而无需依赖云端计算资源，这将显著改善用户体验并降低使用成本。

阿里昨晚低调放出的 Qwen3-4B-Instruct-2507 / Thinking-2507 这对“双胞胎”，把“小模型”这件事直接卷出了新高度——

体积小到离谱

4B 参数，量化后 2 GB 左右，主流手机（甚至十年前的老机型）就能本地跑，树莓派也行。
性能却越级
- 通用版（Instruct）直接干掉了闭源的 GPT-4.1-nano，上下文一口气拉到 256 K。
- 推理版（Thinking）在数学基准 AIME25 里拿了 81.3 分，比 Claude 4 Opus 还高。
双模式一键切换

非推理模式“秒回”，推理模式“慢想”，一个模型两种性格，省得再分别部署。
落地无门槛

官方已在 Hugging Face、魔搭社区开源；英特尔、海光等芯片厂也第一时间做了适配，手机、PC、车机即插即用。

一句话总结：Qwen3-4B 把原来需要大显存独显才能跑的能力，“塞”进了每个人的口袋里。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。