首页 > 快讯 > 阿里通义千问发布Qwen3-VL紧凑型模型:4B与8B参数版表现几乎媲美先前72B高端版性能

阿里通义千问发布Qwen3-VL紧凑型模型:4B与8B参数版表现几乎媲美先前72B高端版性能

发布时间:2025-10-15 12:07:28 | 责任编辑:吴昊 | 浏览量:93 次

阿里巴巴通义千问团队近日发布了Qwen3-VL系列的两款轻量级模型——4B和8B参数版本。Qwen3-VL系列于上月首次亮相,是通义千问迄今推出的能力最强的视觉语言模型家族。此次新增的小参数版本旨在降低部署门槛,同时保持强劲的性能表现。
新发布的模型包含4B和8B两种参数规模,每种规模均提供Instruct(指令遵循)和Thinking(思维链推理)两个版本,为开发者提供了更灵活的选择空间。从功能定位来看,这两款模型在保持完整能力的前提下显著压缩了体积。
在技术实现上,新模型达成了三个核心目标。首先是大幅降低了硬件资源要求,参数规模的缩减使得显存占用明显减少,让开发者能够在更多类型的消费级和边缘设备上部署运行。其次,尽管模型尺寸大幅缩小,但完整继承了Qwen3-VL系列的所有核心能力,包括多模态理解、长文本处理和复杂推理等功能模块。
从性能表现来看,这两款轻量级模型在多项权威基准测试中展现出超越同等规模竞品的实力。在STEM学科问答、视觉问答(VQA)、光学字符识别(OCR)、视频理解以及Agent任务等场景中,4B和8B模型不仅超过了Google Gemini2.5Flash Lite和OpenAI GPT-5Nano等同类轻量级模型,在部分任务上甚至能够接近半年前发布的72B参数旗舰模型Qwen2.5-VL-72B的水平。
这一发布标志着大模型"小型化"趋势的又一进展。通过模型压缩和优化技术,开发团队在保持能力完整性的前提下实现了参数量与计算成本的大幅削减,为视觉语言模型在移动端、物联网设备等资源受限场景的应用铺平了道路。对于需要在本地部署或对推理成本敏感的企业用户而言,这两款新模型提供了更具性价比的解决方案。
模型地址:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

阿里通义千问发布Qwen3-VL紧凑型模型:4B与8B参数版表现几乎媲美先前72B高端版性能

这是一篇关于阿里通义千问推出Qwen3-VL轻量级模型:4B和8B参数版本性能逼近此前72B旗舰的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐