首页 > 快讯 > 阿里巴巴发布增强版千问3向量模型,性能显著提升,直面谷歌及OpenAI的挑战

阿里巴巴发布增强版千问3向量模型,性能显著提升,直面谷歌及OpenAI的挑战

发布时间:2025-06-06 16:03:25 | 责任编辑:张毅 | 浏览量:71 次

在人工智能技术快速发展的今天,阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。该模型是基于千问3底座,为文本表征、检索和排序等任务进行优化,标志着阿里在 AI 领域的又一重大突破。
相较于前一版本,Qwen3-Embedding 在文本检索、聚类和分类等核心任务上的性能提升了超过40%。这一进步不仅让它在技术上更具竞争力,还使得它在 MTEB 等专业榜单中,超越了谷歌的 Gemini Embedding、OpenAI 的 text-embedding-3-large 以及微软的 multilingual-e5-large-instruct 等顶尖模型,获得了同类模型的最佳性能(SOTA)。
简单来说,向量模型可以看作是 AI 的 “翻译器”,它通过将文本和图片等非结构化信息转换为机器易于理解的向量,从而实现高效的信息分类、检索和排序。基于千问3模型,通义团队采用对比训练、SFT 和模型融合等多种方法,成功打造出这一新型向量模型,涵盖了文本嵌入模型 Qwen3-Embedding 及文本排序模型 Qwen3-Reranker。
值得一提的是,千问3向量模型具有强大的多语言能力,支持超过100种语言,包括多种编程语言,展现出卓越的多语言、跨语言及代码检索能力。这为全球开发者提供了更为广阔的应用空间。
此次开源的千问3向量模型共有9款,涵盖不同尺寸(0.6B、4B、8B 等)及 GGUF 版本,开发者可以根据需求选择合适的模型,并自由组合模块,甚至可以自定义向量或指令,以实现特定任务、语言和场景的深度优化。这一灵活性将极大提升开发者的工作效率。
目前,千问3Embedding 和 Reranker 模型已经在魔搭社区、Hugging Face 和 GitHub 等多个平台上开源,开发者还可以通过阿里云百炼直接使用 API 服务。自4月29日开源以来,千问3大模型在多个国际榜单中取得了开源冠军的好成绩。

阿里巴巴发布增强版千问3向量模型,性能显著提升,直面谷歌及OpenAI的挑战

6月6日,阿里巴巴开源了通义千问3全新的向量模型系列Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40%,在MTEB等权威专项榜单中超越了谷歌、OpenAI、微软等公司的顶尖模型。

千问3向量模型的特点

  • 性能大幅提升:千问3向量模型在文本检索、聚类、分类等核心任务上提升最高40%以上的性能。

  • 多语言支持:得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

  • 灵活的开源选择:此次共有9款千问3向量模型开源,涵盖0.6B、4B、8B等不同尺寸及GGUF版本,开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。

开源平台

目前,千问3 Embedding和Reranker模型均已在魔搭社区、Hugging Face和GitHub等平台上开源,开发者也可直接通过阿里云百炼使用API服务。

行业影响

千问3向量模型的开源,不仅为开发者提供了强大的工具,也进一步推动了AI技术的发展。其在性能上的显著提升和多语言支持能力,使其在国际舞台上具备了与谷歌、OpenAI等顶尖公司竞争的实力。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复