Hugging Face推出开放权重模型贡献榜单:Qwen及DeepSeek中国团队位列前15名
发布时间:2025-06-11 11:24:06 | 责任编辑:吴昊 | 浏览量:14 次
全球知名开源AI平台Hugging Face近日发布开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名,彰显了中国在全球开源AI领域的技术实力与影响力。该榜单表彰为开源社区提供高质量模型权重的团队,其模型广泛应用于学术与产业创新。
由阿里巴巴云智能集团支持的Qwen团队,以Qwen3系列模型在指令跟随、代码生成等任务中的优异表现受到社区青睐。Qwen2.5-72B系列位列开源大语言模型前列,其轻量化模型QwQ-32B通过强化学习优化,在数学推理和代码生成中媲美大型模型,大幅降低部署成本。
DeepSeek则以低成本、高性能的R1系列模型闻名。R1-0528在LiveCodeBench排行榜中超越多个国际竞品,仅次于OpenAI顶尖模型。其轻量化版本DeepSeek-R1-0528-Qwen3-8B通过知识蒸馏技术,单GPU即可运行,在AIME2025数学测试中击败Google的Gemini2.5Flash,展现了在特定领域的竞争优势。
Qwen和DeepSeek的入榜反映了中国AI团队在开源生态中的崛起。Hugging Face负责人表示,两团队的贡献为全球开发者提供了高效资源。NVIDIA首席执行官黄仁勋也赞扬其性能与成本平衡正在重塑AI格局。未来,Qwen计划探索多模态技术,DeepSeek则将推出R2模型,持续推动AI创新。
Hugging Face 模型发布热力图: https://huggingface.co/spaces/cfahlgren1/model-release-heatmap
根据最新的信息,Hugging Face的开放权重模型贡献榜上,中国团队Qwen和DeepSeek确实表现突出,跻身TOP15。
Qwen团队
-
开源贡献:Qwen团队的开源模型在Hugging Face社区中非常受欢迎。例如,Qwen-32B模型被广泛用于作为基座模型进行精调和蒸馏,衍生出大量高性能的模型。此外,Qwen团队还开源了多种不同参数规模的模型,如Qwen3-Embedding-0.6B、Qwen3-Embedding-8B等。
-
社区影响力:Qwen的衍生模型数量已突破10万,成为全球最大开源模型族群。这表明Qwen模型在开源社区中的广泛传播和应用,吸引了大量开发者基于其进行二次开发和创新。
DeepSeek团队
-
开源贡献:DeepSeek团队也积极参与开源社区的建设。例如,DeepSeek-R1模型的推理能力被蒸馏出6个开源模型,其中4个是基于Qwen-32B蒸馏的。这表明DeepSeek团队不仅自身开发高性能模型,还通过开源的方式促进社区的发展。
-
模型性能:DeepSeek的模型在推理能力上表现出色,其R1模型与OpenAI的O1模型等尖端推理模型具有相当的数学及编码能力。
总结
Qwen和DeepSeek团队在Hugging Face开放权重模型贡献榜上的表现,体现了中国AI团队在开源领域的强大实力和积极贡献。他们的开源模型不仅推动了技术的传播和创新,还为全球开发者提供了丰富的资源和工具,促进了AI技术的民主化。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。