阿里巴巴推出全新AI模型Qwen3,通义千问引领技术革新!
发布时间:2025-07-22 10:18:48 | 责任编辑:张毅 | 浏览量:14 次
阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新,推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。这一新版本的亮点在于它采用了非思考模式(Non-thinking),并且大幅提升了长文本处理的能力,扩展到256K 的文本长度。这一升级无疑将大幅提升模型的应用潜力,特别是在需要处理大量信息的场景中。
Qwen3模型的更新在魔搭社区和 HuggingFace 平台上开源,允许开发者和研究者自由使用与修改。这一举动不仅体现了阿里在开源领域的前瞻性,还为广大 AI 爱好者提供了丰富的实践机会。开发者们可以利用这一强大的模型进行各类应用开发,从文本生成到数据分析,几乎涵盖了当前热门的 AI 应用领域。
在当前人工智能迅猛发展的背景下,阿里通义千问的这一更新再次引发了行业的广泛关注。与其他大型 AI 模型如 OpenAI 的最新发布相比,Qwen3模型在处理复杂任务时的高效性和灵活性,将成为其竞争优势的一部分。此外,随着开源社区的支持,Qwen3模型的使用场景将会不断扩大,为用户提供更多可能。
Qwen3模型的更新不仅是技术上的一次突破,更是在推动 AI 技术普及和应用方面的重要一步。未来,我们期待看到这一模型在不同领域的表现,为各行各业带来更多智能化的解决方案。
阿里通义千问重磅发布 Qwen3 模型,AI 技术再升级!
北京时间 7 月 22 日凌晨,阿里云宣布更新旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本(命名为 Qwen3-235B-A22B-Instruct-2507-FP8),其通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,并在 GQPA、AIME25、LiveCodeBench、Arena-Hard 等多个测评中表现出色,超越 Kimi-K2、DeepSeek-V3 等顶尖开源模型及 Claude-Opus4-Non-thinking 等闭源模型。
本次更新将长文本支持提升至 256K,进一步增强了上下文理解能力。此外,Qwen3 采用混合专家(MoE)架构,总参数量 235B(激活 22B),预训练数据量达 36T Tokens,并通过四阶段后训练优化,显著提升了多语言长尾知识覆盖和用户偏好契合能力。
Qwen3 系列模型已开源(包括 235B 和 30B MoE 模型及 0.6B-32B Dense 模型),用户可在魔搭社区、HuggingFace 等平台获取。阿里云表示,Qwen3 的发布标志着阿里在大模型领域完成从技术追赶者到规则定义者的蜕变,其“快慢双思考”模式可大幅降低算力消耗,同时显著提升响应速度。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。