首页 > 快讯 > 开源项目Z-Image图像模型由阿里巴巴发布，提供中英文双语文字渲染支持

开源项目Z-Image图像模型由阿里巴巴发布，提供中英文双语文字渲染支持

发布时间：2025-11-27 15:11:01 | 责任编辑：张毅 | 浏览量：404 次

阿里巴巴通义实验室近日重磅开源全新图像生成模型 Z-Image，该模型凭借仅 6B 的参数规模，实现了高效的图像生成与编辑，其视觉质量已接近国际领先商业模型的三倍参数级别（约20B）。Z-Image 在生成速度和资源占用上表现出色，有望大幅推动 AI 图像生成工具向更普适的消费级应用转型。
Z-Image 采用单流 DiT （Diffusion Transformer）架构，包含 Z-Image-Turbo（专注于快速推理）、Z-Image-Base（基础开发）和 Z-Image-Edit（图像编辑）三大核心变体，以满足不同的应用需求。
通过解耦 DMD 和 DMDR 等创新技术，该模型仅需 8个采样步骤即可输出高清逼真图像，显存占用控制在 16GB 以下，使其能在 NVIDIA RTX30系列等消费级显卡上流畅运行，在 H800GPU 上甚至可实现亚秒级的生成速度。
Z-Image 模型的关键优势在于其强大的提示增强与推理能力，能够超越表面的文字描述，融入“世界知识”进行语义对齐，确保输出图像的光影自然、细节丰富。它不仅支持复杂指令理解和多模态编辑任务，更在中英双语文字渲染方面展现出高精度，有效解决了传统 AI 图像模型在文本处理上的痛点。
业内测试显示，Z-Image 在人像生成、场景构图和编辑一致性上表现抢眼，在 ComfyUI 框架下的测试中超越了部分 SDXL 基线模型，尤其在中文海报渲染和 NSFW 内容处理上表现出优异的稳定性。
此次 Z-Image 的发布正值全球图像生成模型竞赛加剧之际，其轻量高效的设计策略，与日前黑森林实验室发布的32B 参数的 Flux.2等大型模型形成鲜明对比，凸显了中国 AI 企业在资源优化和降本增效上的创新路径。
分析人士认为，Z-Image 的 Apache2.0开源许可及其在 GitHub、Hugging Face 和 ModelScope 平台的全面可用性，极大地降低了开发者和创意人员的微调门槛。随着此类高效模型的迭代，AI 图像工具预计将在 2026年加速渗透至移动端和边缘设备，全面赋能电商、影视和游戏等产业。

这是一篇关于阿里巴巴开源 Z-Image 图像模型：支持中英双语文字渲染的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：汇丰银行预估 OpenAI 未来算力需求将需超过 2070 亿资金支持

下一篇：发布新夸克AI眼镜：配备双旗舰芯片并链接阿里千问

开源项目Z-Image图像模型由阿里巴巴发布，提供中英文双语文字渲染支持

最新Ai信息

最新Ai工具

热门AI推荐