首页 > 快讯 > 颠覆算力独占格局:智谱与华为携手推出本土全流程多模态大型模型 GLM-Image

颠覆算力独占格局:智谱与华为携手推出本土全流程多模态大型模型 GLM-Image

发布时间:2026-01-14 10:56:16 | 责任编辑:吴昊 | 浏览量:5 次

智谱正式宣布联合华为开源新一代图像生成模型GLM-Image。该模型最大的突破在于,它是首个在国产芯片算力底座上完成从数据预处理到大规模训练全流程的 SOTA(州级水平)多模态模型 。
GLM-Image采用了创新的“自回归 + 扩散解码器”混合架构,成功实现了图像生成与语言模型的深度融合。这一架构设计让模型在处理“知识密集型”生成任务时表现优异,能够精准理解全局指令并刻画局部细节,有效解决了海报排版、PPT制作及复杂科普图生成等长期困扰 AI 绘画的难题。
GLM-Image 支持在单个模型中同时进行文本到图像和图像到图像的生成。
在技术指标上,GLM-Image展现了极强的中文理解与渲染能力。在多项复杂视觉文本生成榜单中,它均位列开源模型第一,尤其擅长处理极具挑战性的汉字生成任务。此外,该模型原生支持从1024到2048尺寸的任意比例图像生成,无需额外训练即可自适应多种分辨率。
目前,GLM-Image已在GitHub和Hugging Face等平台全面开源。为了降低使用门槛,其 API 调用价格低至每张图0.1元,智谱方面表示,未来还将推出经过速度优化后的新版本,进一步提升商用性价比。
GitHub:https://github.com/zai-org/GLM-Image
Hugging Face:https://huggingface.co/zai-org/GLM-Image
划重点:
🇨🇳 国产全栈自研:基于华为昇腾 Atlas800T A2设备与昇思 MindSpore 框架完成全流程训练,验证了国产算力训练顶尖模型的可行性。
🎨 文图融合突破:采用混合架构,在 LongText-Bench 等长文本渲染榜单中获得开源第一,大幅提升了汉字与复杂图文的生成准确率。
💰 高性价比开源:模型支持多种分辨率自适应生成,并以极低的 API 价格向创作者开放,旨在推动国产认知型生成技术的普及。

颠覆算力独占格局:智谱与华为携手推出本土全流程多模态大型模型 GLM-Image

这是一篇关于打破算力垄断:智谱联合华为发布首个全流程国产化多模态大模型 GLM-Image的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐