首页 > 快讯 > 图像编辑开启“思考”新篇章:腾讯公布混元图像3.0图生图模型

图像编辑开启“思考”新篇章:腾讯公布混元图像3.0图生图模型

发布时间:2026-01-26 16:35:23 | 责任编辑:吴昊 | 浏览量:69 次

腾讯混元正式发布混元图像3.0图生图(HunyuanImage3.0-Instruct)模型。该模型目前已在腾讯旗下的 AI 助手“元宝”全端及腾讯混元官网同步上线,标志着腾讯在原生多模态图像处理领域取得新突破。
混元图像3.0图生图采用主流的混合专家(MoE)架构,总参数量达80B(激活参数约13B)。不同于传统的滤镜式修图,它被定义为一款“会思考”的图像编辑模型。在接收到用户的提示词和图片后,模型会先深度理解图像内容,随后自主推理出需要修改的区域和步骤,并精准保留无需变动的图像细节,从而实现更具逻辑感的输出效果。
在功能层面,该模型展现了极高的灵活性。它不仅支持基础的元素增删、风格变换及老照片修复,还具备强大的多图融合能力,能将多张照片中的人物或元素提取并合成。对于普通用户而言,这意味着可以直接在元宝上快速制作个性化表情包、虚拟合拍,甚至完成专业的电商海报设计和游戏角色定制。
为了打磨这一模型,混元团队构建了千万量级的图生图数据集,覆盖超过80个细分任务。通过引入思维链训练和自研的 MixGRPO 算法,模型在指令响应速度和图像一致性上均有显著提升。无论是在情绪表现力还是生成真实感上,混元图像3.0图生图都为 AI 图像创作提供了更专业、更易用的工具选择。
划重点:
🧠 自主推理编辑:混元图像3.0图生图能够先理解原图再执行指令,自动分析修改区域并保持非编辑区的一致性。
🎨 多场景功能覆盖:支持老照片修复、人物合影合成及复杂的文字修改,可广泛应用于电商海报、游戏定制等创意领域。
⚡ 性能与效率双增:基于80B MoE 架构及千万级数据集训练,模型生成的图像情绪张力更强,且生成速度较前代有明显提升。

图像编辑开启“思考”新篇章:腾讯公布混元图像3.0图生图模型

这是一篇关于图像编辑进入“思考”时代:腾讯发布混元图像 3.0 图生图模型的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐