首页 > 快讯 > 图像编辑开启“思考”新篇章：腾讯公布混元图像3.0图生图模型

图像编辑开启“思考”新篇章：腾讯公布混元图像3.0图生图模型

发布时间：2026-01-26 16:35:23 | 责任编辑：吴昊 | 浏览量：201 次

腾讯混元正式发布混元图像3.0图生图（HunyuanImage3.0-Instruct）模型。该模型目前已在腾讯旗下的 AI 助手“元宝”全端及腾讯混元官网同步上线，标志着腾讯在原生多模态图像处理领域取得新突破。
混元图像3.0图生图采用主流的混合专家（MoE）架构，总参数量达80B(激活参数约13B)。不同于传统的滤镜式修图，它被定义为一款“会思考”的图像编辑模型。在接收到用户的提示词和图片后，模型会先深度理解图像内容，随后自主推理出需要修改的区域和步骤，并精准保留无需变动的图像细节，从而实现更具逻辑感的输出效果。
在功能层面，该模型展现了极高的灵活性。它不仅支持基础的元素增删、风格变换及老照片修复，还具备强大的多图融合能力，能将多张照片中的人物或元素提取并合成。对于普通用户而言，这意味着可以直接在元宝上快速制作个性化表情包、虚拟合拍，甚至完成专业的电商海报设计和游戏角色定制。
为了打磨这一模型，混元团队构建了千万量级的图生图数据集，覆盖超过80个细分任务。通过引入思维链训练和自研的 MixGRPO 算法，模型在指令响应速度和图像一致性上均有显著提升。无论是在情绪表现力还是生成真实感上，混元图像3.0图生图都为 AI 图像创作提供了更专业、更易用的工具选择。
划重点:
🧠 自主推理编辑:混元图像3.0图生图能够先理解原图再执行指令，自动分析修改区域并保持非编辑区的一致性。
🎨 多场景功能覆盖:支持老照片修复、人物合影合成及复杂的文字修改，可广泛应用于电商海报、游戏定制等创意领域。
⚡ 性能与效率双增:基于80B MoE 架构及千万级数据集训练，模型生成的图像情绪张力更强，且生成速度较前代有明显提升。

这是一篇关于图像编辑进入“思考”时代：腾讯发布混元图像 3.0 图生图模型的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：调查揭示 Google AI 在搜索中对 YouTube 的提及率远高于专业医疗平台

下一篇：启动全天候开源AI助手新时代：Clawdbot经由MiniMax M2.1强大引擎驱动

图像编辑开启“思考”新篇章：腾讯公布混元图像3.0图生图模型

最新Ai信息

最新Ai工具

热门AI推荐