首页 > 快讯 > 谷歌发布BlenderFusion：革新视觉编辑与3D合成的崭新架构

谷歌发布BlenderFusion：革新视觉编辑与3D合成的崭新架构

发布时间：2025-08-11 10:25:55 | 责任编辑：张毅 | 浏览量：62 次

谷歌最近发布了一款名为 BlenderFusion 的创新框架，旨在提升3D 视觉编辑与生成合成的能力。这一新工具的推出，响应了当前图像生成领域的需求，特别是在复杂场景的处理上。传统的生成对抗网络和扩散模型在生成整体图像方面表现出色，但对于多个视觉元素的精确控制却相对有限。BlenderFusion 的诞生，为这一挑战提供了新的解决方案。
BlenderFusion 的工作流程主要分为三个阶段:分层、编辑和合成。首先，在分层阶段，BlenderFusion 会从输入的2D 图像中提取可编辑的3D 对象。研究人员使用了多种前沿的视觉基础模型，如 SAM2和 DepthPro，以便更准确地识别图像中的物体。通过这些模型，系统可以生成物体的3D 点云，为后续编辑奠定基础。
接下来，编辑阶段则充分发挥了 Blender 的强大功能。用户可以对导入的3D 实体进行多种操作，如移动、旋转和缩放等，甚至可以对物体的外观和材质进行精细调整。这一过程让用户能够灵活处理场景中的每一个元素，使得每次编辑都能高效反映在最终的渲染效果中。
在合成阶段，BlenderFusion 将经过编辑的3D 场景与背景进行融合，生成最终的图像。这一阶段依赖于强大的生成合成器，能够处理来自不同输入的细节信息，确保最终效果的高质量和连贯性。研究团队对现有的扩散模型进行了优化，使其能够有效整合编辑和源场景信息，从而提升合成效果。
通过 BlenderFusion，谷歌不仅展示了其在3D 视觉编辑领域的技术创新，还为用户提供了一种新的创作工具，使得复杂的视觉任务变得更加直观和高效。这一框架的推出，必将为设计师和创作者们的工作带来便利。
项目:https://blenderfusion.github.io/
划重点:
🌟 BlenderFusion 集成了先进的3D 编辑工具与扩散模型，实现了高效的3D 视觉编辑与生成合成。
🛠️ 该框架的工作流程包括分层、编辑和合成三个阶段，用户可以方便地编辑3D 对象并生成最终图像。
📈 谷歌的 BlenderFusion 通过优化模型，提升了对复杂场景的处理能力，助力设计师实现创意。

谷歌 DeepMind 团队 2025 年 6 月发布的 BlenderFusion（论文 arXiv:2506.17450）是一套“3D-锚定视觉编辑与生成合成”框架，能够在 2D 照片 → 可编辑 3D 场景 → 逼真的全新 2D 图片/视频 之间无缝切换，核心流程只有三步：

分层（Layering）
用 Segment Anything、DepthPro 等模型把输入图像里的物体、背景、相机参数全部分离，并转成带纹理的 3D 三角网格。
编辑（Editing）
这些 3D 实体被直接导入 Blender，用户可像在 3D 软件里一样 拖拽、旋转、缩放、替换物体，或改变材质、光照、相机路径；所有操作都基于真实 3D 几何，避免 2D 编辑常见的透视失真。
生成式合成（Compositing）
系统把“原始场景”和“编辑后的 Blender 渲染”同时送入一个 双流扩散模型（基于 Stable Diffusion 2.1 扩展），用
• 源遮罩（Source Masking） 让背景/物体替换更灵活
• 模拟物体抖动（Simulated Object Jittering） 训练模型把物体-相机运动彻底解耦，保证只改想改的部分

最终输出高保真、光影一致的合成图像或视频帧。

为什么“颠覆”

精准 3D 控制：传统扩散模型靠文字提示，常出现几何错位；BlenderFusion 把几何操作交给 Blender，扩散模型只负责“润色”，实现了像素级 3D 控制。
完全解耦：移动物体不会牵动背景，旋转相机也不会扭曲物体，首次在复杂多物体场景中达到 93.75% 的人类偏好率。
零门槛 3D 创作：无需手工建模，从一张手机照片即可在几分钟内完成原本需要专业团队数天的视觉特效任务。

项目资源

论文 & 演示视频：https://blenderfusion.github.io

代码与权重：尚未完全开源，但论文已给出完整技术细节，社区已有非官方实现计划。

一句话总结：BlenderFusion 把“专业 3D 软件的可控性”与“生成式 AI 的想象力”合二为一，让普通用户也能“一键把照片变 3D，再一键生成任何想要的重构图”。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： OpenAI 发布 GPT-5，但其中国商标申请遭遇拒绝

下一篇：预测2027年以后：AI的15年黑暗期将由前谷歌高管揭示

谷歌发布BlenderFusion：革新视觉编辑与3D合成的崭新架构

为什么“颠覆”

项目资源

最新Ai信息

最新Ai工具

热门AI推荐