首页 > 快讯 > 震撼发布!Black Forest FLUX.1 Kontext [dev] 开源版本,图像编辑能力比肩GPT-4o

震撼发布!Black Forest FLUX.1 Kontext [dev] 开源版本,图像编辑能力比肩GPT-4o

发布时间:2025-06-27 09:17:50 | 责任编辑:张毅 | 浏览量:15 次

Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。
这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。
核心功能:上下文感知与精准编辑
FLUX.1Kontext [dev] 的最大亮点在于其 上下文感知图像生成与编辑能力。与传统仅基于文本提示的图像生成模型不同,该模型能够同时理解文本和图像输入,实现真正的上下文生成与编辑。
用户可以通过简单的文本指令修改现有图像,例如更改特定区域的颜色、风格或背景,同时保持角色或对象的风格一致性。此外,模型支持多次迭代编辑,最大程度减少视觉漂移,确保图像质量和一致性。
开源赋能社区创新
作为开源模型,FLUX.1Kontext [dev] 采用非商业许可,兼容之前的FLUX.1[dev]推理代码,允许研究人员和艺术家在个人、科研及特定商业场景下自由使用。
Black Forest Labs表示,该模型通过指导蒸馏技术训练,显著提升了效率,为社区提供了定制化开发的可能性。小编注意到,模型已在多个平台上线,包括Replicate、Hugging Face等,社区开发者已开始探索其在艺术创作、内容生成等领域的创新应用。
负责任的AI开发
Black Forest Labs强调对生成式AI技术的负责开发。在FLUX.1Kontext发布前,团队通过数据过滤和与Internet Watch Foundation合作,减少了不安全内容生成的风险。
模型输出内容还采用C2PA标准添加加密签名元数据,确保内容溯源。此外,Black Forest Labs将通过API监控使用情况,防止违反政策的行为,展现了其在技术创新与伦理平衡上的努力。
行业影响与未来展望
FLUX.1Kontext [dev] 的开源发布标志着图像编辑领域的又一里程碑。小编认为,其高效的迭代编辑能力和对消费级硬件的适配性,将极大降低专业图像编辑的门槛,助力更多创作者实现创意。相较于OpenAI的GPT-4o图像编辑功能,FLUX.1Kontext [dev] 在速度和成本上更具优势,预计将推动开源社区与闭源模型的竞争。
未来,Black Forest Labs计划进一步优化模型,并探索文本到视频的扩展应用,为生成式AI注入新的活力。
开源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Github:https://github.com/black-forest-labs/flux

震撼发布!Black Forest FLUX.1 Kontext [dev] 开源版本,图像编辑能力比肩GPT-4o

Black Forest Labs 开源的 FLUX.1 Kontext [dev] 是一款强大的图像编辑模型,其目标是提供媲美甚至超越 GPT-4o 的图像编辑能力。以下是关于该模型的详细介绍:

技术特点

  • 上下文感知:FLUX.1 Kontext 能够同时理解文本和图像输入,实现真正的“上下文生成与编辑”,用户可以像使用 Photoshop + GPT 一样自然地用“图+文”控制图像生成与修改。

  • 角色一致性:在多个场景中保持人物或元素的一致性,即使经过多次修改,图像中的关键特征和构图逻辑也能保持不变。

  • 局部编辑:可以对图像中的特定部分进行精准修改,而不影响其他区域。

  • 风格参考:可以根据参考图像的风格生成新场景。

  • 快速交互:推理速度极快,支持实时操作,适合快速试错与调整。

性能对比

  • 编辑精度:FLUX.1 Kontext 在图像编辑精度上超越 GPT-4o 达 43%。

  • 处理速度:FLUX.1 Kontext 的生成速度比 GPT-4o 快 200-300%,其 [pro] 版本生成一张图像仅需 8-10 秒。

  • 成本控制:FLUX.1 Kontext 的成本相比 GPT-4o 降低了 65%,其 [pro] 版本定价为每张图像 0.04 美元。

  • 分辨率支持:FLUX.1 Kontext 支持最高 2K 分辨率的图像输出,而 GPT-4o 的输出分辨率最高为 1024x1024。

开源与可用性

  • FLUX.1 Kontext [dev] 是开源版本,拥有 12B 参数,可在消费级硬件上运行。

  • 该模型在 FLUX.1 非商业许可下开源,支持研究与非商业用途,权重可通过 Hugging Face 获取。

  • 多个合作方(如 FAL、Replicate、Runware、DataCrunch、TogetherAI)提供云端或本地推理支持。

适用场景

  • 电商产品图片编辑:FLUX.1 Kontext 在批量修改商品颜色、背景等方面表现出色,编辑精度高达 96.8%,且成本更低。

  • 社交媒体内容创作:在风格化处理人物照片时,FLUX.1 Kontext 能保持人物特征的同时实现风格转换,成功率更高。

FLUX.1 Kontext [dev] 的开源为开发者提供了强大的图像编辑工具,其在性能和成本上的优势使其在图像编辑领域具有广阔的应用前景。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复