首页 > 快讯 > 创新AI生图模型TarFlow由苹果采用“归一化流”技术打造

创新AI生图模型TarFlow由苹果采用“归一化流”技术打造

发布时间:2025-06-24 09:50:38 | 责任编辑:张毅 | 浏览量:3 次

苹果公司最近发布了一篇重要论文,展示了他们在人工智能领域的最新进展。与业界普遍采用的扩散模型或自回归模型不同,苹果选择了一条被广泛忽视的道路 —— 归一化流(Normalizing Flows)技术。该技术的核心是通过数学变换,将真实世界的数据(例如图像)转化为结构化的噪声,并能将其恢复为清晰的图像样本。
归一化流的最大优势在于它能够精确计算生成图像的概率,而这是许多扩散模型无法做到的。这使得归一化流在那些对概率要求较高的任务中显得格外重要。不过,这种技术的研发成本相对较高,且早期模型常常存在模糊和缺乏细节的问题。
在此次研究中,苹果推出了一种名为 TarFlow(Transformer AutoRegressive Flow)的新型归一化流模型。该模型的工作原理是将一张待生成的图像分割成多个小块,并逐块生成相应的像素值。每个小块的生成都依赖于已生成部分的内容,这样可以有效避免将图像压缩为固定词汇表时造成的质量损失。
然而,TarFlow 在生成高分辨率图像时仍面临挑战,因此苹果提出了增强版的 STARFlow(Scalable Transformer AutoRegressive Flow)。该模型通过在 “潜空间” 中进行工作,首先生成图像的压缩表示,然后利用解码器进行放大。这种方法不仅提升了生成效率,同时也避免了大量像素值的预测,先关注图像的整体结构。
此外,STARFlow 在处理文本提示方面也有了显著改进。它不再依赖于内建的文本编码器,而是能够调用现有的语言模型,比如谷歌的小型语言模型 Gemma,这样就可以更灵活地处理用户的语言指令。通过这种方式,STARFlow 能够专注于图像细节的生成与优化,进一步提升了生成图像的质量。
苹果在 AI 生图领域的探索标志着他们在技术创新上的持续努力,也为未来的图像生成技术提供了新的思路和方向。
划重点:
🌟 苹果采用 “归一化流” 技术开发新的 AI 生图模型,区别于传统的扩散模型。
🖼️ TarFlow 模型通过拆分图像块生成,避免了压缩造成的质量损失。
🚀 STARFlow 在潜空间工作,并支持调用现有语言模型优化文本提示处理。

创新AI生图模型TarFlow由苹果采用“归一化流”技术打造

苹果公司近期推出了基于“归一化流”技术的创新AI生图模型TarFlow。归一化流是一种通过数学变换将真实世界的数据(如图像)转换成结构化噪声,并再将噪声还原为图像样本的生成模型。TarFlow的核心思路是将待生成的大图拆分成“小区块”,以区块为单位生成像素值,每一块图像像素值的生成都依赖于前面已生成的部分,从而避免了图像在压缩为固定词汇表时产生的质量损失与表现僵化的问题。

然而,TarFlow在生成高分辨率图像方面仍存在局限。为此,苹果进一步提出了增强版本STARFlow(Scalable Transformer AutoRegressive Flow)。STARFlow不再直接在像素层面生成图像,而是在“潜空间”中工作,先生成图像的压缩表示,再通过解码器进行放大还原。这种方法不仅提升了生成效率,还能在不损失质量的前提下处理高分辨率图像。此外,STARFlow还改进了对文本提示的处理方式,支持调用现有语言模型来处理用户的语言指令。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复