Lightricks推出LTX-Video-13B优化模型!仅需10秒完成高清AI视频制作,实现速度与品质双重突破!
发布时间:2025-05-15 11:55:06 | 责任编辑:吴昊 | 浏览量:2 次
近日,以色列科技公司Lightricks发布了其开源AI视频生成模型的最新版本——LTX-Video-13B精炼模型(LTXV-13B v0.9.7-distilled)。这款模型以130亿参数为基础,通过多尺度渲染技术和高效量化优化,将视频生成速度提升至惊人的10秒以内,标志着AI视频生成技术的新里程碑。小编深入解析这一突破性进展,带您了解其技术亮点与行业影响。
项目地址:https://github.com/Lightricks/LTX-Video
模型地址:https://huggingface.co/spaces/Lightricks/ltx-video-distilled
技术突破:10秒生成高清视频
LTX-Video-13B精炼模型采用先进的多尺度渲染技术,通过从低分辨率草图逐步精炼至高清画质,显著缩短了视频生成时间。据小编了解,该模型能够在NVIDIA RTX4090等消费级GPU上实现10秒内生成1216×704分辨率视频,相较上一代模型提速近5倍,低分辨率预览甚至仅需3秒。这种速度突破使得实时视频生成成为可能,为创作者提供了前所未有的效率体验。
此外,该模型支持关键帧编辑、相机运动控制和多镜头序列,赋予用户更高的创作自由度。无论是生成动态场景还是复杂的人物动作,LTXV-13B都能呈现更流畅的运动轨迹和更清晰的细节,视频质量媲美专业影视作品。
开源赋能:低显存设备也能玩转AI视频
作为一款完全开源的模型,LTX-Video-13B精炼模型延续了Lightricks对技术普惠的承诺。小编注意到,该模型特别推出了量化版本(fp8)和LoRA适配版本,大幅降低了硬件门槛。即使在低显存设备上,用户也能运行该模型,生成高质量视频。这一特性尤其适合独立创作者和中小企业,极大地降低了AI视频制作的成本。
模型已在Hugging Face和GitHub上开放下载,并通过ComfyUI提供兼容支持,开发者可以轻松集成到现有工作流中。Lightricks还为年收入低于1000万美元的企业提供免费许可,进一步推动了AI视频技术的普及。
效率与质量兼得:30倍速度提升的秘密
LTX-Video-13B精炼模型不仅速度惊人,还在视频质量上实现了显著提升。得益于与Shutterstock和Getty Images的合作,该模型在高质量视频数据集上进行了训练,生成的视频画面更具电影感,场景连贯性更强。小编获悉,其核心技术UEfficient Q8内核优化了模型在消费级硬件上的性能,确保即便在普通笔记本电脑上也能实现高效运行。
相比同类模型,LTXV-13B的生成速度提高了30倍,生成一个视频的平均时间仅为37.59秒,而竞争对手在同等硬件上可能需要近25分钟。这种效率的飞跃,使其在实时生成、虚拟主播(VTubing)等场景中展现出巨大潜力。
行业影响:挑战OpenAI与Google的国产力量
Lightricks此次发布被业内视为对OpenAI Sora、Google Veo等巨头模型的强有力挑战。小编分析认为,LTX-Video-13B精炼模型以更低的训练成本(仅数千万美元)实现了媲美顶级模型的性能,展现了开源社区和中小型科技公司在AI领域的创新能力。其多尺度渲染和VACE模型推理等开源贡献,也为全球AI视频生成技术的发展注入了新活力。
对于创作者而言,LTXV-13B的出现意味着无需昂贵的专业设备,就能制作出高质量的动画、短片或营销视频。小编预测,该模型将加速AI视频工具在影视、广告和社交媒体领域的普及,重塑内容创作生态。
AI视频生成的“Deepseek时刻”
作为AI领域的专业媒体,小编认为,LTX-Video-13B精炼模型的发布不仅是Lightricks的技术巅峰之作,更是开源AI社区的一次集体胜利。其超高速生成能力和低硬件门槛,打破了AI视频生成的技术壁垒,让更多人能够参与到智能化创作中。
Lightricks发布的LTX-Video-13B精炼模型(LTXV-13B v0.9.7-distilled)是一款具有重大突破的AI视频生成模型,以下是其相关信息:
技术亮点
-
多尺度渲染技术:采用先进的多尺度渲染技术,先生成低分辨率草图,再逐步精炼至高清画质,显著缩短了视频生成时间。该技术通过逐层生成视频细节,类似于艺术家从草图到精细绘制的过程,使得生成的视频画面更具电影感,场景连贯性更强。
-
高效量化优化:推出了量化版本(fp8)和LoRA适配版本,大幅降低了硬件门槛,即使在低显存设备上,用户也能运行该模型,生成高质量视频。其量化版本能够在消费级GPU上高效运行,如在NVIDIA RTX4090等设备上实现10秒内生成1216×704分辨率视频,低分辨率预览甚至仅需3秒。
-
强大的创作控制:支持关键帧编辑、相机运动控制和多镜头序列,赋予用户更高的创作自由度。用户可以对起始帧和结束帧进行精细调整,模拟推拉、变焦、摇臂、轨道等摄像机操作,还能对视频中人物的面部表情进行调整。
性能优势
-
速度飞跃:相比上一代模型提速近5倍,相比同类模型,其生成速度提高了30倍,生成一个视频的平均时间仅为37.59秒,而竞争对手在同等硬件上可能需要近25分钟。
-
质量提升:得益于与Shutterstock和Getty Images的合作,该模型在高质量视频数据集上进行了训练,生成的视频画面更具电影感,场景连贯性更强。
开源与应用
-
完全开源:作为一款完全开源的模型,LTX-Video-13B精炼模型延续了Lightricks对技术普惠的承诺,用户可以在Hugging Face和GitHub上访问。
-
免费许可:Lightricks还为年收入低于1000万美元的企业提供免费许可,进一步推动了AI视频技术的普及。
-
易于集成:模型已在Hugging Face和GitHub上开放下载,并通过ComfyUI提供兼容支持,开发者可以轻松集成到现有工作流中。
行业影响
Lightricks此次发布被业内视为对OpenAI Sora、Google Veo等巨头模型的强有力挑战。其以更低的训练成本(仅数千万美元)实现了媲美顶级模型的性能,展现了开源社区和中小型科技公司在AI领域的创新能力。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。