首页 > 快讯 > 美团推出 LongCat-Video 视频生成系统,首次确保时序连贯性和运动逻辑性

美团推出 LongCat-Video 视频生成系统,首次确保时序连贯性和运动逻辑性

发布时间:2025-10-27 10:49:01 | 责任编辑:吴昊 | 浏览量:7 次

今日,美团 LongCat 团队正式发布了其全新的视频生成模型 ——LongCat-Video。这一模型以其精准重构真实世界运行状态的能力,标志着美团在探索 “世界模型” 领域的重大进展。世界模型是实现下一代人工智能的核心引擎,能够帮助 AI 更好地理解、预测和重构真实世界的动态。
LongCat-Video 基于先进的 Diffusion Transformer(DiT)架构,集成了文生视频、图生视频和视频续写等多项核心功能。这一创新模型通过 “条件帧数量” 的设定,有效实现了任务的灵活区分,确保在不同输入条件下均能发挥出色的生成能力。LongCat-Video 在文生视频生成上能够输出720p、30fps 的高清视频,并具备开源领域领先的语义理解和视觉呈现能力。此外,图生视频能够在动态过程中严格保留参考图像的属性与风格,展现出自然流畅的运动表现。
最为引人瞩目的是 LongCat-Video 的长视频生成能力。该模型通过视频续写任务的预训练,能够稳定输出达5分钟的连贯长视频,同时避免常见的色彩漂移、画质降解和动作断裂等问题。这一技术突破不仅提升了视频生成的质量,也为自动驾驶、具身智能等深度交互场景提供了坚实的技术基础。
在高效推理方面,LongCat-Video 采用了 “二阶段粗到精生成” 策略,并结合块稀疏注意力(BSA)和模型蒸馏优化,大幅提升了视频生成的速度和质量。该模型的推理速度提升至10.1倍,确保在处理长视频时依旧保持优异的生成质量。
LongCat-Video 经过严格的内部和公开基准测试,显示出在文本对齐、视觉质量和运动质量等多个维度的优秀性能,综合能力达到当前开源领域的 SOTA(State of the Art)水平。团队表示,LongCat-Video 的发布将大大简化长视频的创作过程,使创作者能够从1秒钟的灵感跃升至5分钟的成片。
为了让更多人体验这一先进技术,美团已在 GitHub 和 Hugging Face 上发布了 LongCat-Video 的相关资源。该项目不仅为个人创作者提供了强大的工具,也为整个视频创作行业注入了新的活力。
LongCat-Video 的发布,不仅代表着技术的进步,更是美团在智能创作领域迈出的重要一步。随着这一模型的广泛应用,未来的长视频创作将变得更加简单而富有创意。

美团推出 LongCat-Video 视频生成系统,首次确保时序连贯性和运动逻辑性

这是一篇关于美团发布 LongCat-Video 视频生成模型,开实现时序一致性与物理运动合理性的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐