首页 > 快讯 > 即将震撼发布的阿里Wan 2.2:开源AI视频生成技术迎战Sora

即将震撼发布的阿里Wan 2.2:开源AI视频生成技术迎战Sora

发布时间:2025-07-25 10:40:19 | 责任编辑:吴昊 | 浏览量:45 次

阿里巴巴云宣布其备受期待的视频生成AI模型Wan2.2即将在近期正式发布。作为Wan2.1的升级版本,Wan2.2预计在性能、效率和功能上实现重大突破,继续秉承阿里开源AI的战略,巩固其在全球AI视频生成领域的领先地位。继Wan2.1于2025年2月开源并取得广泛成功后,Wan2.2的推出引发了开发者社区和行业的热烈讨论。
Wan2.1凭借其时空变分自编码器(VAE)和扩散变换器(DiT)架构,已在VBench基准测试中以84.7%的得分超越OpenAI的Sora(84.28%)。据社交媒体讨论,Wan2.2预计进一步优化这些技术,显著提升视频生成速度和质量,尤其是在高分辨率(如1080p)和长视频生成中的表现。 预计新增功能包括:
Wan2.2的训练数据预计在Wan2.1(15亿视频、100亿图像)的基础上进一步扩充,优化数据筛选以提升生成内容的多样性和真实性。
Wan2.2将继续采用Apache2.0许可证,通过Alibaba Cloud ModelScope和Hugging Face免费提供代码和模型权重,支持学术研究和商业应用。Wan2.1已推出T2V-1.3B、T2V-14B、I2V-14B-720P和I2V-14B-480P四种变体,Wan2.2预计将新增更多模型变体,针对不同硬件和场景进一步优化。
开发者对Wan2.2的开源前景充满期待,认为其将进一步挑战OpenAI Sora等封闭模型的市场主导地位,推动AI视频生成技术的民主化。阿里此举不仅降低了技术门槛,也为全球开发者提供了更多创新空间。

即将震撼发布的阿里Wan 2.2:开源AI视频生成技术迎战Sora

阿里通义万相 Wan 2.1(万相)已开源,其 14B参数专业版 在权威评测集 VBench 中以 86.22% 的总分大幅超越 SoraLumaPika 等模型,稳居榜首。Wan 2.1 基于因果 3D VAE 和视频 Diffusion Transformer 架构,支持 文本到视频图像到视频视频编辑文本到图像视频到音频 等多种任务,并可生成中英文文本,支持 消费级 GPU 运行(1.3B 版本仅需 8.2GB 显存)。其开源采用 Apache 2.0 协议,全部推理代码和权重已上架 GitHubHuggingFace魔搭社区,支持 ComfyUI 工作流。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具