产品信息
什么是 Wan?
Wan:开放和高级大规模视频生成模型。
在此存储库中,我们提出了WAN2.1,这是一套全面开放的视频基础模型,它突破了视频生成的界限。 WAN2.1提供了以下关键功能:
SOTA性能:WAN2.1始终优于多个基准测试的现有开源模型和最先进的商业解决方案。
支持消费级GPU:T2V-1.3B型号仅需要8.19 GB VRAM,使其与几乎所有消费级GPU兼容。它可以在大约4分钟内在RTX 4090上生成5秒的480p视频(无需量化等优化技术)。它的性能甚至可以与某些封闭式模型相媲美。
多个任务:WAN2.1在文本到视频,图像到视频,视频编辑,文本到图像和视频对审计方面都表现出色,从而推进了视频生成领域。
视觉文本生成:WAN2.1是第一个能够生成中文和英语文本的视频模型,具有强大的文本生成,可增强其实际应用。
功能强大的视频VAE:Wan -vae提供出色的效率和性能,编码和解码任何长度的1080p视频,同时保留时间信息,使其成为视频和图像生成的理想基础。
如何使用 Wan?
Wan是一个开源且先进的大规模视频生成模型,提供全面的视频基础模型套件,在文本到视频、图像到视频、视频编辑等多种任务上表现卓越,并支持生成中英文文本。
Wan 的核心功能
文本到图像生成,AI赋能
文本到图像生成,AI驱动
Wan 的使用场景
- 根据文本描述生成视频
- 将静态图像转换为动态视频
- 对现有视频进行编辑处理
- 根据文本描述生成图像
- 生成包含中英文文本的视频内容
Wan 的常见问题
Wan做什么的?
我如何使用Wan?
Wan有哪些核心功能?
Wan有哪些应用场景?





















