使用前说明：本项目无法正常运行是因为没有选择GPU部署

完整的运行，请参考工程Files或者复制这个space，部署时最低选择 Nvidia 1xL40S 48G VRAM

🎬 Wan2.2-S2V-14B 视频生成器

模型介绍: Wan2.2-S2V-14B 是一个强大的图像到视频生成模型，支持音频引导。

使用方法:

点击"🚀 加载模型"按钮下载模型
填写提示词、上传图片和音频
调整参数后点击"🎬 开始生成"

注意: 首次使用需要下载约14GB的模型文件，请耐心等待。

📥 模型管理

模型状态

📝 必需参数

任务类型

分辨率

提示词 *

输入图片 *

输入音频 *

🎥 生成结果

输出视频

生成状态

📋 使用说明

参数说明:

分辨率: 选择适合你需求的视频尺寸
提示词: 用英文描述想要的视频内容，越详细越好
图片: 上传参考图片，模型会基于此生成视频
音频: 上传音频文件，模型会结合音频内容生成视频

高级参数:

帧数 (frame_num/infer_frames): 控制视频长度，8-32帧
引导强度 (sample_guide_scale): 生成质量控制，1.0-20.0
推理步数 (sample_steps): 生成精度，10-100步
随机种子 (base_seed): 结果重现，-1为随机

优化建议:

首次使用建议保持默认参数
如果显存不足，可以降低分辨率和帧数
提示词使用英文效果更好
音频文件建议使用清晰的语音或音乐

注意事项:

生成时间取决于参数设置，通常需要5-10分钟
确保上传的图片和音频文件格式正确
如果遇到错误，请检查参数设置和文件格式