使用前说明:本项目无法正常运行是因为没有选择GPU部署

完整的运行,请参考工程Files或者复制这个space,部署时最低选择 Nvidia 1xL40S 48G VRAM

🎬 Wan2.2-S2V-14B 视频生成器

模型介绍: Wan2.2-S2V-14B 是一个强大的图像到视频生成模型,支持音频引导。

使用方法:

  1. 点击"🚀 加载模型"按钮下载模型
  2. 填写提示词、上传图片和音频
  3. 调整参数后点击"🎬 开始生成"

注意: 首次使用需要下载约14GB的模型文件,请耐心等待。

📥 模型管理

📝 必需参数

分辨率
8 32
1 20
10 100

🎥 生成结果

📋 使用说明

参数说明:

  • 分辨率: 选择适合你需求的视频尺寸
  • 提示词: 用英文描述想要的视频内容,越详细越好
  • 图片: 上传参考图片,模型会基于此生成视频
  • 音频: 上传音频文件,模型会结合音频内容生成视频

高级参数:

  • 帧数 (frame_num/infer_frames): 控制视频长度,8-32帧
  • 引导强度 (sample_guide_scale): 生成质量控制,1.0-20.0
  • 推理步数 (sample_steps): 生成精度,10-100步
  • 随机种子 (base_seed): 结果重现,-1为随机

优化建议:

  • 首次使用建议保持默认参数
  • 如果显存不足,可以降低分辨率和帧数
  • 提示词使用英文效果更好
  • 音频文件建议使用清晰的语音或音乐

注意事项:

  • 生成时间取决于参数设置,通常需要5-10分钟
  • 确保上传的图片和音频文件格式正确
  • 如果遇到错误,请检查参数设置和文件格式