海外访问:www.kdjingpai.com
Ctrl + D 收藏本站

MoviiGen1.1 是由 ZuluVision 开发的一款开源人工智能工具,专注于从文本生成高质量视频。它支持 720P 和 1080P 分辨率,特别适合需要电影级视觉效果的专业视频制作。用户可以通过简单的文本描述生成具有自然动态和一致美感的视频。MoviiGen1.1 提供模型权重和推理代码,基于 PyTorch 框架,易于部署和使用。它的开放性和高性能使其成为视频创作者和开发者的理想选择,广泛应用于影视制作、广告和创意内容生成。

 

功能列表

  • 支持 720P 和 1080P 高分辨率视频生成,推荐 1080P 和 21:9 宽高比 (1920×832) 以获得电影级效果。
  • 提供文本转视频功能,通过描述场景、主体和动作生成高质量视频。
  • 包含提示词扩展模型,基于 Qwen2.5-7B-Instruct 微调,提升文本描述的细节和生成效果。
  • 开源模型权重和推理代码,支持本地部署和定制化开发。
  • 支持专业级视频生成,适合影视制作、广告和创意内容创作。
  • 提供 FastVideo 插件支持,优化视频生成性能。
  • 兼容 PyTorch 2.4.0 及以上版本,易于集成到现有开发环境。

 

使用帮助

安装流程

要使用 MoviiGen1.1,用户需先完成环境配置和模型安装。以下是详细步骤:

  1. 克隆仓库
    在终端运行以下命令,获取 MoviiGen1.1 源码:

    git clone https://github.com/ZulutionAI/MoviiGen1.1.git
    cd MoviiGen1.1
    
  2. 安装依赖
    确保系统已安装 Python 3.10 及以上版本,并安装 PyTorch 2.4.0 或更高版本。运行以下命令安装依赖:

    pip install -r requirements.txt
    

    此外,需根据官方指引安装 FastVideo 插件,具体说明可在 FastVideo 的 GitHub 页面找到。

  3. 下载模型
    MoviiGen1.1 模型托管在 Hugging Face 上。使用 huggingface-cli 下载模型文件:

    pip install "huggingface_hub[cli]"
    huggingface-cli download ZuluVision/MoviiGen1.1 --local-dir ./MoviiGen1.1
    

    模型支持 T2V-14B 架构,下载后会存储在 ./MoviiGen1.1 目录中。

  4. 验证环境
    确保 GPU 硬件支持(推荐 20GB 以上显存以生成 1080P 视频)。检查 PyTorch 是否正确识别 GPU:

    python -c "import torch; print(torch.cuda.is_available())"
    

    输出 True 表示环境配置成功。

使用方法

MoviiGen1.1 的核心功能是通过文本提示词生成视频。以下是具体操作流程:

1. 基本视频生成

用户可以通过运行推理脚本生成视频。示例命令:

PYTHONPATH=. python scripts/inference/generate.py --ckpt_dir ./MoviiGen1.1 --prompt "一个穿红裙的女子在街头漫步,背景是繁忙的都市街道,阳光洒在地面,镜头缓慢移动,展现明亮色彩。"
  • --ckpt_dir:指定模型文件路径。
  • --prompt:输入描述场景的文本,建议 100-200 字,包含场景、主体、动作、审美风格和镜头移动。

2. 使用提示词扩展模型

MoviiGen1.1 提供基于 Qwen2.5-7B-Instruct 微调的提示词扩展模型,增强文本描述的细节。启用该功能:

PYTHONPATH=. python scripts/inference/generate.py --ckpt_dir ./MoviiGen1.1 --prompt "一个穿红裙的女子在街头漫步。" --use_prompt_extend --prompt_extend_model ZuluVision/MoviiGen1.1_Prompt_Rewriter

提示词扩展会自动丰富描述,例如补充场景细节、光影效果等,提升生成视频的质量。

3. 推荐提示词格式

为获得最佳效果,提示词需包含以下元素:

  • 场景描述:如“烟雾弥漫的侦探办公室,百叶窗投下锐利阴影”。
  • 主体:如“疲惫的侦探坐在桌后”。
  • 动作:如“点燃香烟,吐出一缕烟雾”。
  • 审美风格:如“黑白高对比度,1940年代黑色电影风格”。
  • 镜头移动:如“静态中景镜头,聚焦侦探”。
    示例提示词:

在烟雾弥漫的侦探办公室,百叶窗投下锐利阴影,疲惫的侦探坐在桌后,点燃香烟,吐出一缕烟雾。画面为黑白高对比度,呈现1940年代黑色电影风格,镜头为静态中景,聚焦侦探,营造压抑氛围。

4. 输出设置

  • 分辨率:默认支持 720P 和 1080P,推荐 1080P(1920×832)以获得电影级效果。
  • 生成时长:生成 1080P 视频需较长时间,建议使用高性能 GPU(如 RTX 4090,20GB 显存)。
  • 输出路径:生成视频默认保存在 ./MoviiGen1.1/output 目录,可在推理脚本中指定其他路径。

5. 优化性能

  • FastVideo 插件:安装后可加速视频生成,具体配置参考 FastVideo 文档。
  • 显存优化:若显存不足,可尝试生成 720P 视频,降低内存需求。
  • 批量处理:支持多提示词批量生成,修改推理脚本以循环处理多个提示词。

注意事项

  • 确保网络连接稳定,以下载模型和依赖。
  • 高分辨率视频生成对硬件要求较高,建议使用高性能 GPU。
  • 提示词质量直接影响生成效果,建议多尝试不同描述风格。
  • 定期检查 GitHub 仓库更新,获取最新模型和代码。

 

应用场景

  1. 影视制作
    MoviiGen1.1 适合生成电影预告片、短片或场景片段。用户可通过详细的文本描述快速生成具有专业光影效果的视频,降低传统拍摄成本。
  2. 广告创意
    广告团队可利用 MoviiGen1.1 生成产品宣传视频。例如,输入描述品牌产品的场景和动作,快速生成高质量广告素材,节省制作时间。
  3. 游戏开发
    游戏开发者可使用 MoviiGen1.1 生成过场动画或环境背景视频,支持高分辨率和定制化风格,满足游戏叙事需求。
  4. 教育与培训
    教育工作者可生成教学视频,展示历史场景或科学实验的动态画面,提升教学内容的吸引力和直观性。

 

QA

  1. MoviiGen1.1 是否免费?
    是的,MoviiGen1.1 是开源工具,模型权重和推理代码免费提供,用户可从 GitHub 和 Hugging Face 下载使用。
  2. 生成 1080P 视频需要什么硬件?
    推荐使用至少 20GB 显存的 GPU(如 NVIDIA RTX 4090)。生成 720P 视频可用较低配置,但仍需 GPU 支持。
  3. 如何优化生成的视频质量?
    使用详细的提示词,包含场景、主体、动作和风格描述。启用提示词扩展模型可进一步提升细节。确保硬件支持 1080P 生成以获得最佳效果。
  4. 是否支持 Windows 和 Linux?
    是的,MoviiGen1.1 支持 Windows 和 Linux,只要安装了 Python 3.10+ 和 PyTorch 2.4.0+ 即可运行。
  5. 生成视频需要多长时间?
    取决于硬件和分辨率。1080P 视频可能需要数分钟到数小时,720P 较快。使用高性能 GPU 和 FastVideo 插件可缩短时间。
0已收藏
0已赞

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文