MoviiGen1.1

2025-05-23

78 0

https://github.com/ZulutionAI/MoviiGen1.1

MoviiGen1.1 是由 ZuluVision 开发的一款开源人工智能工具，专注于从文本生成高质量视频。它支持 720P 和 1080P 分辨率，特别适合需要电影级视觉效果的专业视频制作。用户可以通过简单的文本描述生成具有自然动态和一致美感的视频。MoviiGen1.1 提供模型权重和推理代码，基于 PyTorch 框架，易于部署和使用。它的开放性和高性能使其成为视频创作者和开发者的理想选择，广泛应用于影视制作、广告和创意内容生成。

功能列表

支持 720P 和 1080P 高分辨率视频生成，推荐 1080P 和 21:9 宽高比 (1920×832) 以获得电影级效果。
提供文本转视频功能，通过描述场景、主体和动作生成高质量视频。
包含提示词扩展模型，基于 Qwen2.5-7B-Instruct 微调，提升文本描述的细节和生成效果。
开源模型权重和推理代码，支持本地部署和定制化开发。
支持专业级视频生成，适合影视制作、广告和创意内容创作。
提供 FastVideo 插件支持，优化视频生成性能。
兼容 PyTorch 2.4.0 及以上版本，易于集成到现有开发环境。

使用帮助

安装流程

要使用 MoviiGen1.1，用户需先完成环境配置和模型安装。以下是详细步骤：

克隆仓库
在终端运行以下命令，获取 MoviiGen1.1 源码：

git clone https://github.com/ZulutionAI/MoviiGen1.1.git
cd MoviiGen1.1

安装依赖
确保系统已安装 Python 3.10 及以上版本，并安装 PyTorch 2.4.0 或更高版本。运行以下命令安装依赖：
```
pip install -r requirements.txt
```
此外，需根据官方指引安装 FastVideo 插件，具体说明可在 FastVideo 的 GitHub 页面找到。
下载模型
MoviiGen1.1 模型托管在 Hugging Face 上。使用 huggingface-cli 下载模型文件：
```
pip install "huggingface_hub[cli]"
huggingface-cli download ZuluVision/MoviiGen1.1 --local-dir ./MoviiGen1.1
```
模型支持 T2V-14B 架构，下载后会存储在 ./MoviiGen1.1 目录中。
验证环境
确保 GPU 硬件支持（推荐 20GB 以上显存以生成 1080P 视频）。检查 PyTorch 是否正确识别 GPU：
```
python -c "import torch; print(torch.cuda.is_available())"
```
输出 True 表示环境配置成功。

使用方法

MoviiGen1.1 的核心功能是通过文本提示词生成视频。以下是具体操作流程：

1. 基本视频生成

用户可以通过运行推理脚本生成视频。示例命令：

PYTHONPATH=. python scripts/inference/generate.py --ckpt_dir ./MoviiGen1.1 --prompt "一个穿红裙的女子在街头漫步，背景是繁忙的都市街道，阳光洒在地面，镜头缓慢移动，展现明亮色彩。"

--ckpt_dir：指定模型文件路径。
--prompt：输入描述场景的文本，建议 100-200 字，包含场景、主体、动作、审美风格和镜头移动。

2. 使用提示词扩展模型

MoviiGen1.1 提供基于 Qwen2.5-7B-Instruct 微调的提示词扩展模型，增强文本描述的细节。启用该功能：

PYTHONPATH=. python scripts/inference/generate.py --ckpt_dir ./MoviiGen1.1 --prompt "一个穿红裙的女子在街头漫步。" --use_prompt_extend --prompt_extend_model ZuluVision/MoviiGen1.1_Prompt_Rewriter

提示词扩展会自动丰富描述，例如补充场景细节、光影效果等，提升生成视频的质量。

3. 推荐提示词格式

为获得最佳效果，提示词需包含以下元素：

场景描述：如“烟雾弥漫的侦探办公室，百叶窗投下锐利阴影”。
主体：如“疲惫的侦探坐在桌后”。
动作：如“点燃香烟，吐出一缕烟雾”。
审美风格：如“黑白高对比度，1940年代黑色电影风格”。
镜头移动：如“静态中景镜头，聚焦侦探”。
示例提示词：

在烟雾弥漫的侦探办公室，百叶窗投下锐利阴影，疲惫的侦探坐在桌后，点燃香烟，吐出一缕烟雾。画面为黑白高对比度，呈现1940年代黑色电影风格，镜头为静态中景，聚焦侦探，营造压抑氛围。

4. 输出设置

分辨率：默认支持 720P 和 1080P，推荐 1080P（1920×832）以获得电影级效果。
生成时长：生成 1080P 视频需较长时间，建议使用高性能 GPU（如 RTX 4090，20GB 显存）。
输出路径：生成视频默认保存在 ./MoviiGen1.1/output 目录，可在推理脚本中指定其他路径。

5. 优化性能

FastVideo 插件：安装后可加速视频生成，具体配置参考 FastVideo 文档。
显存优化：若显存不足，可尝试生成 720P 视频，降低内存需求。
批量处理：支持多提示词批量生成，修改推理脚本以循环处理多个提示词。

注意事项

确保网络连接稳定，以下载模型和依赖。
高分辨率视频生成对硬件要求较高，建议使用高性能 GPU。
提示词质量直接影响生成效果，建议多尝试不同描述风格。
定期检查 GitHub 仓库更新，获取最新模型和代码。

应用场景

影视制作
MoviiGen1.1 适合生成电影预告片、短片或场景片段。用户可通过详细的文本描述快速生成具有专业光影效果的视频，降低传统拍摄成本。
广告创意
广告团队可利用 MoviiGen1.1 生成产品宣传视频。例如，输入描述品牌产品的场景和动作，快速生成高质量广告素材，节省制作时间。
游戏开发
游戏开发者可使用 MoviiGen1.1 生成过场动画或环境背景视频，支持高分辨率和定制化风格，满足游戏叙事需求。
教育与培训
教育工作者可生成教学视频，展示历史场景或科学实验的动态画面，提升教学内容的吸引力和直观性。

QA

MoviiGen1.1 是否免费？
是的，MoviiGen1.1 是开源工具，模型权重和推理代码免费提供，用户可从 GitHub 和 Hugging Face 下载使用。
生成 1080P 视频需要什么硬件？
推荐使用至少 20GB 显存的 GPU（如 NVIDIA RTX 4090）。生成 720P 视频可用较低配置，但仍需 GPU 支持。
如何优化生成的视频质量？
使用详细的提示词，包含场景、主体、动作和风格描述。启用提示词扩展模型可进一步提升细节。确保硬件支持 1080P 生成以获得最佳效果。
是否支持 Windows 和 Linux？
是的，MoviiGen1.1 支持 Windows 和 Linux，只要安装了 Python 3.10+ 和 PyTorch 2.4.0+ 即可运行。
生成视频需要多长时间？
取决于硬件和分辨率。1080P 视频可能需要数分钟到数小时，720P 较快。使用高性能 GPU 和 FastVideo 插件可缩短时间。

AI生产力工具 » MoviiGen1.1 发布于 2025-05-23，如发现网址过期，或无法访问，请联系我们。

0已收藏

0已赞