Nab主题,更专业的导航主题
Ctrl + D 收藏本站
当前位置:首页 » AI工具库

InfiniteYou:保留人脸特征的照片生成与编辑工具

2025-03-24 458

综合介绍

InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生成新图像,同时保留人物身份特征。项目通过 InfuseNet 技术提升身份相似度,结合多阶段训练优化图像质量和文字对齐。InfiniteYou 于 2025 年 3 月发布代码、模型和在线演示,受到技术社区关注。它支持多种插件,操作简单,适合开发者、研究者和普通用户。

InfiniteYou:保留人脸特征的照片生成与编辑工具-1

 

功能列表

  • 身份保留重塑:上传照片和文字描述,生成新图像并保持人物面部特征。
  • 高质量图像生成:输出清晰图像,减少模糊、手部畸形等问题。
  • 文字对齐优化:生成结果与描述内容高度一致,避免偏差。
  • 模型选择:提供 aes_stage2(美观优先)和 sim_stage1(身份优先)两种模式。
  • 插件扩展:支持 ControlNet、LoRA、IP-Adapter 等,增加生成灵活性。

 

使用帮助

安装流程

InfiniteYou 需要本地安装才能使用。以下是详细步骤:

  1. 环境准备
    • 确保系统安装 Python 3.8 或更高版本。
    • 安装 Git,用于下载代码。
    • 推荐使用 NVIDIA GPU 和 CUDA,提升生成速度。
  2. 克隆代码
    在终端输入:
git clone https://github.com/bytedance/InfiniteYou.git

进入目录:

cd InfiniteYou
  1. 安装依赖
    执行以下命令安装所需库:
pip install -r requirements.txt

若使用 GPU,需安装对应 PyTorch 版本,例如:

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
  1. 下载模型
    访问 https://huggingface.co/ByteDance/InfiniteYou,下载 infu_flux_v1.0 文件夹中的 aes_stage2 或 sim_stage1 模型,放入项目目录对应位置。
  2. 运行演示
    安装 Gradio:
pip install gradio

启动本地界面:

python app.py

浏览器会打开 http://127.0.0.1:7860,即可使用。

主要功能操作

身份保留照片重塑

  1. 上传照片
    在 Gradio 界面点击“上传身份图像”,选择一张清晰的人脸照片。
  2. 输入描述
    在“提示文字”框输入具体描述,例如“一个穿红裙的女子在森林中”。
  3. 设置参数
  • 模型选择:aes_stage2 注重美观,sim_stage1 强调身份相似度。
  • 参数调整:默认 infusenet_conditioning_scale 为 1.0infusenet_guidance_start 为 0.0。若身份不够相似,可尝试将后者调至 0.1
  • 种子值(Seed):保持默认或手动设置。
  1. 生成图像
    点击“生成”,等待约 120 秒,结果会显示在界面上。

快速脚本推理

在终端运行:

python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results

生成结果保存在 results 文件夹。

在线演示

访问 https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX,无需安装即可试用。

插件使用

  • ControlNet:上传姿势参考图,控制生成结果的动作。
  • LoRA:支持 Realism 和 Anti-blur 插件,路径需手动指定,例如 <path_to_lora>
  • IP-Adapter:添加风格参考图,实现个性化风格化。

操作示例

想生成“穿西装的男子在会议室”的图像:

  1. 上传男子照片。
  2. 输入描述:“A man in a suit in a meeting room”。
  3. 选择 aes_stage2,点击“生成”。
  4. 检查结果,若需调整性别,添加“a man”等词。

注意事项

  • 照片需正面清晰,避免遮挡。
  • 描述具体,避免模糊词如“漂亮”。
  • 生成时间因硬件不同而异,GPU 可缩短至 30-60 秒。

 

应用场景

  1. 社交媒体内容
    用户上传自拍,输入“穿运动服在健身房”,生成健身主题照片用于分享。
  2. 艺术创作
    艺术家上传肖像,描述“穿中世纪服装的骑士”,生成概念设计图。
  3. 研究测试
    研究者使用 InfiniteYou 对比身份保留效果,验证生成模型性能。

 

QA

  1. 免费吗?
    是的。代码和模型开源,学术研究免费使用。
  2. 生成时间多长?
    平均 120 秒,使用 GPU 可更快。
  3. 支持多人照片吗?
    当前优化为单人,多人支持需进一步开发。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

扫码关注

qrcode

联系我们

回顶部

zh_CN简体中文