海外访问:www.kdjingpai.com
Ctrl + D 收藏本站

今天,我们隆重发布 FLUX.1 Kontext —— 一套生成式流匹配模型(generative flow matching models),支持图像的生成与编辑。与现有文本生成图像模型不同,FLUX.1 Kontext 系列支持上下文感知图像生成,可通过文本与图像共同构成提示,提取并修改视觉概念,生成连贯的新图像。

推出 FLUX.1 Kontext 与 BFL Playground-1

一致、具上下文感知能力的文本与图像生成与编辑。

你的图像。你的语言。你的世界。

FLUX.1 Kontext 是对传统文本生成图像模型的重要扩展,它融合了即时基于文本的图像编辑与文本生成图像的能力。作为多模态流模型(multimodal flow model),它在保持角色一致性、理解上下文和局部编辑能力方面处于领先地位,同时具备强大的文本生成图像能力。

增强的文本生成图像能力

无论是创意构思、草图绘制、概念设计,还是纯粹娱乐,文本生成图像依然是当今图像生成的核心要素。FLUX.1 Kontext 模型具备领先的提示遵循能力、照片级真实渲染效果,以及具有竞争力的字体生成表现,推理速度最高可达当前主流模型(例如 GPT-Image)的 8 倍。

玩起来,创作起来,动手操作……

FLUX.1 Kontext 模型不仅仅是文本生成图像。不同于只能基于文本生成的传统流模型,FLUX.1 Kontext 还能理解并基于已有图像进行创作。只需简单的文本指令即可修改输入图像,带来灵活即时的图像编辑体验——无需微调或复杂的编辑流程。FLUX.1 Kontext 套件的核心能力包括:

  • 角色一致性:在不同场景中保持图像中独特元素(例如人物或物体)的稳定性。
  • 局部编辑:对图像中特定元素进行精准修改,不影响其他部分。
  • 风格参考:在文本提示的指导下,保留参考图像的独特风格生成新场景。
  • 交互速度:图像生成与编辑延迟极低。

……并支持迭代:一步步地修改

Flux.1 Kontext 支持通过多轮编辑逐步添加指令,在保持图像质量与角色一致性的同时,以极低延迟持续优化创作。

FLUX.1 Kontext [pro] 模型

作为 FLUX.1 Kontext 套件的一部分,我们在 BFL API 中引入两款上下文图像模型。

  • FLUX.1 Kontext [pro] —— 快速迭代图像编辑的先驱

该模型融合了局部编辑、基于上下文的生成式修改以及经典文本生成图像功能,提供 FLUX.1 标志性质量。FLUX.1 Kontext [pro] 同时支持文本与参考图像输入,可在图像特定区域进行精准编辑,也可对整幅图像场景进行复杂转换。推理速度相比现有先进模型提升达一个数量级,是首款支持用户多轮迭代修改的模型,同时在不同场景与视角中保持人物、身份、风格和独特特征的一致性。

  • FLUX.1 Kontext [max] —— 极速下的极致性能

这款实验性新模型在提示遵循、字体生成与编辑一致性方面表现大幅提升,同时保持超快速度,无任何妥协。

FLUX.1 Kontext [max] 与 FLUX.1 Kontext [pro] 现已上线,可通过以下平台体验:KreaAIFreepikLightricksOpenArtLeonardoAI,以及我们的基础设施合作伙伴:FALReplicateRunwareDataCrunchTogetherAI 与 ComfyOrg。我们特别感谢 OpenArt 与 KreaAI 在偏好数据收集方面的支持。

FLUX.1 Kontext [dev] 私测版开放申请中

我们坚信开放研究与权重共享是安全技术创新的基石。我们开发了一款开放权重版本——FLUX.1 Kontext [dev],这是一个轻量级的 12B diffusion Transformer,适合定制开发,并兼容此前的 FLUX.1 [dev] 推理代码。FLUX.1 Kontext [dev] 现以私测形式开放,用于科研用途与安全测试。如感兴趣,请联系 kontext-dev@blackforestlabs.ai。正式发布后,该模型将通过 FALReplicateRunwareDataCrunchTogetherAI 与 HuggingFace 分发。

性能评估

为了验证 FLUX.1 Kontext 模型的性能,我们进行了全面的评估,并在技术报告中发布。以下是简要总结:我们构建了 KontextBench 基准测试,涵盖真实世界中的文本生成图像与图像生成图像任务,该基准将于后续发布。

![alt text](https://cdn.sanity.io/images/gsvmb6gz/production/14b5fef2009f608b69d226d4fd52fb9de723b8fc-3024x2529.png?fit=max&auto=format)

我们展示了六项上下文图像生成任务中的评估结果。FLUX.1 Kontext [pro] 在所有任务中始终位列前茅,尤其在文本编辑与角色保持方面得分最高

我们对包括 FLUX.1 Kontext 在内的图像生成图像模型进行了六项 KontextBench 任务评估。FLUX.1 Kontext [pro] 在所有任务中表现稳定,文本编辑与角色保持方面得分最高(见上图),推理速度也持续优于其他先进模型(见下图)。

推出 FLUX.1 Kontext 与 BFL Playground-2

FLUX.1 Kontext 模型在文本生成图像(左)与图像编辑(右)任务中,延迟始终低于其他先进模型

我们在多个质量维度上对文本生成图像模型进行评估,FLUX.1 Kontext 在美学、提示遵循、字体生成与真实感基准上均表现竞争力。

推出 FLUX.1 Kontext 与 BFL Playground-3
推出 FLUX.1 Kontext 与 BFL Playground-4

左:输入图像; 中:编辑:“将她的头朝镜头倾斜”; 右:“让她笑起来”

推出 FLUX.1 Kontext 与 BFL Playground-5

左:输入图像; 中:编辑:“将 ‘YOU HAD ME AT BEER’ 改为 ‘YOU HAD ME AT CONTEXT’”; 右:“将场景改为夜店”

失败案例:

目前版本的 FLUX.1 Kontext 仍存在一些局限性。过多轮的迭代编辑可能引入图像伪影,降低图像质量;模型偶尔会未能准确遵循提示,忽略某些特定要求;世界知识有限,影响其生成上下文准确的内容;此外,蒸馏过程可能引发输出伪影,影响生成质量。

推出 FLUX.1 Kontext 与 BFL Playground-6

FLUX.1 Kontext 的失败案例示意图:经过六轮迭代编辑后,图像质量下降,出现明显伪影。

FLUX API 演示:BFL Playground 登场

自产品发布以来,我们不断收到希望简化模型测试流程的反馈。今天,我们正式推出 FLUX Playground —— 一个便捷的界面,可用于测试我们最先进的 FLUX 模型,无需技术集成。

Playground 允许开发者与团队验证用例、向利益相关方演示能力,并实时体验先进图像生成过程。无论是评估技术可行性,还是向决策者展示成果,Playground 都能在全面接入 API 之前提供即时验证入口。

在 BFL,我们的使命是构建最先进的媒体生成模型与基础设施。Playground 是 BFL API 的入门平台,旨在加速从评估到生产部署的过程。立即访问:https://playground.bfl.ai/

0已收藏
0已赞

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文