FLUX Kontext – 黑森林图像生成式流匹配模型发布实测
长时间没消息的黑森林工作室憋了个大的,发布了生成式流匹配模型 FLUX Kontext。
这套模型最强的地方就是可以对图片进行编辑,但是不会影响没有编辑的地方。
而且还支持多张图片参考生成新的图像,依然能保持需要参考内容的高度一致性。
直接替代了很多原来需要 PS (美图秀秀、Photoshop 等)才能做的需求,原来需要吭哧瘪肚 P 很久的图,现在说句话就行。
我这几天也探索了很多这个模型的用法,这次不会以测试的形式展示了,全是具体用法,让你告别 P 图这个复杂难搞的操作,另外后面也会介绍所有可以使用这个模型的渠道。
🎨 先介绍一下我探索出来的各种用法:
首先是非常简单的图片修改需求,FLUX Kontext 支持通过简单的提示词对图片进行非常精细的修改,而且不会影响未修改的区域。
我们想要给自己的日常照片加一些配饰或者改一下照片的姿势都没有问题,可以看到人物的面部一致性都没有问题,而且修改的地方跟环境也融合的很好。
⚠️注意:FLUX Kontext 只支持英文提示词,我这里放中文是方便理解,你可以用 AI 或者翻译软件把提示翻译了使用
![]()
当然 FLUX Kontext 也可以对照片进行大幅度的更改,比如你想要给照片换个背景或者给你自己换一身应景的衣服,再或者在前面的基础上换个姿势。
可以看到我把场景变成了酒吧,整个光线氛围也同步发生了变化,之后又尝试了不同的拍摄角度和姿势,也没有问题。
这种修改需要注意的是优势 Kontext 的分辨率是固定的,画全身照的时候面部有可能会变糊,因为像素区域太小的原因。
🎉 从左到右的提示词分别是:
站在酒吧吧台前
低角度侧脸,白衬衫加领带,吧台灯带背光
左侧半身特写,黑色皮夹克,霓虹灯映衬
全身广角,红色鸡尾酒裙,手扶吧椅
背后平视,帽饰西装,吧台酒架虚化
![]()
之前很火给老照片上色和修复也不是问题。
比如我下面的测试提示词就只有给照片上色,Kontext 处理的很好,而且整个色彩非常的高级和自然,明暗关系处理的很好。
![]()
想要做风格化?也没问题,只需要一句“将图片变成真实照片”的提示词就行,所有的细节都还原的很好。
![]()
当然可能更多人的需求是把自己的照片变成风格化的图片。
比如我们可以输入“把照片转换为吉卜力风格”,Kontext 也处理的很好而且人物的主要特征和电车的特征都还原了,不存在 4o 那种过度重绘和修改细节的问题。
![]()
而且这玩意还能修改图片上的文字,最屌的是不会影响原来的其他内容,而且修改的文字字体依然可以保持原来的风格。
你只需要输入“将图片中的 XXX 文字修改为 XXX”就行,比如我这里就把主要的标题改为了 Guizang,字体风格都是一致的,而且他还知道不需要换行。
![]()
针对海报复杂一些的修改也是可以的,你可以把一张找到的现成海报改掉文字和内容变成你自己的。
比如这里我就把 Oppo 的倒计时海报改成了小米的,而且连背景色都换了,Kontext 很好的处理了玻璃散射光的那部分。
这里唯一可惜的就是 FLUX Kontext 不支持生成中文,所以你只能修改图片中的英文,但是如果你不修改里面的中文,文字是不受影响的,这比其他图像模型好多了。
Change “Oppo” to “Xiaomi”, and set the image background color to orange.
![]()
这个是 Padphone 老师发现的,FLUX Kontext 还是目前最强的去水印模型,可以去掉各种复杂恶心的水印。
比如这里我找了一个 Unsplash 带水印的图片,这种半透明的水印会和图片叠加混合非常难彻底去掉,你只需要跟 Kontext 说“去掉图片的水印”,接下来奇迹就会发生,一点水印都没了。
大家最近应该都被一些 AI 图像模型生成图片默认加水印搞得不堪其扰把,即使开了会员依然有水印,这时候就可以让 Kontext 帮你解决了。
![]()
我们也可以用 Kontext 给各种平面的文字或者图案添加上材质和背景,替代原来需要 3D 渲染才能完成的需求,非常适合做品牌设计和平面设计的朋友。
比如这里我就给这个 Logo 变成了金属材质,还给图片加上了草地的背景,可以看到 Kontext 把 Logo 的一些笔画细节还原的非常好。
🎹
Transform the logo text into a shimmering metallic material, floating above a grassy field filled with flowers.
![]()
Kontext 还可以在你浏览景区的时候帮你把各种无关的其他游客搞掉,再也不用担心自己好不容易拍了账号照片,结果被误入的其他人毁掉了。
可以看到 Kontext 可以很清楚的识别画面的主体不会连你想拍的人也一起去掉,当然你如果就是想拍风景也可以,让他去掉画面上所有的人就行。
去掉照片中跟主体无关的其他行人
去掉照片中所有的人
![]()
前几天收到了可灵的一周年礼盒,看到 Padphone 老师做的展示图手痒,就想看看能不能用 Kontext 做出来,没想到真可以还做的很好。
非常离谱是他连我箱子放地上的灰尘都还原了,下次你要是想要生成类似图片的话记得擦一下产品再拍,哈哈。
💡
一个黑色箱子放在一张舒适、有褶皱的白色毯子中央,毯子的织物纹理清晰可见。瓶子周围自然地摆放着一些精致的白色小苍兰,几片花瓣零星散落。阳光柔和地洒下,投下柔和、弥散的阴影,营造出一种温暖而宁静的氛围。非常逼真的特写场景,光线是柔和的自然日光。
![]()
很多人说箱子是立方体太好生成了,整点复杂的,那我们拿可灵礼盒里的工服试试。
显然也没啥问题,文字有问题是因为生成图片的分辨率低,文字又小,导致的模糊,就跟我们拍照的时候离得远的文字也会模糊一样。
一件黑色 T 恤水平漂浮于空中,正从天花板向地板降落,看起来毫无重量。画面中无人,充满超现实感且不受重力影响。光线柔和,风格简约而优雅。背景为灰色。
![]()
很多朋友说我想要更复杂的商品展示,指定多张图片的模特和商品然后合成到一个图片中行不行,也是可以的,多图参考有点复杂我后面会讲。
可以看到第一张图商品细节、模特服装、配饰、发型以及背景都没问题,这个惊到我了。
第二张图我让模特穿上了可灵的工服,这次连衣服上的小字都还原了,可以说是完美还原,这个你让我在电商平台刷到,加上电商平台的压缩,我看不出来说实话。
这里有个小技巧:FLUX Kontext 手持产品的时候,产品一般会比正常的比例偏大,这个时候提示词描述一下产品大小就可以解决问题,比如手持易拉罐变为手持小号易拉罐。
女孩拿着化妆品瓶子
女孩穿着这件 T 恤
![]()
![]()
最后压轴的是我们日常修图最常见的需求,大家都想把自己变得好看点,面部的美颜现在都发展的比较好了。
但是身体部位很多还是靠用美图或者用醒图一点点的 P,自带的一键优化非常的生硬死板,不够自然。
昨天试了一下给男生增肌,发现 FLUX Kontext 可以很好的理解需求,图片任何部分都没变化,只有胳膊的肌肉变大了,这要是不说谁知道我 P 了,哈哈。
🍞
男性胳膊的肌肉变大,面部没有变化。
![]()
那变瘦点是不是也可以呢,可以的,甚至都能瘦脸,瘦的很自然,不会再让人从扭曲的门把手或者瓷砖看到自己 P 图了,突然想到这下卖减肥药和健身课的是不是又爽了,一键搞定广告素材。
📍
让女性的胳膊变瘦,肚子变得平坦,去掉面部赘肉
![]()
如果你就是单纯的想要尝试一下这个模型 不想涉及到复杂操作的话我推荐两个渠道:
FLUX 官方的 Palyground (https://playground.bfl.ai/image/edit)和 Krea (https://www.krea.ai/edit)其中 FLUX 的 Palyground 还送了 200 积分,生成一张图只消耗 4 积分,够你玩很久了。
这两个地方的使用都很简单上传图片,输入提示词然后等待就行。
其中 Krea 选择 FLUX Kontext 的 Pro 模型就行 Max 模型在单图修改场景反而效果不好。
FLUX 的 Palyground 的话生成的时候记得把在输入框右边三个点那里把每次生成的张数改成 1,不然一次生成 4 张有点浪费。
![]()
如果你想要开发产品或者有 Comfyui 的基础想要玩一下多图参考,这里我推荐 Fal 的渠道(https://fal.ai/models/fal-ai/flux-pro/kontext/max/multi)。
Fal 的测试页面可以直接使用多图参考,上传图片输入提示词就行,如果你不想用多图了,可以在页面上方红框那里选择其他 Pro 模型尝试单图编辑。
![]()
另外 Fal 也有他们的 Comfyui 插件,只需要在 Comfyui manager 里面搜索 ComfyUI-fal-API 然后安装就行。
![]()
安装之后在插件目录,找到 config.ini 文件,把里面 这段话改成你的 API Key 就行。
工作流的搭建很简单找到 FLUX Pro Kontext Multi 这个节点链接多张图,之后输入提示词就行,另外由于这个是 API 节点不需要本地算力,所以 mac 电脑也可以玩。
![]()
在涉及到针对人体的精细修改比如变瘦、变老变年轻需要多抽卡,不一定一次能成功。
多图参考的时候人脸的 ID 保持会下降,保持 ID 最好的方式是让 FLUX 不要修改面部。
FLUX Kontext 是可以识别图片里面的涂鸦标记的意思的。
你可以将你想要修改的地方圈起来,生成的时候他不会把标记生成进去,这样就可以实现精确修改,比如这个来自 @fofrAI 的案例,没有提示词就实现了换脸。
![]()
好了今天的教程到这里就结束了。
FLUX Kontext 除了强大能力之外的另一个优势是他非常便宜,编辑一张图只需要 0.08 美元也就是 5 毛钱人民币,相较于 GPT-4o 一张图 1.4 人民币的价格可以说非常便宜了。
另外他们后面还会开源一个 Dev 的 Kontext 模型这个会让成本进一步降低,太期待了。