Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

豆包支持在图片生成中文!AI 文生图的难题终于被解决了

By: 张成晨
5 December 2024 at 13:01


2024 年快结束了,让 AI 在图片上精准生成文字,并且字体和排版都好看,很大程度上还是一个难题。

我们之前测评过 Ideogram、Recraft,它们可以解决部分生成英文的需求。夸完之后,文章里总要遗憾地补上一句——不支持中文哦。读者们乘兴而来,败兴而归。

这不怪海外的 AI,中文的偏旁部首,本来就比英文的字母要难。

有了金刚钻,才能揽瓷器活。生成中文的空白,终于有国内的 AI 文生图产品填补了:字节豆包。

10 秒出图,让我们说中文的表情包神器

豆包的生成中文功能,目前在 app 上线,使用方法很简单,直接就在文生图的提示词里写,你要加什么文字。暂时还不支持,给上传的参考图片加文字。

经受过模拟经营游戏《沙威玛传奇》洗脑的朋友,一定把那句没有一个字在调上的「让我们说中文」刻在脑海里了。

那咱们也可以复刻一个手抓饼大王的店面,不同以往的是,这次真的可以说中文,红色招牌上是工工整整的五个大字,而且 10 秒左右就搞定了。

豆包不偏科,中英搭配也可以,一个凸显手作感的咖啡店 logo,水灵灵地诞生了。

一两行字,或许还说明不了什么,接下来让我们加大难度,字要多,排版也要到位。

从《再见爱人 4》熏鸡事变获取灵感,我用提示词给豆包下达了几个需求。

提示词写得很长,但豆包听懂了,整体的完成度很高,文案也没有写错。

AI 生成具有不确定性,我反复生成了几次,还是最满意这张,虽然字体没有完全符合要求,熏鸡不够写实,小字乱码,但画风赏心悦目,熏鸡油光水滑。

俗话说,土到极致便是潮,老年人表情包就是其中一个例子,大致包含以下特点:醒目的文字、大吉大利的元素、blingbling 的特效。

习惯了抽象和阴阳怪气的我们,也可以学习这种有话直说的精神,比如,让豆包生成一个「相亲相爱一家人」。

猫咪、锦鲤、玫瑰、星星点点的闪光,围绕着渐变色填充的大字,有土味复古的怀旧感了,不多,大概 40% 吧。

豆包的文生图有一个很方便的设计——选择风格。不用写提示词,点击一下,我们就可以驾驭电影、卡通、胶片等风格。

将特殊的风格和精准生成的中文字一起用,会有事半功倍的效果。结合像素风格,我们可以让豆包画一个四格漫画。

我的提示词写得很简单,只是要求了每一格的文字和画面内容,豆包给的画面略有偏差,但文字完美,大家也可以参考这个形式,换个主题多试试。

可能有朋友会疑惑,为什么生成中文字是个很重要的需求,不能先把图片生成,再放在 P 图软件把文字打上去吗?

这么做当然也可以,但让 AI 直接生成图案和文字,风格实现无缝的适配,完全没有 P 图感,玩法还无穷无尽,何乐而不为?不过,消除乱码的小字,还是用得上 P 图软件。

哪里都用得上,人人都能设计海报和壁纸

除了整活,豆包当然也可以做些有用的设计。一键生成海报、壁纸、节日祝福,从此不是没有可能了。

什么叫有用?对于我来说,群聊的聊天背景就是一个刚需,提醒我不要在错误的地点讲不恰当的话。

那就让 AI 来设计一个,并要求把文字放在黄色的警示标志里,这份打工人打工魂,豆包也应该接收到了。

我怕过年的鞭炮太响,现在就想给你新年的祝福,祥云和元宝应有尽有。给亲朋好友的红包封面,以后不妨叫 AI 帮忙设计。

A 妹主演的、由百老汇音乐剧改编的《魔法坏女巫》正在北美热映,国内也已经定档,和热度不符的,是海报的简陋设计。

不如让豆包重做一次,我从原海报反推提示词,说明了画面的要素,接下来就交给豆包。

至少,豆包做了字体设计,更贴奇幻电影的主题和氛围,原海报反而像用 Word 和 PPT 花体字打出来的。

除了歌舞片,东方美学风格海报,豆包也可以拿捏,呈现大气磅礴的毛笔字。

写得好看是一方面,更重要的是豆包听提示词的指挥,文字是什么风格和颜色,把字放在什么位置,基本都能顺从我们的心意。如果一次没有,那就多生成几次。

用豆包设计小红书封面,图片上下的字体和颜色可以不同,全看我们自己想要什么效果。

豆包也能做逼真的产品图,文字根据包装的角度倾斜,像是印刷在包装上。

设计 B 站长视频的封面,当然也难不倒豆包,既专业又有亲和力。

所以,技术是到位了,最重要的还是我们自己的脑洞够不够大,审美够不够好。

设计工作还无法被 AI 替代,但我们每个人最好都要有些设计思维,AI 才能更好地呈现我们的所思所想。

用 AI 产品解决问题,就选接地气又全面的

国内率先把生成中文字的功能做进产品的,是字节的豆包,可以说,毫不意外。

豆包,是国内大模型产品中,真正既接地气又全面的,每次推出一个新功能,都让人觉得,这正是我需要的。

AI 写作、AI 搜索、文档和网页总结,这种大模型标配的功能,豆包当然具备了。

▲用豆包生成一个类似文字冒险游戏的对话界面

AI 智能体,豆包给了用户海量的选择,既能像 GPTs 那样满足各种垂直功能,又能类似 AI 陪伴软件陪你聊天。

拍照搜题、语音通话、图片生成、音乐生成、视频生成,各色各样的多模态功能,豆包都有。

▲用豆包生成一个小红书流行的动物表情包

我们对于 AI 的所有核心需求,豆包基本都涉及,同时,豆包的渠道也广阔,实现了移动端和网页端的全覆盖,不管是工作还是娱乐,我们都可以随时和豆包聊聊。

值得一提的是,本周豆包 PC 版将内测视频生成功能。根据我们之前的测评,豆包的视频生成模型,相较于 Luma、Runway 等国外产品,更懂中文和中文用户,更适配中文互联网中的创作工作流。

▲用豆包生成一个古早游戏装备栏界面,恭喜你拾取「豆包」一个。细节不完美,但有内味了

这句话放在图片生成上也是一样,Ideogram、Recraft 可以生成英文字固然好,但豆包率先把生成中文字的难题解决了,才真正解决了国内用户的痛点。

不像伪文青们爱说的「你好特别,你给我一种疏离感」,「豆包」从名字到 logo 都让人觉得格外亲切,然后这种温度也被带入了产品的设计里,豆包的功能都非常容易上手,主打一个新手友好,不白来,来了都能用。

中文是一门博大精深且对 AI 精准生成具有一定挑战性的语言,这世界这么多人,每个人都可以用 AI 设计一点什么,无论用什么设备,说什么语言。AI 产品都该往这个方向进化,而先为中文用户交出答卷的,是豆包。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


打败 Midjourney,匿名屠榜的 AI 生图黑马,让人人都能设计海报

By: 张成晨
9 November 2024 at 12:22

如今 AI 圈更新产品的节奏,让每个和键盘难舍难分的编辑明白了一句台词:你还有多少惊喜是朕不知道的?

这不,又一个 AI 生图神器来了:Recraft。

好用在哪?一句话概括就是:人负责排列组合,AI 负责美工,审美挺好,还不容易出错。

对于普通人来说,设计海报又又又变得更简单了,我们就是 AI 的甲方,给它一套毛坯,它给你一次次不重样的精装。

指路👉https://www.recraft.ai/projects

十几秒一张海报,拿捏文字,这个 AI 是文生图的清流

请问,设计一张海报,需要几步?Recraft 表示,三步就够了。

首先,在空白画布上,拉出一个紫色的框框;其次,在你想要的位置放入图片、文字,输入提示词;最后,点击生成按钮,AI 就能帮你化腐朽为神奇。

只要等待十几秒,一张海报出现在你面前。比如这样,轻轻松松把文字变成 3D。

▲ 图片来自:X@recraftai

或者,你想做个表情包,有图,有文案,但不知道怎么组合更好看,也可以交给 Recraft,让它来扩图,把文字自然地融进场景里。

▲ 左边,AI 生成;右边,草图

甚至,我们不上传图片,纯打字,让 Recraft 一条龙生成海报也没问题。

文字渲染一直是图片生成模型的痛点,但 Recraft 牛逼在,可以 hold 住一大段文字。

A 妹主演的《魔法坏女巫》将在 11 月上映,国内也会引进,然而,电影还在文火加热,设计简陋的海报已经被群嘲了。

不如让 Recraft 重做一次吧,我用不同字号,把文案排列了一下,草图这就算做好了,然后参考原海报,反推提示词,说明了画面的要素,接下来交给 AI 一键美化。

▲ 左边,AI 生成;右边,草图

可喜可贺,该有的都有,文字没有错误,每一行都被 AI 精心设计,和官方海报一比,风格不同,但没有差到哪里去。

▲ 左边,AI 生成;右边,官方海报

除了从头设计,Recraft 还可以处理多张图片,满足追星族和嗑 CP 爱好者的要求——把喜欢的角色 P 到一起,看起来不突兀。

以哈利波特和毒液为例,上传需要的两张照片,背景不同怎么办?这里不得不提 Recraft 一个非常实用的功能:一键抠图。

是的,传统的 P 图软件都有抠图功能,这不算什么,但 AI 生图工具,考虑到这个大众功能并加进产品的,不多。

抠图之后,配上文案,看起来仍然有次元壁,默认字体也丑了点,没关系,选择你想要的画风,让 AI 统一优化,就有同框的感觉了。

▲ 左边:优化后,右边:优化前

擅长设计平面是不够的,Recraft 的一个功能更让人拍案叫绝:Mockup,做立体物体的图案设计。

先让它生成一个普通的红色棒球帽,中间的绿色框框,用来生成图片,或者上传自己的图片,然后图片可以和帽子完美融入。

比如,加上一段文案:「make cats great again」(让猫猫再次伟大)。

抠图去除多余的背景,把图标拉伸到满意的大小、旋转和移动到合适的位置,它始终保持透视效果,自适应地贴合表面。

以此类推,T 恤、杯子、徽章也是一样的,吃谷虽然快乐,但伤钱包,以后可以自己给自己做周边,赛博欣赏,自娱自乐了。

▲ 仅示意,徽章是 Recraft 生成的,图案是上传的

请问,我为什么一直在让 AI 设计英文内容?

因为 Recraft 有硬伤:可以用中文提示词,但输出不了中文。哪怕我明确要求,某段话请用中文写,它也会「贴心」地给我翻译成英文。

但只要能登上 Recraft,就有免费额度可用,设计海报、封面、产品图、表情包…… 有便宜可占,已经很香了。

匿名登顶,免费商用,和设计师交个朋友

我们知道 Midjourney、DALL-E、Flux、Ideogram,但这个 Recraft 是何门何派?

前段时间,文生图模型 red_panda 在 X 一鸣惊人,因为它在 Hugging Face 的排行榜拿下了第一名,把有名有姓的前辈踩在脚下。

这个排名,靠两两图片对比得出,比的是综合能力,包括审美、提示词理解、身体结构准确性、文字生成质量等。

网友猜测,red_panda 是「小熊猫」的意思,难道来自中国?关子没有卖多久,幕后团队就出来自曝了。

red_panda 基于模型 Recraft V3,背后的公司是 2022 年成立、总部在伦敦的 Recraft AI,创始人曾在 Google、微软工作过。

Recraft 一朝成名天下闻,不是没有道理,这个产品集了各家之所长。

▲ 图片来自:X@recraftai

论高清、光影、真实感,Recraft 不输 Flux。

同时,它对新手友好,有很多不错的预设风格,游走在写实和艺术之间,不用写复杂的提示词,就能模拟各种摄影和绘画效果。

▲「Hard Flash」风格,强烈、直白的闪光灯效果

Recraft 擅长的长文本图像生成,准确度怕是让拿文本做招牌的 Ideogram 都自愧不如,而且,它很听话,可以让我们决定文本的大小和位置。

▲ 图片来自:X@recraftai

不过,Recraft 也可能出现文本错误,并且导致背景变形。当我模仿《火星救援》的风格做马斯克的海报,他的脸像被整容了,还是失败的那种。

▲ 左边:AI 生成;右边:草图

当 AI 生图工具都在增强可控性,Recraft 不落下风,Midjourney 的修改局部功能,它也有。

我们框选出某个区域,然后用提示词告诉 AI 怎么修改,加个帽子轻轻松松。

十八般武艺都会一点的 Recraft,会抢设计师的工作吗?恰恰相反,它是来交个朋友的,把自己定义成:面向设计师的生成式 AI。

所以,Recraft 具备了一些设计师们需要的功能,比如样式也可以通过更多的图像输入给模型,保持风格的稳定。

Recraft 还做了一个小小的协作功能,画布可以共享,让对方评论,因为「有时候,两个人的想法比一个人的想法更好」。

▲ 图片来自:X@recraftai

更喜闻乐见的是,Recraft 生成的图片可以免费商用。

当然,不是设计师的小白们,比如我,也可以玩得很开心,分分钟做出自己喜欢的海报。

而且,本就没必要将人和工具比较,Recraft 是来和 Canva 等设计工具、Midjourney 等 AI 生图工具同台竞争的,用户们坐享其成。

▲ 图片来自:X@recraftai

Canva 的 CEO Melanie Perkins 说过,Canva 希望让每一个人都设计出他们可以想象的任何东西,无论说什么语言,用什么设备。

所以,他们打破 Adobe 的门槛,简化了设计流程,提供了各种模板、部件、图片、字体,让用户增减元素。

▲ 图片来自:X@recraftai

AI 的进化方向,和这位 CEO 的愿景是一样的:为全世界赋予设计的能力。

但我们的选择,越来越不局限了,不是必须选择哪个产品,不是必须听某个创始人的故事,工具能帮我们做的越来越多,我们按下的按钮越来越少,甚至可以不亲手操作,人人都能设计一点东西,如果我们还愿意称之为设计。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌