Reading view

There are new articles available, click to refresh the page.

豆包支持在图片生成中文!AI 文生图的难题终于被解决了


2024 年快结束了,让 AI 在图片上精准生成文字,并且字体和排版都好看,很大程度上还是一个难题。

我们之前测评过 Ideogram、Recraft,它们可以解决部分生成英文的需求。夸完之后,文章里总要遗憾地补上一句——不支持中文哦。读者们乘兴而来,败兴而归。

这不怪海外的 AI,中文的偏旁部首,本来就比英文的字母要难。

有了金刚钻,才能揽瓷器活。生成中文的空白,终于有国内的 AI 文生图产品填补了:字节豆包。

10 秒出图,让我们说中文的表情包神器

豆包的生成中文功能,目前在 app 上线,使用方法很简单,直接就在文生图的提示词里写,你要加什么文字。暂时还不支持,给上传的参考图片加文字。

经受过模拟经营游戏《沙威玛传奇》洗脑的朋友,一定把那句没有一个字在调上的「让我们说中文」刻在脑海里了。

那咱们也可以复刻一个手抓饼大王的店面,不同以往的是,这次真的可以说中文,红色招牌上是工工整整的五个大字,而且 10 秒左右就搞定了。

豆包不偏科,中英搭配也可以,一个凸显手作感的咖啡店 logo,水灵灵地诞生了。

一两行字,或许还说明不了什么,接下来让我们加大难度,字要多,排版也要到位。

从《再见爱人 4》熏鸡事变获取灵感,我用提示词给豆包下达了几个需求。

提示词写得很长,但豆包听懂了,整体的完成度很高,文案也没有写错。

AI 生成具有不确定性,我反复生成了几次,还是最满意这张,虽然字体没有完全符合要求,熏鸡不够写实,小字乱码,但画风赏心悦目,熏鸡油光水滑。

俗话说,土到极致便是潮,老年人表情包就是其中一个例子,大致包含以下特点:醒目的文字、大吉大利的元素、blingbling 的特效。

习惯了抽象和阴阳怪气的我们,也可以学习这种有话直说的精神,比如,让豆包生成一个「相亲相爱一家人」。

猫咪、锦鲤、玫瑰、星星点点的闪光,围绕着渐变色填充的大字,有土味复古的怀旧感了,不多,大概 40% 吧。

豆包的文生图有一个很方便的设计——选择风格。不用写提示词,点击一下,我们就可以驾驭电影、卡通、胶片等风格。

将特殊的风格和精准生成的中文字一起用,会有事半功倍的效果。结合像素风格,我们可以让豆包画一个四格漫画。

我的提示词写得很简单,只是要求了每一格的文字和画面内容,豆包给的画面略有偏差,但文字完美,大家也可以参考这个形式,换个主题多试试。

可能有朋友会疑惑,为什么生成中文字是个很重要的需求,不能先把图片生成,再放在 P 图软件把文字打上去吗?

这么做当然也可以,但让 AI 直接生成图案和文字,风格实现无缝的适配,完全没有 P 图感,玩法还无穷无尽,何乐而不为?不过,消除乱码的小字,还是用得上 P 图软件。

哪里都用得上,人人都能设计海报和壁纸

除了整活,豆包当然也可以做些有用的设计。一键生成海报、壁纸、节日祝福,从此不是没有可能了。

什么叫有用?对于我来说,群聊的聊天背景就是一个刚需,提醒我不要在错误的地点讲不恰当的话。

那就让 AI 来设计一个,并要求把文字放在黄色的警示标志里,这份打工人打工魂,豆包也应该接收到了。

我怕过年的鞭炮太响,现在就想给你新年的祝福,祥云和元宝应有尽有。给亲朋好友的红包封面,以后不妨叫 AI 帮忙设计。

A 妹主演的、由百老汇音乐剧改编的《魔法坏女巫》正在北美热映,国内也已经定档,和热度不符的,是海报的简陋设计。

不如让豆包重做一次,我从原海报反推提示词,说明了画面的要素,接下来就交给豆包。

至少,豆包做了字体设计,更贴奇幻电影的主题和氛围,原海报反而像用 Word 和 PPT 花体字打出来的。

除了歌舞片,东方美学风格海报,豆包也可以拿捏,呈现大气磅礴的毛笔字。

写得好看是一方面,更重要的是豆包听提示词的指挥,文字是什么风格和颜色,把字放在什么位置,基本都能顺从我们的心意。如果一次没有,那就多生成几次。

用豆包设计小红书封面,图片上下的字体和颜色可以不同,全看我们自己想要什么效果。

豆包也能做逼真的产品图,文字根据包装的角度倾斜,像是印刷在包装上。

设计 B 站长视频的封面,当然也难不倒豆包,既专业又有亲和力。

所以,技术是到位了,最重要的还是我们自己的脑洞够不够大,审美够不够好。

设计工作还无法被 AI 替代,但我们每个人最好都要有些设计思维,AI 才能更好地呈现我们的所思所想。

用 AI 产品解决问题,就选接地气又全面的

国内率先把生成中文字的功能做进产品的,是字节的豆包,可以说,毫不意外。

豆包,是国内大模型产品中,真正既接地气又全面的,每次推出一个新功能,都让人觉得,这正是我需要的。

AI 写作、AI 搜索、文档和网页总结,这种大模型标配的功能,豆包当然具备了。

▲用豆包生成一个类似文字冒险游戏的对话界面

AI 智能体,豆包给了用户海量的选择,既能像 GPTs 那样满足各种垂直功能,又能类似 AI 陪伴软件陪你聊天。

拍照搜题、语音通话、图片生成、音乐生成、视频生成,各色各样的多模态功能,豆包都有。

▲用豆包生成一个小红书流行的动物表情包

我们对于 AI 的所有核心需求,豆包基本都涉及,同时,豆包的渠道也广阔,实现了移动端和网页端的全覆盖,不管是工作还是娱乐,我们都可以随时和豆包聊聊。

值得一提的是,本周豆包 PC 版将内测视频生成功能。根据我们之前的测评,豆包的视频生成模型,相较于 Luma、Runway 等国外产品,更懂中文和中文用户,更适配中文互联网中的创作工作流。

▲用豆包生成一个古早游戏装备栏界面,恭喜你拾取「豆包」一个。细节不完美,但有内味了

这句话放在图片生成上也是一样,Ideogram、Recraft 可以生成英文字固然好,但豆包率先把生成中文字的难题解决了,才真正解决了国内用户的痛点。

不像伪文青们爱说的「你好特别,你给我一种疏离感」,「豆包」从名字到 logo 都让人觉得格外亲切,然后这种温度也被带入了产品的设计里,豆包的功能都非常容易上手,主打一个新手友好,不白来,来了都能用。

中文是一门博大精深且对 AI 精准生成具有一定挑战性的语言,这世界这么多人,每个人都可以用 AI 设计一点什么,无论用什么设备,说什么语言。AI 产品都该往这个方向进化,而先为中文用户交出答卷的,是豆包。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌