Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

豆包支持在图片生成中文!AI 文生图的难题终于被解决了

By: 张成晨
5 December 2024 at 13:01


2024 年快结束了,让 AI 在图片上精准生成文字,并且字体和排版都好看,很大程度上还是一个难题。

我们之前测评过 Ideogram、Recraft,它们可以解决部分生成英文的需求。夸完之后,文章里总要遗憾地补上一句——不支持中文哦。读者们乘兴而来,败兴而归。

这不怪海外的 AI,中文的偏旁部首,本来就比英文的字母要难。

有了金刚钻,才能揽瓷器活。生成中文的空白,终于有国内的 AI 文生图产品填补了:字节豆包。

10 秒出图,让我们说中文的表情包神器

豆包的生成中文功能,目前在 app 上线,使用方法很简单,直接就在文生图的提示词里写,你要加什么文字。暂时还不支持,给上传的参考图片加文字。

经受过模拟经营游戏《沙威玛传奇》洗脑的朋友,一定把那句没有一个字在调上的「让我们说中文」刻在脑海里了。

那咱们也可以复刻一个手抓饼大王的店面,不同以往的是,这次真的可以说中文,红色招牌上是工工整整的五个大字,而且 10 秒左右就搞定了。

豆包不偏科,中英搭配也可以,一个凸显手作感的咖啡店 logo,水灵灵地诞生了。

一两行字,或许还说明不了什么,接下来让我们加大难度,字要多,排版也要到位。

从《再见爱人 4》熏鸡事变获取灵感,我用提示词给豆包下达了几个需求。

提示词写得很长,但豆包听懂了,整体的完成度很高,文案也没有写错。

AI 生成具有不确定性,我反复生成了几次,还是最满意这张,虽然字体没有完全符合要求,熏鸡不够写实,小字乱码,但画风赏心悦目,熏鸡油光水滑。

俗话说,土到极致便是潮,老年人表情包就是其中一个例子,大致包含以下特点:醒目的文字、大吉大利的元素、blingbling 的特效。

习惯了抽象和阴阳怪气的我们,也可以学习这种有话直说的精神,比如,让豆包生成一个「相亲相爱一家人」。

猫咪、锦鲤、玫瑰、星星点点的闪光,围绕着渐变色填充的大字,有土味复古的怀旧感了,不多,大概 40% 吧。

豆包的文生图有一个很方便的设计——选择风格。不用写提示词,点击一下,我们就可以驾驭电影、卡通、胶片等风格。

将特殊的风格和精准生成的中文字一起用,会有事半功倍的效果。结合像素风格,我们可以让豆包画一个四格漫画。

我的提示词写得很简单,只是要求了每一格的文字和画面内容,豆包给的画面略有偏差,但文字完美,大家也可以参考这个形式,换个主题多试试。

可能有朋友会疑惑,为什么生成中文字是个很重要的需求,不能先把图片生成,再放在 P 图软件把文字打上去吗?

这么做当然也可以,但让 AI 直接生成图案和文字,风格实现无缝的适配,完全没有 P 图感,玩法还无穷无尽,何乐而不为?不过,消除乱码的小字,还是用得上 P 图软件。

哪里都用得上,人人都能设计海报和壁纸

除了整活,豆包当然也可以做些有用的设计。一键生成海报、壁纸、节日祝福,从此不是没有可能了。

什么叫有用?对于我来说,群聊的聊天背景就是一个刚需,提醒我不要在错误的地点讲不恰当的话。

那就让 AI 来设计一个,并要求把文字放在黄色的警示标志里,这份打工人打工魂,豆包也应该接收到了。

我怕过年的鞭炮太响,现在就想给你新年的祝福,祥云和元宝应有尽有。给亲朋好友的红包封面,以后不妨叫 AI 帮忙设计。

A 妹主演的、由百老汇音乐剧改编的《魔法坏女巫》正在北美热映,国内也已经定档,和热度不符的,是海报的简陋设计。

不如让豆包重做一次,我从原海报反推提示词,说明了画面的要素,接下来就交给豆包。

至少,豆包做了字体设计,更贴奇幻电影的主题和氛围,原海报反而像用 Word 和 PPT 花体字打出来的。

除了歌舞片,东方美学风格海报,豆包也可以拿捏,呈现大气磅礴的毛笔字。

写得好看是一方面,更重要的是豆包听提示词的指挥,文字是什么风格和颜色,把字放在什么位置,基本都能顺从我们的心意。如果一次没有,那就多生成几次。

用豆包设计小红书封面,图片上下的字体和颜色可以不同,全看我们自己想要什么效果。

豆包也能做逼真的产品图,文字根据包装的角度倾斜,像是印刷在包装上。

设计 B 站长视频的封面,当然也难不倒豆包,既专业又有亲和力。

所以,技术是到位了,最重要的还是我们自己的脑洞够不够大,审美够不够好。

设计工作还无法被 AI 替代,但我们每个人最好都要有些设计思维,AI 才能更好地呈现我们的所思所想。

用 AI 产品解决问题,就选接地气又全面的

国内率先把生成中文字的功能做进产品的,是字节的豆包,可以说,毫不意外。

豆包,是国内大模型产品中,真正既接地气又全面的,每次推出一个新功能,都让人觉得,这正是我需要的。

AI 写作、AI 搜索、文档和网页总结,这种大模型标配的功能,豆包当然具备了。

▲用豆包生成一个类似文字冒险游戏的对话界面

AI 智能体,豆包给了用户海量的选择,既能像 GPTs 那样满足各种垂直功能,又能类似 AI 陪伴软件陪你聊天。

拍照搜题、语音通话、图片生成、音乐生成、视频生成,各色各样的多模态功能,豆包都有。

▲用豆包生成一个小红书流行的动物表情包

我们对于 AI 的所有核心需求,豆包基本都涉及,同时,豆包的渠道也广阔,实现了移动端和网页端的全覆盖,不管是工作还是娱乐,我们都可以随时和豆包聊聊。

值得一提的是,本周豆包 PC 版将内测视频生成功能。根据我们之前的测评,豆包的视频生成模型,相较于 Luma、Runway 等国外产品,更懂中文和中文用户,更适配中文互联网中的创作工作流。

▲用豆包生成一个古早游戏装备栏界面,恭喜你拾取「豆包」一个。细节不完美,但有内味了

这句话放在图片生成上也是一样,Ideogram、Recraft 可以生成英文字固然好,但豆包率先把生成中文字的难题解决了,才真正解决了国内用户的痛点。

不像伪文青们爱说的「你好特别,你给我一种疏离感」,「豆包」从名字到 logo 都让人觉得格外亲切,然后这种温度也被带入了产品的设计里,豆包的功能都非常容易上手,主打一个新手友好,不白来,来了都能用。

中文是一门博大精深且对 AI 精准生成具有一定挑战性的语言,这世界这么多人,每个人都可以用 AI 设计一点什么,无论用什么设备,说什么语言。AI 产品都该往这个方向进化,而先为中文用户交出答卷的,是豆包。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


关胖本胖|封杀擦边冠军,激怒全国首富,字节的瓜越吃越大…

27 November 2024 at 21:58

file

“首富怼首富”、“冠军怼冠军”,搅动互联网江湖的风云。看似风马牛不相及的两个“瓜”,却都拴在了字节这根“藤”上。

字节的“算法”如此高端,是群魔乱舞、谣诼满天的“避风港”,却在能无数“擦边”中定点清除吴柳芳。

CDT 档案卡
标题:封杀擦边冠军,激怒全国首富,字节的瓜越吃越大…
作者:关不羽
发表日期:2024.11.27
来源:微信公众号“关胖本胖”
主题归类:字节跳动
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

01 网络流氓的“避风港”

“首富怼首富”,钟睒睒的矛头直指张一鸣和字节旗下的两大平台,很刚很直白:

“以强欺弱,霸凌弱小。这不是你个人的行为,是对人类技术文明的亵渎,我请求头条和抖音,不要以所谓的避风港原则,对这些行为进行搪塞。请立即删除对我的伤害与污蔑。请求他们删除言论、图片,停止对一个中国公民的侵害”。

钟睒睒有理由愤怒。字节两大平台上长期充斥着对钟睒睒个人、家庭和企业的造谣中伤、恶意攻击。这不是钟睒睒个人的遭遇,挑动对立、煽动民粹,俨然成了两大平台的流量密码。对这些铺天盖地的劣质内容并不高明,你抄我、我抄你的粗制滥造,量产痕迹极其明显。然而,字节遥遥领先的算法“选择性失明”了。

image

非不能也,是不为也,“避风港原则”就是平台无所作为的挡箭牌。

“避风港原则”,是上世纪末诞生于美国的一项法律原则。最初用于处理网络服务商与版权人纠纷解决。核心是“通知+移出”,即在发生著作权侵权案件时,网络服务提供商(ISP)在接到权利人通知后,有义务删除涉嫌侵权的内容,否则将被视为侵权。后被广泛应用于互联网平台的各类民事侵权纠纷。

“避风港原则”实际上给予了平台经营者一定程度的免责权。根据这一原则,运营商对平台上发生的侵权行为,没有主动干预的义务,只需尽到接到“通知”后“移除”的责任,就不会成为“被告”。

显然,这是对平台运营商非常有利的法律原则。但是,法律不会平白无故地偏袒谁。僻风港原则之所以能成立,基于平台运营商的技术中立。

“避风港原则”认为,平台经营商是提供“技术中立”的空间服务,而不是内容创作的信息服务。平台只是内容的载体,不是制作内容,所以不必对内容侵权负责。形象化的说法就是,互联网平台只是送报纸的“邮差”,而不是编报纸的报社。

也就是说“避风港原则”为平台提供的免责保护,并非无条件的。要免责,平台就要恪守“技术中立”。既然是“邮差”,那就不能越俎代庖当“小编”。平台不能搞创作,也不能干预创作。

那么,字节两大平台目前的运营方式,是否适用“避风港原则”呢?存疑。

字节是进行内容审核的,这是一种具备媒体性质的编辑行为。平台上大量恶意侵权的劣质内容,是怎样逃过了算法审核的?这些经审核发布的劣质内容造成侵权,平台能免责吗?

同时,字节的算法进行内容推荐,也是一种干预内容创作的行为。算法“唯流量论”,流量又与创作者的收入挂钩,就是鼓励单纯追逐流量的创作行为。

image

所有的疑点都集中在算法,如果算法不中立,平台的技术中立无从谈起。字节的算法是否中立,我们一无所知。因为,这是字节的不传之秘。“首富怼首富”中,钟睒睒呼吁字节公布算法,命中靶心。

无论如何,就算法呈现的结果而言,我们有充分的理由怀疑,字节两大平台并不是单纯搬运内容的“邮差”,而是积极干预内容创作的信息供应商。大量劣质内容充斥字节两大平台,平台运营者难辞其咎。究竟是算法不完善的“天灾”,还是算法有人为设置导向性的“人祸”,都是“避风港原则”背不动的锅。

02 被漠视的“红旗原则”

“避风港原则”自诞生之日起,就伴随着巨大的争议。不可否认的是,没有这个原则,就不会有互联网平台产业的发展。平台运营商天天被告到死,那还怎么搞?

“避风港原则”的局限性也是显而易见的。互联网技术发展如此之快,网络环境发生了翻天覆地的变化,“避风港原则”给予平台运营商的免责过于宽泛,需要打补丁。这个补丁就是“红旗原则”。

“红旗原则”是指,如果信息网络传播的侵权事实如此显而易见的,就像是红旗一样飘扬,那么网络服务商就不能装做看不见,或以不知道侵权的理由来推脱责任。

在国内外的司法实践中,“红旗原则”已有广泛的应用,效力并不低于“避风港原则”。在网络侵权的争议中,只谈“避风港原则”,不谈“红旗原则”,就是耍流氓。

image

字节两大平台上那些营销号量产的谣传、中伤,何止“红旗飘扬”,说是乌云压顶也不为过。完全适用“红旗原则”。识别这些剧本统一的“套壳内容”,在技术上也并不困难。

字节引以为傲的强大算力,可以做到精确过滤敏感词,却连那些“一眼假”、黏贴复制痕迹明显的量产劣质内容也识别不出来吗?人工智能已经可以写小作文、创作视频的技术条件下,平台的内容审核对这些污泥浊水“视而不见”,无疑是说不过去的。把失察的责任一股脑推给“算法技术不完善”,更像是为了流量不惜藏污纳垢的借口。

实际上,字节的算法很精确,不仅可以精确到每个词,更能精准到人。“冠军怼冠军”事件中的吴柳芳就是被“定点清除”的。

03 任性的“违反有关规定”

“擦边”是视频直播行业的一大赛道,这从来都不是秘密。吴柳芳不是第一个被指“擦边”的抖音播主,也不是第一个因争议事件大量涨粉的抖音播主。只是因为指责她擦边的师妹“身份特殊”,她的号就因“违反有关规定”内容下架、禁止关注了。百万粉丝的大号,就这么轻描淡写地灰飞烟灭。比吴柳芳尺度更大、粉丝更多的“擦边”网红,却是舞照跳、礼照收。

抖音平台对吴的“定点清除”,依据什么“原则”处理的?“有关规定”到底是什么规定?是为吴柳芳量身定做的规定吗?

标榜“技术中立”的抖音,对吴柳芳“中立”了吗?

image

如果这是算法的自动操作,那只能说抖音的算法太智能了。谁是软柿子、谁是硬茬子,都能算得清清楚楚。如果这是人工主动干预的结果,那还谈什么“算法中立”、“避风港原则”?

到底是算法已经达到了人情世故的超智能,还是人为干预的上下其手,我们无从得知。我们能知道的是:字节的“避风港原则”长期庇护了那么多网络暴徒、谣言制造机,却容不下一个吴柳芳。这真是莫大的讽刺!

平心而论,在当前的环境下,要求平台运行商做到“技术中立”,是为难他们了。做不到就不要立牌坊,更不要拿“牌坊”挡枪。嘴上的“技术中立”,不耽误“唯流量”的上下其手。平时什么毒奶流量都敢要,一有风吹草动秒怂。这么大买卖做得那么不入流,令人不齿。

标榜“技术中立”,却成了价值虚无的遮羞布。“避风港原则”也就成了逃避责任的避风港。作为中国互联网平台头部中的头部,不应该沦为“以强欺弱,霸凌弱小”的工具。

字节不要再奢谈技术中立和避风港原则,能守住“不作恶”的原则为底线,就是国人之幸了。

为什么放弃创业加入字节跳动

By: MacTalk
9 June 2022 at 16:43

今天我和老沈做了一次对谈,后续会放到播客和我的知识星球里,收获还挺多的。老沈是 Tower 的创始人,后来产品卖给了 Ones,自己加入了飞书团队,现在是飞书的产品副总裁。

我做播客,一般会写个大概的提纲,然后循着一根主线聊,聊的过程中会出现很多意外的灵感。如同我们在一个森林公园转悠,突然发现曲径通幽,不同的枝桠、花草和颜色纷至沓来,美不胜收。这就是让人惊喜的创作过程。

和老沈聊的过程中,很多内容让人惊喜,比如为什么 Tower 不做移动版本,为什么 Tower 不收费,关停另一个项目 知人 HR 系统的考量是什么?卖掉 Tower 的形态是什么?进入字节半年,啥具体业务也不做,这是什么神操作?

特别多有意思的话题。

我觉得老沈从一个执拗的创业者转变成了一个产品的掌控者,至于这个产品是不是属于自己,没那么重要了,他更加看中平台上的空间,飞书的总裁也给了他足够的信任,这很不容易。 每个创业者可能都有一点偏执,说白了就是自己的盲区,2016 年的时候我让老沈好好做移动版,他不是也不听吗,今天和我说,Tower 移动版的缺失是最大的败笔,而知人 HR 系统则完全是一次认知上的打脸。但在这之后,他能够认识到 Tower 的局限性和天花板,决绝的卖掉了 Tower,给到投资人和员工一个体面的交代,然后转身投入飞书,不得不说这是一次还算不错的转身。

老沈正在从一个创业者,转变成工匠。

任何工作的本质,都逃不开重复劳动,只是重复的内容不同。 作家要不停不停的写东西,科学家要不停不停的做实验,医生要不停不停的打针换药做手术,设计师要不停不停的画图,我们要不停不停的写代码。

不同的是,有些人终生都在重复,有些在重复之中不断的积累量变,最终形成质变,写出了不朽的巨著,破解了世界难题,画出了惊世的画作,写出了改变世界的软件。

坚持,耐得住寂寞,才能不断的积累量变,如果再有一点点创意,一点点机遇,才有机会实现最终的质变。对于擅于坚持默默耕耘的人,即便大多数人没能寻求到质变,但依然坚守的人们,好像有个统一的称谓 —— 工匠。

敬请期待我们的播客成品吧。

近期拍的一些照片:

❌
❌