Reading view

There are new articles available, click to refresh the page.

体验夸克「造点」:更懂中国元素的AI创作工具,还有Midjourney+Wan2.5 的王炸组合

AI 生图的风,终究还是吹到了我们打工人身上。

老板一句「现在 AI 这么牛,你用它五分钟给我出个图」,说得轻巧,但谁用谁知道。

虽然 AI 生图和生视频甚至可以做到真假难辨,但实际应用还是会有无数意想不到的问题。一些 AI 工具虽然很强,但由于训练素材问题,常常对中文内容和中国风的理解存在偏差。

幸好,国内厂商也在不断努力,适用于中文语境的生图效果也在不断提升。阿里云栖大会期间,夸克也上线了新的 AI 图像与视频创作平台「造点」。

除了更懂中国元素和中文排版,还是国内首个支持 Midjourney V7 模型的生图工具。视频生成则用上了最新发布的万相 2.5 模型,之前爆火的 Veo3 能玩的功能基本都支持了。

现在,你可以在夸克上点击「造点」,或者直接访问 zaodian.quark.cn 来体验。

还有一个福利别忘了领。即日起至 9 月 30日 ,所有用户均可限时 7 天免费体验通义万相 Wan2.5 的视频生成能力。

APPSO 当然也第一时间体验看看它到底能造点什么。

更懂中国元素的生图工具

APPSO 经常要测试 AI 生图工具,所以我也常跟公司的设计师同事交流,想知道 AI 工具是否在改变他们的工作方式,不过常常收到的吐槽会更多,调教 AI ,堪称堪称一部跨服聊天的血泪史。

你跟它说「侠骨柔情」,它给你个中世纪骑士;你说要「烟火气」,它给你个壁炉 。

好不容易生成个带中文的海报,不是缺胳膊少腿,就是排得像狗啃,在一些专业场景还是拿不出手。

这次夸克造点最让我惊喜的,是把咱们中国人的那点含蓄、那点意境,拿捏了。

我试着让它生成一张 「东方运动美女摄影图,展示马甲线」,出来的图让我愣住了——那位小姐姐身上有清晰的肌肉线条,但神态开心自然,皮肤纹理细腻真实,高级感满满 。

之前很多 AI 生成的亚洲脸总是千篇一律,现在终于有了灵魂

而最让我头疼的中文排版,也不用像过去那样「开盲盒」

比如让夸克造点生成一张 「秋季主题的邮局海报」,它不仅体现了秋天和邮局的标志性元素,不同文字的层级、字体、排版也都比较协调,大字小字都没有乱码,可用性颇高。

最近看了一部电影《长安的荔枝》还不错,我想制作一张海报来给我的朋友圈影评配图,不只是毛笔字体到位,整个排版结合荔枝元素和东方意境,质感甚至不输官方的电影海报。


我们还尝试了更多中文海报的排版,整体的稳定性不错,不仅能写对,排版美感也能打。

无论是「白银时代」的 Art Deco 风格,还是「老榕树」的粗犷毛笔飞白,它对中文的理解已经深入到了「笔画」和「意境」的层面 。

如果脑洞再大一些,用不同材质来设计字体,也就是一句话的事。

它对国风元素的理解,也不仅仅是元素的拼贴。比如 「身着民族服饰的高定模特」和 「烟雨朦胧的故宫红墙」这两张,无论是少数民族头饰服装纹路细节,还是模特人物妆造和故宫背景的搭配,都很自然。

不只是人物,设计一些中国元素的礼盒和首饰它也会考虑周到,除了礼盒和首饰本身,展示的搭配的物件也是中国风。

我发现,造点对「中国风」的审美和理解,不是停留在表面符号,在生成中国风插画时尤为明显。

这些插画不仅做到了服饰风格和吉祥意象的还原,更是传递出了水墨画、敦煌壁画的意境,将中国传统美学的典雅和底蕴比较好地呈现出来。

这点很重要,意味着它不仅仅是一个有趣的玩具,更有希望在更多真实场景下,成为生产力工具 。

不整花活造点实用素材,行不行

我发现除了整活,当夸克造点把那些对中文的设计能力,无缝对接到各种工作场景时,它是真能干活。

以前想设计个包装,能把头发薅秃。现在,我们尝试设计一款猫粮包装,只要告诉它要「扁平卡通插画、波斯猫跳起抓鱼、海滩背景」,它连猫耳朵造型、三文鱼腩实拍、「天然有机」的宣传气泡都安排得明明白白。

更有意思的是,它还能帮你把品牌周边从图纸上到货架,直接帮你做一套产品包装+周边设计。

我告诉它要做「一套四个的云南主题文创冰箱贴」,再把「玉龙雪山、咖啡豆、野生菌火锅、孔雀大象纹样」这些元素丢给它。

一套色彩鲜艳、充满民族风情的珐琅彩琉璃冰箱贴就出炉了,精致得可以直接打样。

再来开发一套 「国风妖怪 IP」,它能帮你设计出毛绒玩具、钥匙扣、徽章等一系列产品 。


做一套「咖啡品牌VI」也不在话下,从手提袋、纸杯到菜单,它能用统一的黑白极简风帮你设计一整套,工业感和时尚感兼备 。

旅游文创玩法就更多了,无论是可爱的 「旅游主题贴纸」,还是「福州文旅产品」 的帆布包、台历、团扇,它都能帮你快速生成情绪板和产品模型,让创意落地变得无比简单 。

想开个小店,但不懂装修设计?夸克造点甚至能当个合格的免费设计师。

想开家 「快餐店」,让它来个「赛博朋克风」,一个巨大的异形红色霓虹招牌立刻就有了,氛围感十足。


无论是 「精品咖啡」 的文艺惬意,还是 「气球商店」 的梦幻童趣,它都能帮你一键搞定,让你的小店成为网红打卡点 。

当工作流已经被 AI 彻底简化后,我开始不满足于「够用就好」,想要追求更高阶的艺术表达,于是我把目光投向了那个传说中的……

MJ 国内首发,我的审美上限被它打开了

当我发现夸克造点里居然藏着 Midjourney 的官方通道时,我彻底不淡定了。这可是国内首次有官方渠道能直接用上最新的 MJ V7 啊 。

以前想用 MJ,不是被复杂的订阅流程劝退,就是苦于高昂的价格。现在好了,夸克造点直接把价格打了下来。

更让我惊喜的是,它把 MJ 那些高深莫测的参数,变成了人人都能懂的「美学遥控器」,可以通过调整「风格化」、「怪异化」和「多样化」,来摸索出你满意的效果。

有了这些精细的控制,我感觉不是我在用 AI,而是和一位顶尖的美学大师在「共同创作」。

游戏开发者和玩家估计会爱上这个功能。我尝试生成一个 「赛博朋克风格的年轻男英雄三视图」,它迅速给出了包含正面、侧面和背面的完整角色设计,连服装上的机械元素都清晰可见,质感堪比专业概念稿 。

需要搭建场景?让它画一个 「沙漠中的L形建筑废墟」,出来的图是等距视角的3D立体模型,破损的墙壁、散落的碎石和哑光粘土质感,氛围感直接拉满,完美符合游戏场景的需求 。


它还是一个艺术风格模拟器。我想画一张 「手绘插画」,只需告诉它「托尼·迪特利齐风格」,一张充满奇幻色彩的马德里街景就诞生了。

中国风素材在这个模式下也有了别样的艺术质感,

我试着让它画一幅「粉金主调、层峦叠嶂的仙境」,它不仅给出了山间缭绕的云雾,还糅合了「水墨晕染的朦胧」和「金色线条的精致」这两种质感,那种仙气飘飘又富丽堂皇的感觉,直接就能当壁纸用。

想要邪修一下也没问题,无论是 「空山基的光滑镀铬机器人」 还是 「伊藤润二的黑白恐怖漫画」,它都能轻松驾驭,让你的创意在各种艺术风格间自由穿梭 。

有了这种艺术美感的图片生成能力打底,一个更大胆的想法在我脑中浮现:让这些惊艳的画面,真正「动」起来会怎么样?

前方高能,造点大片

在刚刚结束的阿里云栖大会上,通义发布了最新的万相 2.5 模型,造点也已火速接入。

简单来说,新模型原生支持音画同步生成,图加音频就能开口「表演」,并且视频时长翻倍至 10 秒,对复杂指令和电影级质感的理解也大幅提升。

现在,你可以直接在造点体验到这些新能力。

我试着让模型生成一段女生弹吉他的视频,它不仅精准对上了口型,拨弦的动作和音乐的节奏同步,连眼神和微表情都带上了戏。

这背后是万相 2.5 的「音画同步」技术,让视频生成不再是简单的「对口型」,而是真正的情感表达。

想让你喜欢的角色「活」起来?试试这个,上传一张图加一段音频,就能让任何人和物开口。

画面可以自然匹配你提供的任何声音——无论是人声、音乐还是音效,创作脑洞也可以更大了。

角色一致性是视频叙事的基础。万相 2.5 加持下,造点现在单次可生成长达 10 秒的视频。

比如用造点生成之前很火的「第一人称 vlog」,人物在边走边做各种动作,角色形象也能稳稳保持,意味着故事能讲得更完整了。

此外造点对镜头语言和复杂动态的理解也不错,画面很有大片质感。

下面这段视频,模特身着金属反光礼服一路走来,光线在金属面料与泡泡上折射出炫彩光晕,展现出梦幻和先锋的美学质感。

从复杂的运镜到微妙的动态表现,在 AI 加持下,普通人对画面的掌控力,也能堪比电影导演。

AI 时代,用想象造点不同

体验下来,我感觉夸克造点更像是一个全能实用的创作搭子,懂你奇奇怪怪的想法、能帮你省钱省力、还能激发你无限创意。

更重要的是,它让夸克这个 2 亿人都在用的 AI 助手拥有了更强的视觉化生产力,更加全能。

无论你是普通用户,想在手机上给照片 「换个发型」、「一键 P 图」 发个朋友圈 ;还是专业设计师,需要快速生成 「包装设计」、「店招门头」设计灵感 ;甚至是品牌营销和影视游戏行业的从业者,要制作 「影视分镜」、「电影级视频」 ,都能尝试在夸克造点里找到高性价比、实用的解决方案。

在它面前,创作「五彩斑斑的黑」甚至不再是甲方无理的需求,而是一次灵感的涌现,是真的可以落地的作品。

APPSO 也一直把「创造」作为信仰,我们认为当下连接热爱和创造不同最好的能力就是 AI ,当每个人都能「用想象造点不同」时,一个新的创造时代,或许才刚刚开始。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Luma AI – 生成式视频 AI 巨头重磅更新,创新的视频创作交互方式

DUN.IM BLOG

DUN.IM BLOG

AI 视频,还能往哪个方向卷?Luma AI 的答案有些与众不同。对手还在练一招一式,它却像风清扬传授独孤九剑,讲究灵活变通,如行云流水,任意所之。

Luma AI 或许不如可灵、Runway 知名,但论实力也在第一梯队,它的视频模型叫作 Dream Machine,今年 6 月发布,最近进行了重磅升级,是推出产品以来声势最大的一次。

其中包括两项更新,一是发布自己的图像模型 Luma Photon,将文字、图像、视频一锅端;二是打造了生成 AI 视频的全新工作流,我们可以像和 ChatGPT 聊天一样,让 AI 生成视频,不用对提示词字斟句酌。

对于生成视频这件事,Dream Machine 首创了一种很新的方式。

Unlock your creativity with Luma AI Video Generator. Turn text into stunning videos with our cutting-edge text-to-video AI.

打开 Dream Machine,我们先看到的是「Board」,可以将它理解为无限的创意画布,在这里,我们使用自然语言,自由地生成图像或者视频。

开始一块 Board,我的提示词写得非常简单:「创建一个日式悬疑少年漫画的角色。」

AI 扩写了我的提示词,一次生成了 4 张图片,但是不行,年代不对。

没关系,再在对话框输入一句,「放在现代背景」。

AI 表示懂了,又生成了 4 张图片,右上这张孤身走暗巷,已经接近我想要的感觉了,但仍然不够,我想要他抬起头,露出五官。

不难,继续微调,忘掉复杂的提示词,和 AI 打直球就可以。

右下这张不错,虽然形象幼态了点。接下来,我想让 AI 生成一个视频,主角在同一条巷子里从白天走到黑夜。

Dream Machine 生成视频的首尾帧功能,就是为这种需求准备的——我们挑好头尾的两张图片,让 AI 补足中间的过程。

那么,我们只需基于满意的图片,让 AI 生成几张白天场景的,沟通方式还是一样的简单粗暴。最终选定的两张图片,细节略有落差,但同框也不违和。

万事俱备,只等生成视频,AI 过渡得还算自然。

看到这里,你应该明白 Dream Machine 和其他视频工具的区别了。

其他视频工具,通常是给你一个填入提示词的文本框,然后让你设置运镜、时长等参数。设置一次,生成一次。

但 Dream Machine 的界面,看起来非常像和聊天机器人交互,底部是输入框,文生图、图生图、图生视频、文生视频,都可以在这里进行。

专业创作者可以继续写传统的提示词,但我们也拥有了「讲人话」的权利,压力给到 AI,Dream Machine 能够理解上下文,帮我们完善提示词,我们可以从一个非常粗糙的想法开始,和它边聊边改边优化。

又因为 Dream Machine 是无限画布形式的,我们可能在一个环节反复生成,素材都会保留下来,不会互相覆盖。

我们的思维,不会局限在一段提示词、一个视频,而是像水一样流淌,更多的想法,可能就在这个过程里产生了。

Dream Machine 的全新工作流就像大树的主干,其中一些好玩且实用的功能则像枝桠,相得益彰,才能枝繁叶茂。

起到关键作用的,就是 Dream Machine 最新发布的图像模型 Luma Photon。

图片怎么生成得更符合我们的审美?Dream Machine 支持风格参考和角色参考功能。

先说风格参考,我们可以导入自己的图片,AI 会将风格融入到创作中。官方给出了一个例子:按蒙德里安风格,生成小鸟版的《戴珍珠耳环的少女》。

按这个思路实操一下,基于男性侦探的形象,参考梵高《星月夜》的风格,生成女性侦探。

二次元遇上后印象派,化学反应很奇妙。

角色参考功能,则可以通过一张图片,就实现角色的一致性,让这个角色出现在更多的图片和视频里。

Luma AI – 生成式视频 AI 巨头重磅更新,创新的视频创作交互方式

马斯克是行走的素材库,这样的例子太没挑战性了,我决定让甄嬛瞬移到哈利波特的世界,看场景变了之后,她还能不能气场两米八。

结果有些不好评价,看得出来是甄嬛的面容,但娘娘的长相入乡随俗,五官尤其眼睛,变得更像欧美人了。

其实,不另外找图片参考,Dream Machine 也可以让图片、视频不泯然于众人,这时候就要用到「头脑风暴」功能,它会根据你生成的图片,推荐一些艺术家的风格。

就像甄嬛进霍格沃茨这张,我们可以用吉卜力工作室风格二创。

不仅如此,提示词里的一些关键词,被框选了起来,能用下拉的选项替换,Dream Machine 称之为「概念药丸」,我们不用自己手写提示词,一键更换艺术风格,或者画面元素。

把「吉卜力」换成「新海诚」,把「独角兽」换成「龙」,不过点击几下的功夫。

Luma Photon 模型,基于 Luma 的通用 Transformer 架构构建。通过开发自己的图像模型,Luma AI 可以减少对 Midjourney 等外部图像模型的依赖,同时也能解决文生视频不稳定的问题。

当然,视频是老本行,镜头运动这种可控性功能,Dream Machine 也少不了。

紫禁城的甄嬛,和霍格沃茨的甄嬛,能不能实现丝滑的转场呢?用推拉镜头,画面有动感,人物没有严重的变形,可以打个 80 分。

巧的是,前两天 Runway 也官宣了自己的图像生成模型 Frame,和 Luma 更新是同一个晚上,看演示就知道非常注重审美,目前正逐步向 Gen-3 Alpha 开放资格。

▲ Runway Frame

图片的生成质量、美学高度,以及视觉风格的一致性和可控性,越来越被视觉模型重视了。

这对创作者来说是好事,当我们用 AI 进行平面设计、角色设定时,其实就是在生成一个独特的世界,讲一个独特的故事。

Runway 的 CEO Cristóbal Valenzuela 认为,Runway 不是一家 AI 公司,而是一家媒体和娱乐公司,AI 公司的时代已经结束了。

他不是在唱衰 AI,恰恰相反,他认为 AI 是一种基础设施,真正的革命不在于技术本身,而在于它所实现的东西:新的表达形式、讲述故事的新方式、连接人类体验的新方法。这和 Luma 的进化方向不谋而合。

这次更新之后,Luma AI 首席执行官兼联合创始人 Amit Jain,给 Dream Machine 下了一个很有趣的定义——视觉思维合作伙伴。

概念有些抽象,他的意思其实就是,让生成图片、视频这样的视觉创作,像聊天一样简单、直观。

交互的方式,影响着我们思考的方式。画布式的工作流,能将脑洞可视化,记录所有的创作过程和结果,呈现生成视频的完整思路。

无限画布通常在图像模型较为常见,比如 Recraft 和 Ideogram 的 Canvas。Dream Machine 的画布更加规整,相同提示词生成的素材和变体横向排列,不同的则竖向排列。

边聊边生成边优化的过程,会让人觉得,一个独立的小世界仿佛在画布里诞生。

先让 Dream Machine 用超写实电影 CG 风格,创造一个工业废土背景游戏的主角。

然后用环绕镜头,让主角动起来,并塑造环境的空间感。

接着,我们可以再和 AI 聊,让 AI 继续生成废土世界观里室内室外的各种场景,让 AI 建议我们怎么塑造得更有末日气息。

 

某种程度上,这个画布,就是我们个人故事的设定集。

当然,Luma AI 的 bug 也很多,包括但不限于,用一张图片实现角色一致性,效果并不理想;积分如流水,图片和视频还是要反复抽卡;图片模型可以生成准确的英文,但中文不行……

但意思传达到位了——少谈参数,以交互为出发点,构建一个 AI 创作工具。

更好的视频模型,不只是有更快的生成速度、更可控的镜头运动、更独特的美学,它应该也提供更好的讲故事的方式,让文字、图像、视频都作为表达想法的工具。

Dream Machine,造梦机器。

只管去创作吧,如同 Luma AI 的这句话:「不需要写复杂的提示词,问就好了。」未来 AI 留给我们的问题,不再关于技术,而是关于我们用它构建什么。

Recraft – 打败 Midjourney,匿名屠榜的 AI 生图黑马,人人都能设计海报

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

如今 AI 圈更新产品的节奏,让每个和键盘难舍难分的编辑明白了一句台词:你还有多少惊喜是朕不知道的?

这不,又一个 AI 生图神器来了:Recraft。

好用在哪?一句话概括就是:人负责排列组合,AI 负责美工,审美挺好,还不容易出错。

对于普通人来说,设计海报又又又变得更简单了,我们就是 AI 的甲方,给它一套毛坯,它给你一次次不重样的精装。

Generate and edit vector art, icons, 3d images and illustrations in a wide range of styles suitable for websites, print and marketing

请问,设计一张海报,需要几步?Recraft 表示,三步就够了。

首先,在空白画布上,拉出一个紫色的框框;其次,在你想要的位置放入图片、文字,输入提示词;最后,点击生成按钮,AI 就能帮你化腐朽为神奇。

只要等待十几秒,一张海报出现在你面前。比如这样,轻轻松松把文字变成 3D。

▲ 图片来自:X@recraftai

或者,你想做个表情包,有图,有文案,但不知道怎么组合更好看,也可以交给 Recraft,让它来扩图,把文字自然地融进场景里。

▲ 左边,AI 生成;右边,草图

甚至,我们不上传图片,纯打字,让 Recraft 一条龙生成海报也没问题。

文字渲染一直是图片生成模型的痛点,但 Recraft 牛逼在,可以 hold 住一大段文字。

A 妹主演的《魔法坏女巫》将在 11 月上映,国内也会引进,然而,电影还在文火加热,设计简陋的海报已经被群嘲了。

不如让 Recraft 重做一次吧,我用不同字号,把文案排列了一下,草图这就算做好了,然后参考原海报,反推提示词,说明了画面的要素,接下来交给 AI 一键美化。

▲ 左边,AI 生成;右边,草图

可喜可贺,该有的都有,文字没有错误,每一行都被 AI 精心设计,和官方海报一比,风格不同,但没有差到哪里去。

Recraft – 打败 Midjourney,匿名屠榜的 AI 生图黑马,人人都能设计海报

▲ 左边,AI 生成;右边,官方海报

除了从头设计,Recraft 还可以处理多张图片,满足追星族和嗑 CP 爱好者的要求——把喜欢的角色 P 到一起,看起来不突兀。

以哈利波特和毒液为例,上传需要的两张照片,背景不同怎么办?这里不得不提 Recraft 一个非常实用的功能:一键抠图。

是的,传统的 P 图软件都有抠图功能,这不算什么,但 AI 生图工具,考虑到这个大众功能并加进产品的,不多。

抠图之后,配上文案,看起来仍然有次元壁,默认字体也丑了点,没关系,选择你想要的画风,让 AI 统一优化,就有同框的感觉了。

▲ 左边:优化后,右边:优化前

擅长设计平面是不够的,Recraft 的一个功能更让人拍案叫绝:Mockup,做立体物体的图案设计。

先让它生成一个普通的红色棒球帽,中间的绿色框框,用来生成图片,或者上传自己的图片,然后图片可以和帽子完美融入。

比如,加上一段文案:「make cats great again」(让猫猫再次伟大)。

抠图去除多余的背景,把图标拉伸到满意的大小、旋转和移动到合适的位置,它始终保持透视效果,自适应地贴合表面。

以此类推,T 恤、杯子、徽章也是一样的,吃谷虽然快乐,但伤钱包,以后可以自己给自己做周边,赛博欣赏,自娱自乐了。

▲ 仅示意,徽章是 Recraft 生成的,图案是上传的

请问,我为什么一直在让 AI 设计英文内容?

因为 Recraft 有硬伤:可以用中文提示词,但输出不了中文。哪怕我明确要求,某段话请用中文写,它也会「贴心」地给我翻译成英文。

但只要能登上 Recraft,就有免费额度可用,设计海报、封面、产品图、表情包…… 有便宜可占,已经很香了。

我们知道 Midjourney、DALL-E、Flux、Ideogram,但这个 Recraft 是何门何派?

前段时间,文生图模型 red_panda 在 X 一鸣惊人,因为它在 Hugging Face 的排行榜拿下了第一名,把有名有姓的前辈踩在脚下。

这个排名,靠两两图片对比得出,比的是综合能力,包括审美、提示词理解、身体结构准确性、文字生成质量等。

网友猜测,red_panda 是「小熊猫」的意思,难道来自中国?关子没有卖多久,幕后团队就出来自曝了。

red_panda 基于模型 Recraft V3,背后的公司是 2022 年成立、总部在伦敦的 Recraft AI,创始人曾在 Google、微软工作过。

Recraft 一朝成名天下闻,不是没有道理,这个产品集了各家之所长。

▲ 图片来自:X@recraftai

论高清、光影、真实感,Recraft 不输 Flux。

同时,它对新手友好,有很多不错的预设风格,游走在写实和艺术之间,不用写复杂的提示词,就能模拟各种摄影和绘画效果。

▲「Hard Flash」风格,强烈、直白的闪光灯效果

Recraft 擅长的长文本图像生成,准确度怕是让拿文本做招牌的 Ideogram 都自愧不如,而且,它很听话,可以让我们决定文本的大小和位置。

▲ 图片来自:X@recraftai

不过,Recraft 也可能出现文本错误,并且导致背景变形。当我模仿《火星救援》的风格做马斯克的海报,他的脸像被整容了,还是失败的那种。

▲ 左边:AI 生成;右边:草图

当 AI 生图工具都在增强可控性,Recraft 不落下风,Midjourney 的修改局部功能,它也有。

我们框选出某个区域,然后用提示词告诉 AI 怎么修改,加个帽子轻轻松松。

十八般武艺都会一点的 Recraft,会抢设计师的工作吗?恰恰相反,它是来交个朋友的,把自己定义成:面向设计师的生成式 AI。

所以,Recraft 具备了一些设计师们需要的功能,比如样式也可以通过更多的图像输入给模型,保持风格的稳定。

Recraft 还做了一个小小的协作功能,画布可以共享,让对方评论,因为「有时候,两个人的想法比一个人的想法更好」。

▲ 图片来自:X@recraftai

更喜闻乐见的是,Recraft 生成的图片可以免费商用。

当然,不是设计师的小白们,比如我,也可以玩得很开心,分分钟做出自己喜欢的海报。

而且,本就没必要将人和工具比较,Recraft 是来和 Canva 等设计工具、Midjourney 等 AI 生图工具同台竞争的,用户们坐享其成。

▲ 图片来自:X@recraftai

Canva 的 CEO Melanie Perkins 说过,Canva 希望让每一个人都设计出他们可以想象的任何东西,无论说什么语言,用什么设备。

所以,他们打破 Adobe 的门槛,简化了设计流程,提供了各种模板、部件、图片、字体,让用户增减元素。

▲ 图片来自:X@recraftai

AI 的进化方向,和这位 CEO 的愿景是一样的:为全世界赋予设计的能力。

但我们的选择,越来越不局限了,不是必须选择哪个产品,不是必须听某个创始人的故事,工具能帮我们做的越来越多,我们按下的按钮越来越少,甚至可以不亲手操作,人人都能设计一点东西,如果我们还愿意称之为设计。

Image to Prompt – 免费 AI 图片转提示词工具,一键生成 Midjourney、Stable Diffusion 关键词

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Image to Prompt」是免费的图片转文字工具,将图片上传、几秒钟就能准确识别转为提示词,将生成内容复制后使用在其他的 AI 图片生成器,例如 Flux1、Stable Diffusion 和 Midjourney 等应用程序,识别速度很快,转换后图片就会删除,服务器不会储存用户上传识别的图片资料。

Image to Prompt 网站宗旨是帮助用户撰写更好的图片提示词,从而让用户能够更好的使用图片 AI 工具生成各种图片,如果有需要获取图片提示词灵感,从图片直接转换文字、稍作修改调整应该是最快的方法。

Upload your image, and it will be convert image to prompt in just seconds.

进入「Image to Prompt」网站后直接把要转换为文字的图片拖曳到左侧上传栏位〔或是点击下方的示例图片直接带入进行测试〕,接着点击右上角「Start convert」就会开始识别、转换。

几秒钟后右侧就会显示英文的图片提示词,将这段文字使用在其他 AI 图片生成器就能生成近似的图片,有需要也可以修改部分内容,相较于从零开始撰写提示词先使用生成器转换会是更快的方法。

如果图片的主题是人物,Image to Prompt 也能正确识别并提供相关信息。

Image to Prompt – 免费 AI 图片转提示词工具,一键生成 Midjourney、Stable Diffusion 关键词

我用 ChatGPT 和 Midjourney 剪掉了蓄满四年的长发

这是我蓄满了四年的长发,原本是打算捐给金丝带的,但我决定放弃了。

一来,捐赠的人太多了,不缺我这一个,它不需要我;

二是,这个活动太热门了,报不上名,我不喜欢凑热闹;

于是,我心里很快就决定了:剪掉,并且要烫卷、染发!

在音乐教室里,筱烨、阿吉和秋秋在上课,我就在旁边用 ChatGPT 写 Prompt,写完之后就丢给 Midjourney 去生成效果图。遇到不满意的,就丢两张我以前的半长发的照片上去,再调整 Prompt 的细节,接着画。

最后,我把这张效果图发给发型师:

虽然这脸型偏硬了,不怎么像我,但这个头发感觉是我想要的。

曲线、松软、紫色挂耳

确定方案之后就直接约时间,一方面要约发型师的时间,他很好约,就在楼下,我随时过去随时可以做;但另一方面,要约收头发的师傅过来,需要由他根据长度把我的头发抽出来。这也是我第一次卖头发,挺新鲜的体验。

首先,我要跟发型师和收头发的师傅一起商量,怎么剪、剪多少、剪到哪里、用什么方法剪。我原本以为就是咔嚓一刀剪了,但其实不是。整个过程里,这位师傅需要非常仔细地把我头发中最长的部份找出来,每次只挑选一小撮,然后用剃刀在距离头皮大约 8-10cm 的位置一点点把头发切断。这样做的目的是,即确保剪下来的头发是满足他收头发的需求,也能确保给发型师留有后续足够的操作空间,还得让头发之间的层次能自然地衔接上。

每次剪下一小撮头发后,他都会仔仔细细地把头发梳几遍,确保没有任何打结,然后放在准备好的毛巾上,平放着。剪之前还特意要把周围的风扇都关掉,万一吹乱了,这些头发都全都没用了。他就这么一遍一遍地重复捏一小撮、切下来、梳顺、平放,如此反复了半个多小时,才终于从我头上抽出来两把共 59g 的长发。

然后就是烫卷和染发。

之所以想这样折腾一下,多少有一点破罐子破摔的心态在,觉得既然这头长发不被需要了,那也就放过自己,不要再被「这件事」困住了,索性趁着这个机会来尝试一下之前没折腾过的事情!

其实我 17 年前也染过一次发,但那时候是因为演《暗恋桃花源》的老导演,为了贴近角色的年龄感,我就去染了一头白发。只不过那个白发染得不成功,黄黄的,加上那会儿我比较消瘦,自己觉得不好看,所以演出结束的第二天我就去剃光头了。所以那次严格来说我不觉得是一次正经的染发体验,毕竟没有顶着这头黄毛生活,勉强能算一次临时的体验。

我当然知道它会掉色,会变成黄毛,会干、会毛躁。

但这不重要,因为我就想试一试。

我紧绷了三十多年,现在崩断了,还不能讨好一下自己,玩一玩吗?玩!

不仅要玩,还要玩得不一样,用 AI 一起玩!

为什么是紫色?因为我喜欢!

虽然我也喜欢绿色,但我也不想染成绿色 😂

朋友说像杨千嬅,像极速拍档的小乔,那也挺好。

最近两周我忽然意识到,我是会因为自己感觉到快乐而感到羞耻的。这是从小根深蒂固的想法。过去我知道,如果我遇到一件好事,一件开心的事,就会有一个声音在警告自己不要乐,不要得意,不要喜形于色,要收起来,不然马上就会招来不幸和倒霉。但我一直认为这是克制和谨慎,是对于能量守恒定律的迷信式的执念,觉得这会儿开心了以后就没有了。

可是,为什么要把开心攒到以后呢?有没有以后都不知道。

筱烨说我的动力来自恐惧,确实,我总有各种恐惧在周围,挥之不去。

但现在我看见它了!我要让我的快乐活过来!我不要快乐羞耻!

尽管我现在还没有什么活力,但起码这个紫色能令我舒服好一阵子!

最后再看一眼,这头蓄了四年的长发和发髻。

我很喜欢这根石纹簪,但我感觉我应该不会再束成这个样子了。

这天色真好。

金色曠野裡的自行車

距離九月四號已經過去十四天,除了那天傍晚六點零幾時,我抱著小柒哭了幾分鐘,直到上週五零點左右,我才終於第二次哭出來。在《單車》的旋律裡,在跟著哼唱的情緒裡,在那些模糊又清晰的記憶裡,抽泣著把這些天積攢的情緒慢慢釋放了一些些。

颱風「蘇拉」襲擊深圳,高鐵停運,坐順風車趕回韶關

我很難形容那些複雜混合的感覺,它們彷彿一陣一陣的海浪:我就站在沙灘浪邊,潮水一次次慢慢地湧上來,包圍我,退去時拉著我往深處走,腳下的沙子一次次被抽空,明明站在地上,卻如同失重一般無法站立。

我無法說出「我很想他」這樣的話。

想念嗎?想。

責怪嗎?也有。

內疚麼?有些。

後悔嗎?沒有。

醫院的走廊,左邊是病房,右邊是護士站

我已經在盡我最大的努力做好每一次了,在阿爺阿嬤和爸爸的靈位前,我可以說我是問心無愧的。某一個守夜的晚上,我跟筱烨這麼說。但無論我怎麼做,都會被人說我做得不夠,做得不好,說我不孝。你回來得太少了,帶小柒回來得太少了,你看他就是為了等小柒,不然怎麼會剛回來就嚥氣,諸如此類。我應該承受這些麼?筱烨應該承受這些麼?她們是妹妹,一定是非常傷心的,但我就不傷心麼?我是兒子就理應被這樣指指點點麼?她們不懂。她們從來不知道我這三十多年是在什麼樣的環境中走過來的,她們也不知道我從小到大有多麼羨慕弟弟妹妹們那溫暖的花房。

但這已不重要了,父母沒做好的部分,我會努力在我這裡終結掉,不讓小柒體會我所經歷的那些事。我對父親的情緒太複雜,我愛他,也埋怨他,我敬畏他,也可憐他,在漸漸緩慢下來的呼吸中,他沒有疼痛地結束了這一生,對於一個癌症病人來說已經是萬幸了。可我仍然在一陣陣的海浪當中,無法跨出離開沙灘的腳步。

照進病房的陽光
從鼻管換成氧氣面罩

「我只是想保護你」

回到深圳的第一晚,在負一樓等電梯的間隙裡,我和小柒聊起他記憶中那次糟糕的經歷。

那大概是三年前?我其實記不清準確的時間點了,大概就是他四歲左右的時候。具體他做了什麼事我也不記得了,當時我們都挺生氣他做的事,說也說不聽,一氣之下我突然就有了想揍他一頓的衝動。但是,那一刻我還保有一部分理智,我很清楚我不能真的動手打他,我不能像我的爸爸打我那樣打小柒,我不能讓自己成為那樣的爸爸,那樣的人。於是,我靠著怒氣中僅存的理智,把他從椅子上抱起來,放在了雙人沙發上。

「放在沙發上」是我給怒氣的出口,但也因為是怒氣與理性的撕扯,放下去那一刻的力量始終還是大了,以至於小柒直到現在還會因為那次「被扔到沙發上」的經歷而害怕。

我說:「小柒,爸爸當時是想保護你的,我不想成為我爸爸那樣。我不想像他拿棍子打我那樣對待你,但那時候我真的控制不住,我不想打你,放到沙發是對你的保護,那時候是爸爸不對,但我真的盡力了。」

我不確定小柒能否理解這些,但那一天,他的呼吸停下來之後,我抱著小柒哭時,他知道那一刻發生了什麼。他抱著我的手臂,拍拍我,點點頭。他沒有說話。但我能感受到,他那麼溫柔,那麼溫暖,這是我所不具備的品質,我很高興。

放學的中學生們
依然熟練地開門鎖門

金黃田野裡的兩輛自行車

如果仔細回憶的話,關於父親的畫面,其實有很多。和我媽相比,他才是那個主內的人;儘管真正主內的人,其實是阿嬤。他其實不那麼像一個照顧全家人的大家長,更像一個年長的大哥,一個依舊生活在老母親保護下的大花公雞。他和我在一起的時間,是母親和我在一起的數十上百倍,但當我想起他時,能立刻回憶起來的畫面,其實只有三個:

小學低年級的某一夜,我高燒不退,他半夜背著我去醫院,我迷迷糊糊間,只能看見歪歪斜斜的路燈和熟悉的門診部,以及他寬厚的背部。這件事我根本記不住任何細節了,但因為後來我寫過一篇關於父親的作文,因此我還多少留有一些記憶的畫面,而此時的所有記憶,其實來自我寫的那篇作文。至於那個晚上,我能回憶起來的只有漆黑的夜和晃動的路燈。

「就這兩個小時了,你們抓緊時間安排吧」

另一件,是一次暴力事件。大概是小學六年級時,某一次我做錯了事,又或者是我對阿嬤說了很過分的話,我不記得了,總之他當時暴怒的樣子嚇到我了,於是我躲進了我的房間,把房門反鎖上,躲起來。他像颱風一樣拍打我的房門,我躲在門後面,非常害怕,直到他一腳踹爆了房門。他反舉著雞毛掃,用棍子那一端抽打我,這種泣不成聲的抽打從我記事起,一直持續到初一。這一次,大概是最後一次,我哭得幾乎昏厥,發不出一點聲音,呼吸困難,是在阿嬤的制止下才結束的。

他本來就不怎麼跟我說話,那次之後,我們之間的話就更少了。

在我的回憶裡,與父親的對話極少。除了高考之後那一次,我在幾個姑丈面前於他爭辯,說我多麼想被關注,甚至故意把日記本擺在桌面上,希望他和媽媽能偷看一下,多瞭解我在想什麼,但你們從不與我談論任何心事。此後,再沒有別的大段對話的回憶了。

可我依然有一段溫暖的畫面,直到今天,也是我確信他愛我的證據之一:

初中時某一個週末的下午,我和他各自騎著自行車,在金黃色的陽光中,穿行在金黃色的稻田之中。那是一條筆直的鄉間柏油馬路,自右下向左上延伸,我們並排著,在又高又直的兩列白樺樹中,並行前進。

選墓地時,偶遇的白貓

其實,在廣東不會有這樣的畫面。真實的場景裡,應該是一連串小片的綠油油的稻田。但也許是那樣的回憶對我來說太珍貴了,於是我的大腦自動美化了那個畫面:一個類似無人機視角的鳥瞰的暖色調的俯拍畫面,一個能救我於水火之中的金黃色的畫面。

難離難捨總有一些,茫茫人生好像荒野

每每想到這個畫面,《單車》的旋律就會響起。

每一夜,守夜點香
爺爺打的桌子

「你就像一棵小樹苗」

可如果我只記得他做得不好的部分,只記得那些傷害我的記憶,那是不公平的。

關於時間的概念,是他通過言傳身教交給我的。關於守時,關於長期的時間觀念,是在一次次他的遵守時間約定之中,在長達數年幫助我收集煙盒、火柴盒、包裝袋當中,緩慢而紮實地建立起來的。我從來不會因為一時三刻的得失而慌張,其實是得益於他的收藏習慣。他收藏紙幣、硬幣、郵票,我跟著收藏各種包裝,都是需要耐心和等待的事情,久而久之,就體會到了時間維度被拉長之後的視野。

我知道時間是連續的綿長的,因此才會有這個博客;綿長而流動的時間會塑造出物件和歷史的輪廓,也會雕刻出一個人的樣子,因此我有嘗試新事物的勇氣與好奇心;漫長的路途中不需要帶走所有東西,紀錄就是最好的篩選,放下我不想帶去未來的記憶,在文字裡刻下我認為是好的內核,通過文章、視頻的紀錄,一點一點塑造未來的自己。

這是我最珍貴的品質,是他帶給我的。

他帶我買高達和四驅車的地方

當他不再用雞毛掃打我的時候,說過一番話:「你就像是一株小樹苗,爸爸不會干涉你怎麼長。只有你長歪的時候,我才會扶一下。但你想長成什麼樣子,是你自己決定的。」

其實我那時就不氣他打我了,但心中還是很害怕,還是有隔閡。

這番話如果放到今天的社交網絡上,一定會有人說這是他在 PUA 我,或者說這是為自己的行為找藉口的洗腦話術。可是,這樣惡毒的揣測,對自己有什麼好處?一個成年人,如果不能判斷什麼是愛,不會分辨一段關係中複雜的構成因素,不知道人事物就是複雜的,那他就枉顧了這一生。

若他在天有靈,會為我感到驕傲嗎?

「你這是灌水」

我原以為,我們的告別會是無聲的,平和的。

在他離開前的兩天,媽媽回家裡去拿一些東西,那個下午,就只有我和他兩個人。我有些無所適從,因為自打離家上大學後,我就幾乎沒有跟他獨處的經驗了。更何況,是他躺在我面前,無法自理的獨處。

我有一些害怕,不是怕他,不是怕照顧他,是怕照顧不好他。

前些年阿嬤走的時候,有一段時間裡,我常常覺得是不是自己害死了她。在那段剛畢業的時光裡,我大概每年會去一趟香港,幫阿嬤買一種心臟病的藥。後來,時不時會看到一些報導或者社交媒體上的說法,說一些藥店會把假藥賣給我們這些內地過去的人,把數量有限的真藥留給本地人。於是,阿嬤後來因為心臟病的藥引發腎臟的問題,進而導致更嚴重的情況直到離世,我都忍不住去想:是不是我買到假藥了?

理智上,我可以寬慰自己說,不是你,不要這樣想。

但情感上,我忍不住,她就是我的天,我做不到。

阿嬤和我打羽毛球的衛生所

所以,那天下午,我爸在那麼虛弱的情況下,從嘴裡擠出一句:“斌斌,你會不會接尿?”我其實有點欣慰和緊張。欣慰在於,我覺得只要還能吃點粥,能排尿,就還不算太糟糕,還有希望;緊張是在於,我媽在這裡照顧他那麼久,都是她處理吃喝拉撒,我還沒嘗試過,萬一我沒做好呢?

但沒有別人,能不能做好我都必須做。

我一個人翻動一米七五的他,幫他翻身;關上門,揭開被子,幫他接尿。我不知道我完成得算不算好,但那天下午,他尿了兩次,每次各兩百毫升,我第一次覺得尿是這樣好的東西。

每次接完,我都會問他要不要喝水,他都說要。第一次餵了四個杯蓋的量,他就不喝了;第二次他一直說沒喝夠,最終喝了七蓋的量。但也是第二次的時候,一方面他的聲音很虛弱,我聽不清他說什麼,另一方面也是有點急,想他多喝一點,所以餵的節奏快了一些。他中途停下來,用一種我很熟悉的抱怨的語氣說了一句:

「你這不是喝水,是灌水。」

我愣了一會兒。

這是他意識還清醒時,對我說的最後一句話。後面兩天,他都再沒有說過話,絕大部分時候都在昏迷和發燒。直到小柒和筱烨趕到,聽見孫子喊他,激動得點了兩下頭,不到十分鐘,我眼見著他呼吸節奏減緩,胸口動靜的幅度減輕,直到一點起伏也沒有了。

最後一句話,是說我沒做好。

我當時是愣住了十來秒,一邊覺得是我著急了,得再慢一點,一邊又不忿,為什麼這時候了還是這樣的語氣?同時又覺得,算了,算了,我不重要。十幾秒內閃過很多念頭,有鞭打的聲音,也有金黃的陽光,最後我吞了一下口水,接著放慢速度,餵了後面兩三杯。

我不知道還能說什麼,只是坐在旁邊,看著他。

後來的某個瞬間,大概是第二次喝水到媽媽回到醫院之間的某個瞬間,他很努力地抬起頭看著我。他只有一隻眼睛睜著,但直直地看著我。我該說些什麼?沒事的,會好的?我說不出來這樣的話,因為醫生已經叫我們抓緊時間安排後事了,我不能騙他。我只能看著他,讓他能看到我也在看他。

那一刻,我感覺他在和我告別。

前一晚,預感不妙而失眠,用 Midjourney 畫的《追風少年》

大家都很喜歡他

他人很好。這是來自驢友們對他的印象。

葬禮那天,除了海南和廣州的親人們,還來了一群平時和他出去玩的驢友們。說起他,大家都是一副熱情、飽滿、聲淚俱下的樣子,彷彿他們才是他的孩子。我多少有點妒忌這幫人,只是一起玩耍吃喝的人而已,為什麼能把眼哭腫?他平時和你們的關係是有多好?

為什麼他把笑臉都給了你們,卻留一張黑臉給我?

我一邊遞過香去,一邊不理解眼前發生的事,很困惑。

在下葬後的屬於我們家庭的聚餐上,三地的親人們在把酒言歡,說著接下來的安排,一杯接一杯的酒,一杯接一杯地對我說著「阿斌啊,以後就靠你了」和「多回來海南啊」這些話。這個場面在爺爺和阿嬤過世時,也是如此,不要悲傷,要歡樂,是這樣的。對面桌上坐著廣南、廣星、阿坤三位叔叔,他們是我爸發小,送殯儀館那晚他們也在,他們在這桌上,是很合理的。但另一桌,整整一桌人,都是驢友,我們總共四桌,他們有一桌。

我很高興他們來送他了,但我還是困惑。

陳剛叔叔跟我爸那麼熟,我零九年初來深圳時,還在他家暫住了一晚,第一間出租屋也是他幫忙安排的。這樣交情的朋友,難過哭泣很好理解,可驢友們跟完了從殯儀館到墓地直到家宴的全程,散席時還在哭。他們流的眼淚,比我為阿嬤、爺爺、我爸流的加起來再乘以一百還要多。你們真的就那麼愛他麼?

我感覺自己被套在了一個真空的試管裡。

情緒到底是消失了,還是我感受不到了?我分辨不了。你們為之哭成淚人的他,最近一次對我笑,是我在手機上給他的遺照修圖時。那是大姑丈從我結婚時的合照中扣出來的。我平靜地、小心地、仔細地處理他臉上的痘印和眼鏡上的反光,調整曲線,以便讓他的臉部的光線更明亮,和背景之間的層次拉得更開。

那張笑臉,永遠定格在相框裡了。

他和阿嬤、爺爺的位置很近

閻羅的判詞

中國人常說,死者為大。

在任何場合裡,似乎離去的人,無論生前如何,悼詞裡都是一些美好的品質。正如那天的那一篇模板,他偉岸,為家庭撐起一片天,照顧好所有的家人,但十殿閻羅的判詞會怎麼寫?我們都不得而知。對我而言,他確實是半個好爸爸。五十年後,小柒會怎麼寫我?我希望至少能做到是 0.6 個好爸爸,至少是 0.51 個。我還不知道我能不能做好,但我會盡力不要留給他什麼遺憾,不會覺得有什麼虧欠和不公。

那晚,跟著鐵床推上山坡時,我媽摔了一跤,胸椎第十節壓縮性骨折,現在在醫院四樓躺著靜養。我感覺自己像一隻風中的打火機,擦不出火,點不著一根香。

十多年前的一隻籤裡說,我,六親無靠,大器晚成。

守夜後佈滿血絲的眼睛
用 Midjourney 畫的新壁紙

可我只希望:

跳出三界外,不在五行中。

镜头的变幻就是故事|Midjourney V5.2 Zoomout 测试

➡阅读更多 AIGC 相关内容

最近一直都非常忙,所以连续 20 来天都没有碰过 Midjourney 了。前两天在社交媒体上看到,新推出的 V5.2 中有一个向外扩写的功能,因为此前已经在 PS+SD 的组合中见过这类拓展画面的应用思路,所以很想看看 MJ 的 Zoomout 能做出什么样的东西来。趁着端午假期这个空档,我集中跑了几波测试,有一些小小的心得,在此记录一下。

总体结论有三个:

1、Zoomout 可以无限次数地向外扩展,但随着镜头的拉远,Midjourney 自身的联想能力并不足以做出任何有意思的画面,不刻意控制地放大出来的画面,到了第 3~5 步之后,就会明显变得乏味和缺乏美感。

2、通过刻意地控制画幅比例、扩张倍数,以及针对性地调整 prompt 的描述,可以利用这个功能讲出有意思的故事。关键在于,使用者对于「镜头语言」的理解,以及对运镜和故事之间联系的掌控程度。

3、对工业设计的辅助甚微,做点「花活儿」可以,一旦涉及到逻辑,依旧不行。

Zoomout 功能的主交互界面

测试内容目录:

1、通过默认的 Zoomout X2 按钮连续放大 3 次

2、通过默认的 Zoomout X2 按钮连续放大 15 次

3、通过自定义 Zoomout 微调构图

4、通过自定义 Zoomout 构建人物画像

5、通过自定义 Zoomout 构建人物性格

6、通过自定义 Zoomout 完善场景氛围

7、在 niji 中应用自定义 Zoomout 构建人物和场景

8、自定义 Zoomout 构建情绪与故事

9、通过焦点变化构建故事的场景

10、通过镜头变化,构建故事的起承转合

以下为部分测试过程记录:

test case no.1:通过默认的 Zoomout X2 按钮连续放大 3 次

⬆ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 3 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:在奔跑的场景中增加了后方的人,有一点点故事性,但继续放大后会明显失焦,花面焦点始终在最开始的小女孩身上,继续放大生成的场景和人物都是模糊的。

test case no.2:通过默认的 Zoomout X2 按钮连续放大 15 次

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 15 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:外围拓展的场景越宏大,有效信息和故事性就越低,除了在阴影中无意间冒出的人影,没有任何惊喜和意料之外,拓展的画面也很单调乏味。

test case no.3:通过自定义 Zoomout 微调构图

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:不对 prompt 进行修改,按 1.1 和 1.2 的拓展比例小幅度调整画幅。

输出成果: 初始图像是近景特写,根据图像本身的特点,对画幅进行小幅度地微调来获得完整的全景镜头,以及合适的构图比例。

test case no.4:通过自定义 Zoomout 构建人物画像

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个黄色漩涡图案,然后拓展时改写 prompt 为一只眼睛,进而生成一个带特征的面部局部画面,再次拓展时修改描述词为一个洞穴中的原始部落男性。

输出成果: 成功构建了一个有目标特征「黄色漩涡瞳孔」的男性角色,通过控制拓展比例以达到最终效果—-人物整体和局部特征均得以完整呈现的画面。

test case no.5:通过自定义 Zoomout 构建人物性格

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个红色皮夹克的女性胸像,再改写 prompt 获得其坐在摩托车上的局部画面,再改写画幅比例获得完整的人物与车辆的全景照。

输出成果: 成功构建了一个有目标特征「红色皮衣+摩托车」的女性角色,通过控制拓展比例以达到最终效果—-人物细节和整体氛均衡的画面。

test case no.6:通过自定义 Zoomout 完善场景氛围

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:在初次生成的几批图像中,选择合适的画风和画面主体,再根据已有画面特征修改画幅比例。

输出成果: 在选定风格和主体后,将竖幅主体拓展为气势更足的全景影像。关键是拓展比例并非默认的 2 倍或 1.5 倍,而是根据实际需求来控制比例,同时也需要关注怎样的画幅比例可以传达对应的氛围。最终图像画幅比例是 3:1,适合展现有足够细节的宽幅场景。

test case no.7:在 niji 中应用自定义 Zoomout 构建人物和场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、使用 niji 5 的 style original 生成一个细节丰富的初始人物;

step 2、以 1.2 的 Zoomout 比例纵向拓展出人物的半身画像,画幅比例是 1:2;

step 3、以 1.1 的 Zoomout 比例和 2:1 的画幅比例重构画面,得到外围场景;

step 4、以 1.2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成人物全身像;

step 5、改写 prompt 添加「宫殿」关键词,以 1.65 的 Zoomout 比例和 3:2 的画幅比例重构画面,生成人物在场景中的全景画面。

输出成果: 虽然人物细节和场景氛围的融合程度还不错,但因为漫画角色的细节较多,在多次 Zoomout 的过程中,场景的丰富会逐渐抢掉中心人物的视觉焦点。因此在每一次修改画幅比例与关键词的时候,需要多加注意对视觉元素的控制。

test case no.8:自定义 Zoomout 构建情绪与故事

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个情绪和神情符合目标的初始人物;

step 2、改写 prompt 同时添加「马」关键词,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成后续画面的基础,此时需要注意人物与马的位置关系,否则后续生成的画面会非常扭曲怪异;

step 3、以 1.05 的 Zoomout 比例和 2:1 的画幅比例重构画面,生成完整的马匹造型与部份环境信息;

step 4、对比改写 prompt 产生的变化,黑发组不改描述词,以 1.1 的 Zoomout 比例和 3:4 的画幅比例重构画面;白发组添加「巨大镜子」关键词,以 1.6 的 Zoomout 比例和 3:4 的画幅比例重构画面。

输出成果:通过控制 Zoomout 的幅度、画幅比例和 prompt 的调整,可以生成指定场景的画面,且人物的神态到位、情绪饱满,整体画面焦点清晰。但美中不足是,构图不够自由。

test case no.9:通过焦点变化构建故事的场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个在河岸上的粽子;

step 2、修改 prompt 为「熊宝宝正准备吃粽子」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面;

step 3、修改 prompt 为「小熊一家在野餐」,以 1.2 的 Zoomout 比例和 4:3 的画幅比例重构画面。

输出成果:通过对 prompt 的修改,控制 Zoomout 的幅度、画幅比例,可以改变画面中的焦点和表达主题,适合不同文化元素之间的混搭。

test case no.10:通过镜头变化,构建故事的起承转合

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一幅鲜花山谷的画面,人物要明显;

step 2、修改 prompt 为「一面巨大的镜子在草地上」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,此处竖构图是为了生成较高的全身落地镜;

step 3、修改 prompt 为「少女站在镜子前」,以 1.5 的 Zoomout 比例和 3:2 的画幅比例重构画面,改为横构图是为了囊括少女全身以及环境信息。

输出成果:通过改变画面中的焦点和增加元素,在镜头逐渐拉远的过程中,故事缓缓托出。

➡阅读更多 AIGC 相关内容


我的整体感受是:

通过 Midjourney V5.2 的 Zoomout 无限拓展,一次次修改画幅比例、提示词内容,可以用镜头语言的变化来讲故事了,也可以基于一些初始的「点子」延展成有意思的融合作品。但越是这样,越发显得对话式、指令式的交互界面( SD 那种也不算图形交互 )的局限太大了,我很希望今年之内能发展出图形交互界面。

没错,今年 AI 的爆发指向了一个新的趋势:对话式交互界面。但人类之所以发明绘画,开始通过设计图来制作各式各样的新工具,恰恰就是因为语言本身的效率太低。这个逻辑其实也可以从媒体形态上找到端倪:文字–> 图像–> 视频。仅仅依靠对话,我们无法构建出一个一把剪刀;仅仅通过语言表达的播客,也无法传达任何需要视觉才可以精准理解的信息。对话指令的交互界面与图形交互界面之间的关系,并非只是 dos 和 windows 之间的差异,更重要的点在于,后者可以更直观地完成交互,以及精准地进行创作行为。AIGC 的重点不仅仅只是 AI,而是我们如何使用 AI 进行「Generative Content」。

我说一句话,AI 给我一个东西,这不是创作。

创作是一个生命在主观意志的驱使下,刻意的、有目的地表达其心中所想。

因为 GPT 的爆发而说对话式交互是未来,这样的断言是过于冲动的。只要是一个严肃的创作者,就会立刻意识到,真正的创作一定需要多纬度的交互界面。这其中不仅仅包含对话指令,同样更需要图形界面以及在数字虚拟空间中的三维交互。AIGC 工具与 PS、表格、PPT、思维导图等已有工具的结合,就是这类多维交互的雏形。

那一刻,我们不会等太久。

➡阅读更多 AIGC 相关内容

你的投票会让 Midjourney 更懂你

Midjourney 今早更新了测试版 Personalization (–p) 的新功能,通过你在 Ranking 中投票的选择来提供个性化的输出。

我用之前的 prompt 测试了一下:

第一张图是之前制作的,后面三张是用同样的 prompt 加上 –p 之后出的图。

对比之下可以看到,个人喜好对风格的影响非常明显。

但是这个功能还在处于测试阶段,局部修整的功能还无法使用。

偏见和缺陷是创作的灵药:人类和 Ai 有什么区别_3.ylog

无论你对 Ai 秉持怎样的态度和观点,都希望这期节目能给你带去一些思维激荡的时刻。作为工业设计师,我认为,如果不时常忏悔,不为自己做的东西(无论是否在自己的意志下,通常都不在)对这个世界造成的影响抱有歉意,这样的人很容易成为误以为自己是夜神月的弥海砂。

这是一期需要配图食用的播客,从近期一组以「戏剧感」为创作目标的十二生肖聊起,关于 Ai 创作的评价和人类作品之间的区别,谈到如何在这个 AIGC 爆发的时代下找到自己的位置。

创作者的骄傲和创作者的骄傲,是南辕北辙的两件事。

在这一期,你会听到:

—— 什么样的作品是有「人味儿」的?

——「偏见」和「缺陷」是艺术创作的灵药?

—— 为什么 Ai 会在创作领域疯狂爆发?

—— 现当代艺术常被人诟病的原因之一:抽象

—— 细节!什么是令人信服的细节?

—— 这些 Ai 正在拓宽我的眼界;

—— 人不能创造出自己从未见过的东西,吗?

—— 设计不是天马行空地想象,它是一种「劳作」;

—— 超人的诞生;

—— 超人的洞察和创新,与人类无关;

—— 能耗、模型与错觉;

—— 涌现、艺术与创新;

—— 马车夫的工作经验如何平移到汽车司机?

—— 选择 AIGC 工具的基本思路;

—— 向藻类致敬!

|相关图片|

—- 十二生肖系列中的兔、马、猴,完整图集和介绍 见链接

—-《城堡下的人群》(参考马列维奇的风格)

—- 毫无表达意图的随手测试图

—- 似是而非的剃须刀设计图

—- 汽车设计草图的测试

|相关阅读|

—- 十二生肖·Midjourney·戏剧角色设计

—- 描觀念 繪感受|超微型 AI 觀念畫展

—- 艺术可以糊弄,体力劳作也是高级智能

—- 表达的精度就是人类外延的尺度

—- 镜头的变幻就是故事

|登场人物|

苏志斌:工业设计师,智能硬件产品经理,《设以观复》作者

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

💾

一些日常生活中的杠铃策略

「杠铃策略」是一种投资思路,它主张同时投资高风险高收益和低风险低收益的项目,避免那些不上不下的中等投资类项目,通过这样的组合来实现收益的平衡与稳健增长。它鼓励我们一边冒险一边保守,以下是这种策略,应用在日常生活中的例子:

☕ 不要每天早上都喝咖啡,这会让你过度依赖咖啡因,长期处于高兴奋状态会影响效率。应该避免平时一直喝咖啡,留到周末尽情喝,用它把有趣的事情变得更有趣。

📖 不要读那些含糊不清的科学书籍,而是读纯粹好玩的书(比如奇幻、科幻、漫画等)或者真正深入的科学书籍(教科书和综述论文)。

🧑‍🤝‍🧑 不要总交一些「还行」的朋友,而是通过聚会和互联网快速结识成百上千的人,然后找出一小群或几个跟你非常合得来的人,经常见面或聊天。

💻 不要一边写文章一边修改,这样太累了。可以一天写五六篇随笔,随时记录想法,然后在一周内逐渐合并修改成一篇好文章。这样,你的创作冲动就不会被心中的批评家扼杀,同时你内心的批评家也能确保你的写作质量。

💼 别用业余时间做些无聊的项目,尝试一段时间内同时做几份工作,然后用赚的钱去实现一些大胆的计划,比如创业、成为独立研究员等。

🧘 别只是每天用零碎时间冥想,不如每年集中花十天冥想,这样会更快地提升心灵,其他时间尽管随意生活。

📱 不要只是在上厕所的时候随手刷刷交友软件,不如花一个周末好好完善你的资料,然后尽可能多地和不同的人交流,这样你就有更多的可能性找到合适的伴侣。

📚 不要每天都读一章书,而是每几个月花两三周时间集中阅读,那时你可以一天读一本,然后用空闲时间思考书中的内容,把它们串联起来,这样收获会更多。

💬 也别每周读一本书,而是多花点时间写书评,阐释它的主要观点,思考书中的内容,试图与作者的思想进行辩论。通过查找有关主题的更多信息,来丰富自己的知识与思考。

源一:Examples of barbell strategies

源二:Barbell Investment Strategy

配图:SUiTHiNK by Midjourney

翻译:ChatGPT 3.5

润色:SUiTHiNK

让 MJ 学我画两张小画儿

昨晚吃饭前跟儿子一起画画,我随便画了一下我们在 Minecarft 里的第二个家,和随便画的一个岩浆包围的高堡:

后来想说看看 Midjourney 能模仿成怎么程度,就丢进去试了一下:

emmm,画得还行……

就是画风不太相关,它有它的训练痕迹,哈哈哈哈哈哈哈~

测试所使用的 prompt:

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

艺术可以糊弄,体力劳作也是高级智能

昨天发现 AAAny 更新了发图的功能,于是就顺势发起了一个讨论 AIGC 的话题

轶轩在话题下问我为什么对外发表的图都是一些细节比较丰富的类型,是否有基于 AIGC 的生成方式而做的一些突破方向的尝试。我觉得,针对这个问题,我可以在对他的回复上,再做一期视频来谈一谈我的观点。

用于风格参考的马列维奇的画作
基于马列维奇而生成的《城堡下的人群》

但与此同时,我也想做一些「简练」或「抽象」的图来辅助说明我的看法。于是,今天在工作之余,用一些碎片时间,做了一些图出来。

对此,我尝试比较随意地做了一些「东西」。它们都没有什么明确的「表达」,仅仅只是我随手写的一些 prompt,或者就是在 Midjourney 的社区里复制修改的 prompt,最终出来的东西都是一眼看上去有一些「意境」或者没那么精致细节的但表现比较能唬住人的图像。

你会发现,在这些人类认为偏「抽象」的表达上,AI 反而是比较容易做「好」的。

但是,这种好不是真的好,只是这些风格上,并不需要对细节有很认真的考据,在表现层面上是非常容易「糊弄」的。

这也是现当代艺术作品常常被人诟病的原因之一,因为那些作品浓缩了大量的思考和抽象提炼,但表现形式上,其实并没有比传统艺术更复杂,或更需要技艺和体力上的付出。也就是说,作为当代艺术最核心的「观念」,在完全不需要理解的情况下,一个外行的人或者一个数据量管够的 AI 就可以模仿出「看上去像那么回事」的东西。这种模棱两可的状态,恰恰是江湖神棍和 AIGC 擅长处理的对象。

这里说的「糊弄」「神棍」并非贬义,而是借着世俗的话语体系来表达,这样的「生成作品」并不需要 AI 具备「意识」和「创意」也可以轻松地实现。

那么,什么东西是更难的呢?

细节,是令人信服的细节。

这些是我用 AI 生成的男士剃须刀的设计方案。

你会发现,这些方案咋一看是那么回事,但只要你多看两秒,立刻就会意识到它不对。它们的空间关系、形态的处理、物理交互的关系、电子器件的布局,通通都有很大的问题。这些就是不可信的细节。

因为 AI 实际上并不理解它学习的那些图像。

这些令人信服的关键点,是无法糊弄的。因为它们当中包含了大量精确的思考和训练,也包含了海量的脑力和体力劳动,如果一个「智能体」不理解一个图像背后的复杂逻辑,那么它就没有办法真正地创作出这个对象。它只能模仿,只要模仿得足够像,就可以唬住外行。但是对于以此为生的从业者,这样的智能工具,还不足以成为生产力。设计师可以用这样的工具拓展自己的思维,但这些过程并不能替代设计行为。

从创意到落地,中间还有漫长的路需要人类设计师去走完。

现阶段,更适合工业设计使用 AIGC 的方式是这样:

我的意思并不是让 AI 画手绘图,这仅仅是一种表现方式。但是,这是一种不需要追求精确的表达方式,很适合 AI 用「抽卡」的方式来快速堆想法。除了这种,当然也可以让它生成上面剃须刀那样的图,但同样的,目的不在于出方案,而是借助 AI 的海量数据库,快速地堆出一批发散性思维的「胡编乱造」的混杂图像来。

人类的视野有限,但 AI 看得一定比人类个体的平均值多。

工业设计不是天马行空地想象,它是一种「劳作」。

从初期的构思,从草图推延到模型和效果图,再从设计方案导入结构设计和工艺、制程,这意味着工业设计不是一项纯脑力劳动,不是一种只运行在计算机里的行为。它包含的体力劳作同样是设计的一部份,甚至可以说,是更关键的那部份。这种体力劳作,不仅仅是肌肉和工具的配合,更是人脑对环境、事件、社会群体、物质的反应和处理,设计师的动作意味着这个人对世界的认知。这种程度的认知,对于只运行在计算机内,仍然缺少复杂的传感器和理解过程的 AI 而言,暂时还是无法实现的。

我当然相信它未来会具备这样的能力,但是在目前的技术条件下,依然需要大量的人类来完成这些真正代表了「智能」的「体力劳作」。

欢迎加入我们的讨论:

https://aaany.app/aaa/ltwu3txza

想注册体验 AAAny 的话,请给我留言

我会给你留言的邮箱发送注册邀请码

十二生肖 · Midjourney · 戏剧角色设计

在网上看过很多人用 AI 画十二生肖主题的系列画,但大多数我都觉得太套路了,要么只是生成一只动物,要么是套上一些所谓的古风服装,强行「国风」一把。我觉得,既然工具本身已经有很强的生成能力了,那么,创作者就应该更多地表达观念。没有观念的全自动生成出来的东西,再好看,也是大同小异、千篇一律。这种现象,最典型的就是那些长着网红脸的 AI 美女图。好看,但无味,因为缺少人味儿。

人味儿来自什么?最重要的两个点是:有缺陷,有观念

缺陷是因为人的不完美,不能样样都要,那么就得有取舍,而取舍的依据是什么呢?那就是观念。观念和审美,本质上是我们经年累月的经历中,所积累下来的看待世界的偏见。这里说的「偏见」不是贬义词,而是在说,人无法客观,而观念与审美就是在主观中沉淀下来一系列判断依据。我们就是用这样的依据来取舍,这些选择就形成了创作的结果。

即便是回溯到人类此前的所有历史中,艺术家们的创作,也是基于自己的「偏见」来选择创作的工具、技艺、载体和题材的。没有偏见,就没有作品。

因此,我想尝试创作一套有「戏剧感」的十二生肖。

戏剧感,一方面来自这些生肖不能只是动物,或者套了动物头套的人,而是得有个性与故事的角色,角色的人物小传可以从它们的神情、服饰、妆容等呈现出来;另一方面,需要一定的冲突感,这里说的不是观念不同的冲突,而是来自文化和故事背景中,衍生出来的角色的生命力,它会把你带入到某种场景里,它们的妆容和服饰或许不是那么常规、习以为常的文化惯性中的表达,但它们在场景和故事中,是合理的。

以下就是我的创作尝试:

如果你喜欢,可以自行下载原图。

如果你要转载,或者二次创作,请附上这篇 blog 的链接:suithink.me/?p=11457

我大致分享一下,这十二个角色的构思吧。

【鼠牛虎】这一组,是想把【生肖】与【西服】做一个融合,但我希望它们有更多的变化和区别,就分别在色彩、气质上做一些差异化描述。最后出来的三个角色,能感觉到是来自同一出剧的人物,饱受欺凌的鼠,正直优雅的牛、权势凌人的虎,故事就由此可以展开了。

【兔】通常是软弱和被欺负的对象。我希望创作一只勇敢、独立的兔小姐,于是让她走在一个昏暗的街道里,身着红色皮夹克,眼神坚定地朝着镜头。在很多文化意象中,兔子、皮衣和地下文化的组合,是谄媚的,是挑逗的,或者是色情和暴力的。但我不希望是这样,我想她可以是地下世界的英雄。她是这个系列中的第一位女性角色。

【龙】在中国的文化里,高高在上的霸权。于是我想,首先在颜色上我就不要那种红黄黑的东西,我不要皇权和武力的表达,我要它是个君子。作为君子的龙,需要同时具备威严和素雅。威严在于其妆容造型和气质眼神,素雅在于整体的色彩倾向和服饰风格。所以,这头金龙虽然相貌霸气,但眼神柔和坚定,白发之下是金线白袍,不怒自威。

【蛇】是邪恶的,多数文化中,它们都是这样的形象。这是第二位女性,我希望赋予她高雅的气质,和中立的角色身份。她在诸国纷争中,不倾向任何一方。但保持中立,需要的不仅仅是态度,也需要武力和经济。所以,她应该是一位既有贵气又有智慧的女性领主。在她紫色的服饰之中,使用了羽毛的元素,与蛇类那种光滑、阴暗的视觉元素做一点调和。

【马羊猴】这一组是相对现代的角色。【马】通常是黑色或褐色的,虽然也有白马,但在印象中,说起马就是黑色的动物。所以我想给她穿一身干练的白色风衣,即符合马这种动物在人类文化中的形象,又能在色彩搭配上突出她的质感。值得一提的是,我选择了一个侧面的视角,因为马的轮廓,侧面是最美的;并且,我在 prompt 中加入了长辫的描述,黑色布料的造型很妙,因此这个角色是目前没在网上出现过的全新的马人形象。她也是这组当中的第三位女性。【羊】的种类实在是多,不同种类的羊,出来的气质也都不太一样。经过不同的组合尝试,我最终选择了 Goat 这种羊。我想要一个有点脾气和痞气的大叔,他平时就坐在街道头的店铺门外,跟老板聊天,街上一旦出了什么事情,他一定会出手。因此,他的皮衣和眼镜都是有点讲究的。不过你看得出来,他并不是那种有钱人,他的讲究是一种对待自我的态度。

【猴】很特别,一方面是猴的种类也很多,另一方面是,猴子在绝大多数文化中都是活泼闹腾的男性形象。我非要她是女性,但她不会是个乖训的家伙。最后我之所以觉得,滇金丝猴是一个很合适的选择,在于它的毛色和毛发的形态,橙色到白色的过度让角色有一种温和的基调,但向外肆意张开的样子又很有流浪不羁的气质。服饰上我选了裙子和围巾。但在色彩上我动了一点心思,暖色系的猴和皮衣加长裙,得有一些色彩上的对冲,来建立她的个性和态度。因此,围巾是绿色的,也有相当的体量感。

【鸡狗猪】中的【鸡】是在【骄傲大公鸡】的基础上的进一步表达。首先,鸡的种类很多,但白色羽毛的,通常是 white Plymouth Rock。为了增加戏剧冲突,我希望他穿着镶满了珠宝的绿色三件套西装。神气,就是要神气!【狗】就更多种类了,我最开始也尝试了不同的品种,因为拿不准什么样的形象是更合适的。后来我意识到,不同的狗,它们自身的气质差别就很大,所以不存在一种狗能表达狗这件事。于是,重点就变成了,我想要表达什么,那就选择什么狗。我希望这是第五位女性。恰好,筱烨以前的 Daisy 就是一只金毛,一个可爱热情受街坊邻里欢迎的小女孩。那就金毛寻回犬吧!在这个设定的基础上,我增加了双麻花辫和白色校服的描述,最后就有了这个金毛小女孩。

最后的【猪】我有两个想法,一个是十二生肖中男女比例对半开,所以我希望她是女生;另一个是,我想她可以非现实一些。前面的十一位都是比较写实的感觉,但写实的猪,和女性结合,在观感上,很容易让人产品某些厌女、性别对立的联想。我不希望这位可爱的女性角色被贬损。于是,我给她增加了金色皮毛质感的设定,穿上温暖的粉红色外套,带着白围巾站在雪地里。这是一位温柔的女性,但她的防风镜会告诉你,她可不是傻白甜,在雪天的山里行走,缺少她的交通工具,哪怕是楼上的虎先生,也寸步难行。温柔也是有力量的。

下载高清原图:                      

這夜風正涼 𝄇 就用五首詩與本命年訣別吧!No.73

我用這條影片回顧了 2023 年裡,對我而言最重要的四件事:

上海三日、父親離世、我的手術、香港四日

但很多感受我沒辦法通過影像或者散文式的語言來表達,它們很複雜,也只有我自己最清楚它們意味著什麼。於是,我寫了五首詩。這些詩都是我的感受和處境。它們或許很難為外人所理解,但如今的我已經清晰地認識到,人和人之間難以真的互相理解,尤其是那些並未參與你人生的人們,因此,並非所有表達都需要被理解,能按照自己的內心,袒露出來,就可以了。對於詩歌而言,我並不追求共鳴。

🎥 播放地址:

B站 https://www.bilibili.com/video/BV1KB421r7xs/

YouTube https://youtu.be/9RnACKm4XhU

這張封面雖然用在了上一篇 blog 中,但其實它本來就是為了給這條視頻做封面,而特意構思出來,在 Midjourney 裡畫的。它所呈現的,是一個被凍在了湖面下的香蕉,一個青澀的香蕉。我站在湖面上,低頭看著湖面,看著它,就像看著自己的處境。

本影片中,亦採用 AI 繪圖工具 Midjourney 製作了 23 張圖像,用於詩和情緒的表達。

第一章:你在橋上看風景

從膠片到數碼,從卡片機到手機,給真實世界切片的權力來到了每一個人手裡。一些人、一些事在和你接觸的過程中,在你的心裡激起了一些漣漪,那一刻的化學反應促使你舉起手機,拍下一些照片和視頻,這存在過但不再存在的一刻,因你而活了下來。

第二章:離去的少年

人與人的關係,是相處出來的。愛、恨、執、怨,皆為充實;唯獨空白,無法驅除。

因緣果報,你無法言說;潺潺流言,你只得不響。

第三章:陌生的天花板

這是你三十六年來第一次住院,也是頭一回做手術。

一棵巨大的樹從天花板上破頂而出,它白色的樹根粗壯有力,厚實的樹根一根根張開,盤踞在一張鋪著綠色床單的、平整的金屬架子床上。你看過一些跟手術相關的畫面,也設計過一些醫療器械,但這個巨大、結實的純白結構直接展現在你的眼前時,你還是受到了一點震撼。醫生、護士、病患,在這個空間里,你只能感受到「問題」和「方案」。性別不是一種凝視關係下的身份,是執行方案過程的所面對的「客觀結構」。

第四章:機翼在反光

朋友們今年都陸續在做出一些轉變:有人結束了設計公司的業務,投身於產品和品牌;有人離開了自己的藝術教育行業,主動擁抱自己的內心;有人帶著相機,一頭扎進了藍色的大海裡。

每人都有一個時機,它到來時,上天會告訴你。

🎥 播放地址:

B站 https://www.bilibili.com/video/BV1KB421r7xs/

YouTube https://youtu.be/9RnACKm4XhU

影片編號:Vlog No.73

表达的精度就是人类外延的尺度|Midjourney 
V6 Alpha 自然语言生图测试

Midjourney V6 的质感和细节,真的是飞跃式的成长!

和今年三月相比,已经完全脱胎换骨了。对自然语言的理解和再表达,也已经在渐渐脱离「咒语」的局限,结合 ChatGPT 的语言转译,一个人能够用母语把尚不明确的观念表达清晰,愈发显得重要。

点击图片,可查看原始尺寸高清大图:

当 AI 越来越擅长理解人类的自然语言,我们就愈发迫切地要掌握「用语言表达思想」这件事情。

因为语言的精度和颗粒度,将会在人类与 AI 的相处、合作中,展现出人类智力的上限所在,以及外延的纵深能够得着多远。

Upscale from Variations
Upscale(Subtle)
Upscale from Variations
Upscale(Subtle)
Upscaled (Subtle)
Upscaled (Creative)
Upscaled (Subtle)
Upscaled (Creative)
–Style 50
–Style 100
–Style 250
–Style 750
–Style 1000

2025 款 五菱星跃 Safari EV 四驱四座

点击可查看大图

这是一个玩笑。

这其实是我使用 Midjourney 画的一款概念车。初始的构思是,一款小型电动越野车,比一般的 K-Car 稍微大一些,但得有越野车的强壮感,同时要贴合当代审美的流畅线条。

为了测试大家对它的反应,我把五菱的标志合成到了我最终在 MJ 上输出的图上,并虚构了这个型号,没有任何多余解释,直接发出来。我会观察一阵子,看看会发生什么。

在这张图里,我所使用的描述词:

正在行驶在路上的四轮微型车,小巧的车身,简洁和硬朗的造型,硬朗和锋利的车灯造型,黄色车身,光洁的表面,流畅的曲线,越野设计风格,背景是黑色的玄武岩山脉,3D模型,虚幻引擎渲染

prompt:

Four-wheeled miniature car driving on the road, compact body, clean and hard styling, hard and sharp lamps styling, yellow body, glossy surfaces, smooth curves, off-road design style, black basalt mountain range in the background, 3D model, Unreal engine rendering

用 MJ 画一辆车非常简单,但想要看上去能骗到人,还是得在细节上多做调整。所以我除了调整描述词外,最主要的尝试,是不断用 Vary(Region) 这个功能来调整局部,以使其达到我想要的效果。包括但不限于车身轮廓、车灯造型、C柱与尾部的衔接、防护栏造型与车身的衔接、轮毂、远山等。

同时也保留了一些 bug,来确保有人可以发现其非真实性,例如被我抹掉的 A 柱和门把手,被抹掉的前舱盖的缝之类的。

以下是未经处理的大尺寸原图:

文件体积:25.7 MB

你可以拿去玩,把你喜欢的或你认为适合的品牌标识合成上去,拿到任何地方发表,不需要经过我同意。祝你玩得开心!

❌