Reading view

There are new articles available, click to refresh the page.

走进中国美术学院，我发现原来大家都在用「天生会画」

爱范儿

谢东成

8 November 2024 at 22:44

岩彩绘画，是一种传统的中国绘画技法。它已有上千年的传承历史，在融合传统国画技法的同时，需要用到天然矿物颜料（即岩彩）来进行创作。

与国画丹青的获取方式有些不同，岩彩是需要过研磨天然矿石、矿物质或土壤，并用水或胶质等媒介加以调和才能得到最终的颜料。

正因颜料来之不易，成本颇高，所以岩彩绘画相对于水墨画、工笔画等常见的中国画种来说，知名度比较有限，直至近些年才逐渐走进大众视野。而在这个过程中，得益于数字创作的科技发展，丰富了岩彩绘画的创作技法，也提升了创作的灵活度。

来自文化和旅游部艺术发展中心的莲羊，正是一名岩彩绘画的创作者，她在 2024 华为 GoPaint 天生会画艺术对谈活动的现场与我们分享了她利用「天生会画」app 呈现传统岩彩画的经历。

莲羊认为，华为天生会画 app 的出现，让她的创作方式变得更加多元，可以打破打破了时间、地点和介质的局限。尤其是在「天生会画」中可以将传统岩彩画进行数字化呈现，让原本依赖于矿物颜料的创作，能通过天生会画的岩彩画布直接呈现，极难萃取的岩彩颜料也能通过智慧取色功能轻松上色，还原中国古色。

众所周知，岩彩绘画的颜料是矿物，成本很高，岩彩画不能像其他画种那样反复修改，所以我一般会借助平板和软件先画草图再进行矿物颜料采购、线下实体创作，以此避免创作的损耗。

岩彩绘画作品的特别之处，在于其色彩表达具有较强的光泽感和自然饱和度，能够在画面上产生更加独特的效果。正如莲羊的岩彩作品《龙》，是专门去到河南博物院实地参观拍摄千年文物后，才汲取到的灵感。并从文物身上选定了一抹「中国红」。

取色的过程至今记忆犹新，我们利用现场拍摄文物，再用华为平板跨应用取色了文物上的千年古色，以中国传统颜色演绎龙的奇幻与神秘。为传统文化的研究、创作及修复工作提供了极大的便利。

可见，数字艺术的发展催生了不少称手易用的智慧工具，能够让人类创造力的释放变得更加事半功倍。

相较于早期的创作工具，诸如「天生会画」这般由 AI 和新技术加持的工具大幅降低了用户入门的学习成本，让美的发现与创造不再是少数人的特权，而是变成每个人都能轻松触及的日常。

为了让更多的创作者能够直观地感受到「天生会画」app 的魅力，华为携手中国电影美术学会、中国动画学会、8 大美院联合打造了「2024 GoPaint 天生会画数字创作大赛」。

这个大赛号召全球参赛者通过华为平板和天生会画 App 进行创作，参赛作品审核通过后将有机会进入评选环节，大赛将最终评选出 36 幅优秀作品，并给予获奖者丰厚奖金和荣誉证书，加上大赛本身较高的关注度，为参赛者的绘画创作道路增添更多的助力。

在投稿尚未截止，且赛时过半之际，华为于 11 月 5 日在中国美术学院良渚校区举办了「2024 华为 GoPaint 天生会画艺术对谈活动」，与多位重量级专家及行业代表，共同探讨了数字艺术的发展趋势。

中国电影美术学会会长霍廷霄认为天生会画能够降低创作门槛，让更多的人参与到创作中来：

「天生会画」这种数字化创作工具会使设计创作更加便捷快速，极大提高创作效率，我们应拥抱这种技术。无论是专业人士还是普通人，都可以通过这种便捷工具，拥有属于自己的造梦空间。

像是在华为发布会上，华为消费者业务 CEO 何刚现场展示了他用华为 MatePad Pro 13.2 英寸和 HUAWEI M-Pencil（第三代）星闪手写笔在「天生会画」app 中完成的油画，更重要的是，他整个绘画过程只花了短短 10 分钟。

当然，华为的「天生会画」app 不但为成年人准备了释放创意的舞台，更是能够成为激发小朋友想象力与创造力的「启蒙老师」。例如年仅 6 岁的小绘画家罗伊人便以其过人的天赋，通过天生会画 App 创作出了一幅幅充满童趣、富有想象力的画作，让人不禁为她的创意与才华所折服。

中国美术学院中国画学院副院长韩璐认为，数字绘画其实就是中国传统绘画的一种延伸，是工具和思维的延伸。

我相信，科艺融合会是种大趋势。

中国美术学院工业设计学院副院长武奕陈对此也深有感触，平板已经成为学生们日常的创作生产力工具：

无论是影视动画、建筑，还是工业设计、服装设计、视觉传达设计，所有专业都非常深入使用了数字创作技术，平板作为生产力工具效率非常高，它成了学生平时练习创作的常用工具。

而「天生会画」软件的设计非常符合创作者的绘画逻辑和用户行为，有利于艺术教育和艺术传播，这在文化传承中也具有很大的价值。

事实上，「天生会画」app 在诸多细节层面都考虑到以往在进行数字创作时会遇到的痛点，力求降低交互和学习门槛，同时也用更加专业高效的表现来回应多元化的创作需求。

例如打开 app 之后的第一步往往需要创建一个画布，「天生会画」app 除了有不同比例的选择之外，还内置了多种画布纹理，包括了油画、水墨、粗纹水彩、细纹水彩等。每种纹理都尽可能还原了真实纸张的材质、纹理和光泽度，同时画布的纹理等参数支持多项调节，让用户创作时可以更加沉浸，也为作品带来纸张特有的质感。

这一点，相较于 Procreate 需要用户四处搜寻高清纹理图片，再自行导入图片的繁琐操作，「天生会画」app 显然要便捷得多。

在笔刷方面，「天生会画」app 内置了超过 100 种不同的笔刷效果，还为用户提供了超过 70 种的详细参数设置，包括笔刷的线条、颗粒、渲染、湿混等参数，灵活多变，精细可控，从而能够在数字软件之上还原如同真实世界般的笔触效果。

与此同时，华为还与中国美术学院专业团队合作，推出了一批经过精心调校的专业笔刷，覆盖油画、水墨、水彩等多种绘画风格，带来了更为真实细腻的绘画体验，在数字画板上也能肆意挥洒国画丹青的水墨灵感。

作为绘画软件的关键功能，「天生绘画」app 对于图层管理也有着自家的「独门秘方」，它搭载了华为自研的方天绘画引擎，通过软硬芯整合的架构创新，可以大幅优化性能负载，提升处理效率和交互表现。

例如华为 MatePad Pro 13.2 英寸（16GB）在 2K 分辨率下最高支持创建 532 个图层，比相近尺寸 iPad 上的 Procreate 图层数要多出 17%，能应付更复杂的画作创作。

有了得心应手的创作工具，艺术创作也变得比以往任何时候都更加高效与可靠。在「科艺融合」的加持下，有望能够让更多的人能够轻松地迈入艺术领域，更能从学会欣赏艺术快速转变成尝试创造艺术。

华为终端平板与 PC 产品线总裁朱懂东在活动中表示，天生会画把传统的绘画艺术引入到数字技术中，不但便于传统文化的传播和保存，同时也可以更好地与世界进行分享交流，也让美的发现与创造不再是少数人的特权，而是每个人都能轻松触及的生活日常：

天生会画提供了一个全球的艺术交流平台，让更多的创作者能够充分地表达自我。

而这一赛事（2024 GoPaint「天生会画」数字创作大赛）不仅是艺术与科技跨界融合的里程碑，更是我们共同探索数字时代艺术新边疆的全新尝试。

国美作为天生会画进美院系列活动的首站，不仅凸显了大赛的专业水准与深远影响力，更让我们深切感受到了数字艺术创作的蓬勃生机与无限活力。今天见到这么多专家教授和年轻学子热情参与，让我对数字创作的未来充满了无限期待和信心。

我们相信，每个人的心中都蕴藏着无限的艺术创造力，只待被唤醒与释放。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博

镜头的变幻就是故事｜Midjourney V5.2 Zoomout 测试

SUiTHiNK

Steven

26 June 2023 at 00:18

阅读更多 AIGC 相关内容

最近一直都非常忙，所以连续 20 来天都没有碰过 Midjourney 了。前两天在社交媒体上看到，新推出的 V5.2 中有一个向外扩写的功能，因为此前已经在 PS+SD 的组合中见过这类拓展画面的应用思路，所以很想看看 MJ 的 Zoomout 能做出什么样的东西来。趁着端午假期这个空档，我集中跑了几波测试，有一些小小的心得，在此记录一下。

总体结论有三个：

1、Zoomout 可以无限次数地向外扩展，但随着镜头的拉远，Midjourney 自身的联想能力并不足以做出任何有意思的画面，不刻意控制地放大出来的画面，到了第 3～5 步之后，就会明显变得乏味和缺乏美感。

2、通过刻意地控制画幅比例、扩张倍数，以及针对性地调整 prompt 的描述，可以利用这个功能讲出有意思的故事。关键在于，使用者对于「镜头语言」的理解，以及对运镜和故事之间联系的掌控程度。

3、对工业设计的辅助甚微，做点「花活儿」可以，一旦涉及到逻辑，依旧不行。

测试内容目录：

1、通过默认的 Zoomout X2 按钮连续放大 3 次

2、通过默认的 Zoomout X2 按钮连续放大 15 次

3、通过自定义 Zoomout 微调构图

4、通过自定义 Zoomout 构建人物画像

5、通过自定义 Zoomout 构建人物性格

6、通过自定义 Zoomout 完善场景氛围

7、在 niji 中应用自定义 Zoomout 构建人物和场景

8、自定义 Zoomout 构建情绪与故事

9、通过焦点变化构建故事的场景

10、通过镜头变化，构建故事的起承转合

以下为部分测试过程记录：

test case no.1：通过默认的 Zoomout X2 按钮连续放大 3 次

点击以全屏查看图片 Click to view the image in full screen

操作方式：连续 3 次放大图像两倍，不对 prompt 进行修改，也不对画幅做设置。

输出成果：在奔跑的场景中增加了后方的人，有一点点故事性，但继续放大后会明显失焦，花面焦点始终在最开始的小女孩身上，继续放大生成的场景和人物都是模糊的。

test case no.2：通过默认的 Zoomout X2 按钮连续放大 15 次

点击以全屏查看图片 Click to view the image in full screen

操作方式：连续 15 次放大图像两倍，不对 prompt 进行修改，也不对画幅做设置。

输出成果：外围拓展的场景越宏大，有效信息和故事性就越低，除了在阴影中无意间冒出的人影，没有任何惊喜和意料之外，拓展的画面也很单调乏味。

test case no.3：通过自定义 Zoomout 微调构图

点击以全屏查看图片 Click to view the image in full screen

操作方式：不对 prompt 进行修改，按 1.1 和 1.2 的拓展比例小幅度调整画幅。

输出成果：初始图像是近景特写，根据图像本身的特点，对画幅进行小幅度地微调来获得完整的全景镜头，以及合适的构图比例。

test case no.4：通过自定义 Zoomout 构建人物画像

点击以全屏查看图片 Click to view the image in full screen

操作方式：先生成一个黄色漩涡图案，然后拓展时改写 prompt 为一只眼睛，进而生成一个带特征的面部局部画面，再次拓展时修改描述词为一个洞穴中的原始部落男性。

输出成果：成功构建了一个有目标特征「黄色漩涡瞳孔」的男性角色，通过控制拓展比例以达到最终效果—-人物整体和局部特征均得以完整呈现的画面。

test case no.5：通过自定义 Zoomout 构建人物性格

点击以全屏查看图片 Click to view the image in full screen

操作方式：先生成一个红色皮夹克的女性胸像，再改写 prompt 获得其坐在摩托车上的局部画面，再改写画幅比例获得完整的人物与车辆的全景照。

输出成果：成功构建了一个有目标特征「红色皮衣+摩托车」的女性角色，通过控制拓展比例以达到最终效果—-人物细节和整体氛均衡的画面。

test case no.6：通过自定义 Zoomout 完善场景氛围

点击以全屏查看图片 Click to view the image in full screen

操作方式：在初次生成的几批图像中，选择合适的画风和画面主体，再根据已有画面特征修改画幅比例。

输出成果：在选定风格和主体后，将竖幅主体拓展为气势更足的全景影像。关键是拓展比例并非默认的 2 倍或 1.5 倍，而是根据实际需求来控制比例，同时也需要关注怎样的画幅比例可以传达对应的氛围。最终图像画幅比例是 3:1，适合展现有足够细节的宽幅场景。

test case no.7：在 niji 中应用自定义 Zoomout 构建人物和场景

点击以全屏查看图片 Click to view the image in full screen

操作方式：

step 1、使用 niji 5 的 style original 生成一个细节丰富的初始人物；

step 2、以 1.2 的 Zoomout 比例纵向拓展出人物的半身画像，画幅比例是 1:2；

step 3、以 1.1 的 Zoomout 比例和 2:1 的画幅比例重构画面，得到外围场景；

step 4、以 1.2 的 Zoomout 比例和 3:4 的画幅比例重构画面，生成人物全身像；

step 5、改写 prompt 添加「宫殿」关键词，以 1.65 的 Zoomout 比例和 3:2 的画幅比例重构画面，生成人物在场景中的全景画面。

输出成果：虽然人物细节和场景氛围的融合程度还不错，但因为漫画角色的细节较多，在多次 Zoomout 的过程中，场景的丰富会逐渐抢掉中心人物的视觉焦点。因此在每一次修改画幅比例与关键词的时候，需要多加注意对视觉元素的控制。

test case no.8：自定义 Zoomout 构建情绪与故事

点击以全屏查看图片 Click to view the image in full screen

操作方式：

step 1、生成一个情绪和神情符合目标的初始人物；

step 2、改写 prompt 同时添加「马」关键词，以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面，生成后续画面的基础，此时需要注意人物与马的位置关系，否则后续生成的画面会非常扭曲怪异；

step 3、以 1.05 的 Zoomout 比例和 2:1 的画幅比例重构画面，生成完整的马匹造型与部份环境信息；

step 4、对比改写 prompt 产生的变化，黑发组不改描述词，以 1.1 的 Zoomout 比例和 3:4 的画幅比例重构画面；白发组添加「巨大镜子」关键词，以 1.6 的 Zoomout 比例和 3:4 的画幅比例重构画面。

输出成果：通过控制 Zoomout 的幅度、画幅比例和 prompt 的调整，可以生成指定场景的画面，且人物的神态到位、情绪饱满，整体画面焦点清晰。但美中不足是，构图不够自由。

test case no.9：通过焦点变化构建故事的场景

点击以全屏查看图片 Click to view the image in full screen

操作方式：

step 1、生成一个在河岸上的粽子；

step 2、修改 prompt 为「熊宝宝正准备吃粽子」，以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面；

step 3、修改 prompt 为「小熊一家在野餐」，以 1.2 的 Zoomout 比例和 4:3 的画幅比例重构画面。

输出成果：通过对 prompt 的修改，控制 Zoomout 的幅度、画幅比例，可以改变画面中的焦点和表达主题，适合不同文化元素之间的混搭。

test case no.10：通过镜头变化，构建故事的起承转合

点击以全屏查看图片 Click to view the image in full screen

操作方式：

step 1、生成一幅鲜花山谷的画面，人物要明显；

step 2、修改 prompt 为「一面巨大的镜子在草地上」，以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面，此处竖构图是为了生成较高的全身落地镜；

step 3、修改 prompt 为「少女站在镜子前」，以 1.5 的 Zoomout 比例和 3:2 的画幅比例重构画面，改为横构图是为了囊括少女全身以及环境信息。

输出成果：通过改变画面中的焦点和增加元素，在镜头逐渐拉远的过程中，故事缓缓托出。

阅读更多 AIGC 相关内容

我的整体感受是：

通过 Midjourney V5.2 的 Zoomout 无限拓展，一次次修改画幅比例、提示词内容，可以用镜头语言的变化来讲故事了，也可以基于一些初始的「点子」延展成有意思的融合作品。但越是这样，越发显得对话式、指令式的交互界面（ SD 那种也不算图形交互）的局限太大了，我很希望今年之内能发展出图形交互界面。

没错，今年 AI 的爆发指向了一个新的趋势：对话式交互界面。但人类之所以发明绘画，开始通过设计图来制作各式各样的新工具，恰恰就是因为语言本身的效率太低。这个逻辑其实也可以从媒体形态上找到端倪：文字–> 图像–> 视频。仅仅依靠对话，我们无法构建出一个一把剪刀；仅仅通过语言表达的播客，也无法传达任何需要视觉才可以精准理解的信息。对话指令的交互界面与图形交互界面之间的关系，并非只是 dos 和 windows 之间的差异，更重要的点在于，后者可以更直观地完成交互，以及精准地进行创作行为。AIGC 的重点不仅仅只是 AI，而是我们如何使用 AI 进行「Generative Content」。

我说一句话，AI 给我一个东西，这不是创作。

创作是一个生命在主观意志的驱使下，刻意的、有目的地表达其心中所想。

因为 GPT 的爆发而说对话式交互是未来，这样的断言是过于冲动的。只要是一个严肃的创作者，就会立刻意识到，真正的创作一定需要多纬度的交互界面。这其中不仅仅包含对话指令，同样更需要图形界面以及在数字虚拟空间中的三维交互。AIGC 工具与 PS、表格、PPT、思维导图等已有工具的结合，就是这类多维交互的雏形。

那一刻，我们不会等太久。

阅读更多 AIGC 相关内容

Ai 绘画将从何处开始进入日常生活？

SUiTHiNK

Steven

10 January 2023 at 21:30

最近几个月 Ai 绘画这个话题很火，但基本上大家都只是看个热闹，跟普通人的生活没多大关系。或者说，大家感觉不到它和自己有什么关系。只有相关从业者，感受到了巨大的生存压力和身份危机。

但和当年支付大战的春晚红包类似，能让普通人都参与进来、玩起来的场景可能才能让大家感受到：Ai 绘画意味着什么，能做什么。

尽管众多以文生图的 Ai 工具已经大幅度降低了创作门槛，但是在那之前，各种咒术、法门终究是拦住不少普通人接触 Ai 绘画的一块巨石。我自己也曾在用过某些 Ai 工具后，在一条展示初次接触的创作成果的视频里提醒大家，不要忽视它，但也不要过分害怕它。它一定会给我们的生活带来巨大的变化，只是目前还没积累到那一刻，仅此而已。

如果说有什么场景，类似发红包那样简单明了，人人都可以参与，我觉得有一个非常合适的应用场景，那就是用 Ai 生成定制头像。对于不具备绘画能力、不懂念咒语、不会使用绘图软件的大多数人而言，Ai 画头像就是各类修图美容软件一级的场景，既有尝新和娱乐，也有充分的社交属性，和红包非常相似。

最近试用了一下漫镜，一个感觉是，神情抓得不错，风格也足够多，用它来探索自己不同造型的可能性，还是挺有启发的！因此中途我想到一件事，如果这类产品的效率再高一些，跟各大连锁发型屋合作，预约时就上传几张照片，生成几套发型方案，人到了现场就让托尼老师根据效果图来剪，这不是非常好的体验升级么？谁说 Ai 必然逼得人失业呢？还得是看人怎么用。

除了头像，你觉得还有哪些场景，适合普通人体验 Ai 绘画呢？

让 MJ 学我画两张小画儿

SUiTHiNK

Steven

7 April 2024 at 12:58

昨晚吃饭前跟儿子一起画画，我随便画了一下我们在 Minecarft 里的第二个家，和随便画的一个岩浆包围的高堡：

后来想说看看 Midjourney 能模仿成怎么程度，就丢进去试了一下：

emmm，画得还行……

就是画风不太相关，它有它的训练痕迹，哈哈哈哈哈哈哈～

测试所使用的 prompt：

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

艺术可以糊弄，体力劳作也是高级智能

SUiTHiNK

Steven

19 March 2024 at 21:05

昨天发现 AAAny 更新了发图的功能，于是就顺势发起了一个讨论 AIGC 的话题。

轶轩在话题下问我为什么对外发表的图都是一些细节比较丰富的类型，是否有基于 AIGC 的生成方式而做的一些突破方向的尝试。我觉得，针对这个问题，我可以在对他的回复上，再做一期视频来谈一谈我的观点。

但与此同时，我也想做一些「简练」或「抽象」的图来辅助说明我的看法。于是，今天在工作之余，用一些碎片时间，做了一些图出来。

对此，我尝试比较随意地做了一些「东西」。它们都没有什么明确的「表达」，仅仅只是我随手写的一些 prompt，或者就是在 Midjourney 的社区里复制修改的 prompt，最终出来的东西都是一眼看上去有一些「意境」或者没那么精致细节的但表现比较能唬住人的图像。

你会发现，在这些人类认为偏「抽象」的表达上，AI 反而是比较容易做「好」的。

但是，这种好不是真的好，只是这些风格上，并不需要对细节有很认真的考据，在表现层面上是非常容易「糊弄」的。

这也是现当代艺术作品常常被人诟病的原因之一，因为那些作品浓缩了大量的思考和抽象提炼，但表现形式上，其实并没有比传统艺术更复杂，或更需要技艺和体力上的付出。也就是说，作为当代艺术最核心的「观念」，在完全不需要理解的情况下，一个外行的人或者一个数据量管够的 AI 就可以模仿出「看上去像那么回事」的东西。这种模棱两可的状态，恰恰是江湖神棍和 AIGC 擅长处理的对象。

这里说的「糊弄」「神棍」并非贬义，而是借着世俗的话语体系来表达，这样的「生成作品」并不需要 AI 具备「意识」和「创意」也可以轻松地实现。

那么，什么东西是更难的呢？

细节，是令人信服的细节。

这些是我用 AI 生成的男士剃须刀的设计方案。

你会发现，这些方案咋一看是那么回事，但只要你多看两秒，立刻就会意识到它不对。它们的空间关系、形态的处理、物理交互的关系、电子器件的布局，通通都有很大的问题。这些就是不可信的细节。

因为 AI 实际上并不理解它学习的那些图像。

这些令人信服的关键点，是无法糊弄的。因为它们当中包含了大量精确的思考和训练，也包含了海量的脑力和体力劳动，如果一个「智能体」不理解一个图像背后的复杂逻辑，那么它就没有办法真正地创作出这个对象。它只能模仿，只要模仿得足够像，就可以唬住外行。但是对于以此为生的从业者，这样的智能工具，还不足以成为生产力。设计师可以用这样的工具拓展自己的思维，但这些过程并不能替代设计行为。

从创意到落地，中间还有漫长的路需要人类设计师去走完。

现阶段，更适合工业设计使用 AIGC 的方式是这样：

我的意思并不是让 AI 画手绘图，这仅仅是一种表现方式。但是，这是一种不需要追求精确的表达方式，很适合 AI 用「抽卡」的方式来快速堆想法。除了这种，当然也可以让它生成上面剃须刀那样的图，但同样的，目的不在于出方案，而是借助 AI 的海量数据库，快速地堆出一批发散性思维的「胡编乱造」的混杂图像来。

人类的视野有限，但 AI 看得一定比人类个体的平均值多。

工业设计不是天马行空地想象，它是一种「劳作」。

从初期的构思，从草图推延到模型和效果图，再从设计方案导入结构设计和工艺、制程，这意味着工业设计不是一项纯脑力劳动，不是一种只运行在计算机里的行为。它包含的体力劳作同样是设计的一部份，甚至可以说，是更关键的那部份。这种体力劳作，不仅仅是肌肉和工具的配合，更是人脑对环境、事件、社会群体、物质的反应和处理，设计师的动作意味着这个人对世界的认知。这种程度的认知，对于只运行在计算机内，仍然缺少复杂的传感器和理解过程的 AI 而言，暂时还是无法实现的。

我当然相信它未来会具备这样的能力，但是在目前的技术条件下，依然需要大量的人类来完成这些真正代表了「智能」的「体力劳作」。

欢迎加入我们的讨论：

https://aaany.app/aaa/ltwu3txza

想注册体验 AAAny 的话，请给我留言

我会给你留言的邮箱发送注册邀请码

十二生肖 · Midjourney · 戏剧角色设计

SUiTHiNK

Steven

4 February 2024 at 20:37

在网上看过很多人用 AI 画十二生肖主题的系列画，但大多数我都觉得太套路了，要么只是生成一只动物，要么是套上一些所谓的古风服装，强行「国风」一把。我觉得，既然工具本身已经有很强的生成能力了，那么，创作者就应该更多地表达观念。没有观念的全自动生成出来的东西，再好看，也是大同小异、千篇一律。这种现象，最典型的就是那些长着网红脸的 AI 美女图。好看，但无味，因为缺少人味儿。

人味儿来自什么？最重要的两个点是：有缺陷，有观念

缺陷是因为人的不完美，不能样样都要，那么就得有取舍，而取舍的依据是什么呢？那就是观念。观念和审美，本质上是我们经年累月的经历中，所积累下来的看待世界的偏见。这里说的「偏见」不是贬义词，而是在说，人无法客观，而观念与审美就是在主观中沉淀下来一系列判断依据。我们就是用这样的依据来取舍，这些选择就形成了创作的结果。

即便是回溯到人类此前的所有历史中，艺术家们的创作，也是基于自己的「偏见」来选择创作的工具、技艺、载体和题材的。没有偏见，就没有作品。

因此，我想尝试创作一套有「戏剧感」的十二生肖。

戏剧感，一方面来自这些生肖不能只是动物，或者套了动物头套的人，而是得有个性与故事的角色，角色的人物小传可以从它们的神情、服饰、妆容等呈现出来；另一方面，需要一定的冲突感，这里说的不是观念不同的冲突，而是来自文化和故事背景中，衍生出来的角色的生命力，它会把你带入到某种场景里，它们的妆容和服饰或许不是那么常规、习以为常的文化惯性中的表达，但它们在场景和故事中，是合理的。

以下就是我的创作尝试：

如果你喜欢，可以自行下载原图。

如果你要转载，或者二次创作，请附上这篇 blog 的链接：suithink.me/?p=11457

我大致分享一下，这十二个角色的构思吧。

【鼠牛虎】这一组，是想把【生肖】与【西服】做一个融合，但我希望它们有更多的变化和区别，就分别在色彩、气质上做一些差异化描述。最后出来的三个角色，能感觉到是来自同一出剧的人物，饱受欺凌的鼠，正直优雅的牛、权势凌人的虎，故事就由此可以展开了。

【兔】通常是软弱和被欺负的对象。我希望创作一只勇敢、独立的兔小姐，于是让她走在一个昏暗的街道里，身着红色皮夹克，眼神坚定地朝着镜头。在很多文化意象中，兔子、皮衣和地下文化的组合，是谄媚的，是挑逗的，或者是色情和暴力的。但我不希望是这样，我想她可以是地下世界的英雄。她是这个系列中的第一位女性角色。

【龙】在中国的文化里，高高在上的霸权。于是我想，首先在颜色上我就不要那种红黄黑的东西，我不要皇权和武力的表达，我要它是个君子。作为君子的龙，需要同时具备威严和素雅。威严在于其妆容造型和气质眼神，素雅在于整体的色彩倾向和服饰风格。所以，这头金龙虽然相貌霸气，但眼神柔和坚定，白发之下是金线白袍，不怒自威。

【蛇】是邪恶的，多数文化中，它们都是这样的形象。这是第二位女性，我希望赋予她高雅的气质，和中立的角色身份。她在诸国纷争中，不倾向任何一方。但保持中立，需要的不仅仅是态度，也需要武力和经济。所以，她应该是一位既有贵气又有智慧的女性领主。在她紫色的服饰之中，使用了羽毛的元素，与蛇类那种光滑、阴暗的视觉元素做一点调和。

【马羊猴】这一组是相对现代的角色。【马】通常是黑色或褐色的，虽然也有白马，但在印象中，说起马就是黑色的动物。所以我想给她穿一身干练的白色风衣，即符合马这种动物在人类文化中的形象，又能在色彩搭配上突出她的质感。值得一提的是，我选择了一个侧面的视角，因为马的轮廓，侧面是最美的；并且，我在 prompt 中加入了长辫的描述，黑色布料的造型很妙，因此这个角色是目前没在网上出现过的全新的马人形象。她也是这组当中的第三位女性。【羊】的种类实在是多，不同种类的羊，出来的气质也都不太一样。经过不同的组合尝试，我最终选择了 Goat 这种羊。我想要一个有点脾气和痞气的大叔，他平时就坐在街道头的店铺门外，跟老板聊天，街上一旦出了什么事情，他一定会出手。因此，他的皮衣和眼镜都是有点讲究的。不过你看得出来，他并不是那种有钱人，他的讲究是一种对待自我的态度。

【猴】很特别，一方面是猴的种类也很多，另一方面是，猴子在绝大多数文化中都是活泼闹腾的男性形象。我非要她是女性，但她不会是个乖训的家伙。最后我之所以觉得，滇金丝猴是一个很合适的选择，在于它的毛色和毛发的形态，橙色到白色的过度让角色有一种温和的基调，但向外肆意张开的样子又很有流浪不羁的气质。服饰上我选了裙子和围巾。但在色彩上我动了一点心思，暖色系的猴和皮衣加长裙，得有一些色彩上的对冲，来建立她的个性和态度。因此，围巾是绿色的，也有相当的体量感。

【鸡狗猪】中的【鸡】是在【骄傲大公鸡】的基础上的进一步表达。首先，鸡的种类很多，但白色羽毛的，通常是 white Plymouth Rock。为了增加戏剧冲突，我希望他穿着镶满了珠宝的绿色三件套西装。神气，就是要神气！【狗】就更多种类了，我最开始也尝试了不同的品种，因为拿不准什么样的形象是更合适的。后来我意识到，不同的狗，它们自身的气质差别就很大，所以不存在一种狗能表达狗这件事。于是，重点就变成了，我想要表达什么，那就选择什么狗。我希望这是第五位女性。恰好，筱烨以前的 Daisy 就是一只金毛，一个可爱热情受街坊邻里欢迎的小女孩。那就金毛寻回犬吧！在这个设定的基础上，我增加了双麻花辫和白色校服的描述，最后就有了这个金毛小女孩。

最后的【猪】我有两个想法，一个是十二生肖中男女比例对半开，所以我希望她是女生；另一个是，我想她可以非现实一些。前面的十一位都是比较写实的感觉，但写实的猪，和女性结合，在观感上，很容易让人产品某些厌女、性别对立的联想。我不希望这位可爱的女性角色被贬损。于是，我给她增加了金色皮毛质感的设定，穿上温暖的粉红色外套，带着白围巾站在雪地里。这是一位温柔的女性，但她的防风镜会告诉你，她可不是傻白甜，在雪天的山里行走，缺少她的交通工具，哪怕是楼上的虎先生，也寸步难行。温柔也是有力量的。

下载高清原图：鼠牛虎兔龙蛇马羊猴鸡狗猪

女神雕像｜Midjourney V6 Alpha 不锈钢材质测试

SUiTHiNK

Steven

3 January 2024 at 00:02

之前测试了 Midjourney V6 在石膏、大理石、黄金材质下的表现，出品非常好，并且品质表现很稳定。今天忽然想测试一下，同样的题材在不锈钢材质下的表现如何。

因为上述三种材质的漫反射对形态的干扰很小，AI 的训练素材应该也大部分是以这类非镜面材质的图库为主，所以我猜测，同样的雕像在抛光/镜面不锈钢下的表现，很可能会因为镜面反射对形态的干扰，产生许多错误。

以下实测例图，均可点击查看原始尺寸高清大图。

Prompt Bust photo, polished stainless steel goddess sculpture, real feathered wings, black rock, magma and flame, dark clouds –ar 3:4 –style raw –v 6

可以看到，镜面不锈钢材质在没有手部参与的情况下，表现非常出色。形态、比例与动态都在镜面材质下，显得更为出色，细节的呈现也非常舒服。

Prompt A statue of the goddess made of polished stainless steel, with huge white feathered wings, surrounded by obsidian, with lava flowing, violent flames, and clouds of darkness –ar 3:4 –style raw –stylize 50 –v 6

这一组我着实测试了很多轮，才终于能挑选出这两张还看得过去的成品。期间最容易出现问题的点有：

1、手的比例和手指的形态、数量；

2、画面未完整呈现 prompt 所制定的内容；

3、不锈钢、羽毛、岩浆、火焰四种材质的不恰当混合。

我感觉目前的  V6 Alpha 虽然在光影关系和质感的表达上非常强，但在较复杂的 prompt 的情况下，非常容易出现不合适的混合。

Prompt Mirrored Stainless Steel, Goddess Statue, White Feathers, Obsidian, Lava –ar 2:3 –style raw –v 6

这一组实例中，明显可以看到   MJ 对于 Mirrored Stainless Steel 这个关键词的错误执行。虽然质感的表现非常好，但它根本不是镜面不锈钢。同时，岩浆、黑曜石这些关键词也几乎没有呈现，仅有部份反光似乎呈现出了对「Lava」一词的反馈。从最终结果来看，质感的表达是明显跑题了。

Prompt Mirrored Stainless Steel, Goddess Statue, Above the Waist, Red Feathers, Obsidian, Magma –ar 2:3 –style raw –v 6

当我把其中「白色羽毛」的描述，修改成「红色羽毛」后，可见材质之间的干扰就几乎消失了。大概是镜面材质中高光的部份容易和白色材质产生混淆，所以在颜色明显有区分的描述下，不锈钢的质感表达就非常舒服了。

这一点猜测，在最后一组失误实例中，可见到更离谱的跑题。

Prompt Mirrored Stainless Steel, Goddess Statue, White Feathers, Obsidian, Lava –ar 2:3 –style raw –v 6

这一组和上上组的 prompt 是完全一样的，区别有：

1、选择方案发散路径时，选择了有躯体的版本，有起伏的形态更有利于表达镜面材质；

2、更大面积的曲面形态，似乎会有更少的概率出现材质跑题的情况。

我不确定以上猜测的概率，但在实际测试中的感受就是：

如果人物以全身、半身的形态来呈现，那么镜面不锈钢的表达错误非常少见；但如果选择只有脸部特写的方案深入，材质跑偏的概率明显更大。

Prompt Mirrored stainless steel, close-up of goddess’s hand, white feathers –ar 3:4 –style raw –v 6

同时，因为以上的所有测试中，手的比例和手指的形态、数量一直都在出问题，所以我单独对「手」做了几轮测试。在高反射材质描述下，「手」出问题的概率非常非常大。必须一轮一轮地精挑细选，在看着还行的方案上一次次地 Vary 才能偶遇到一两个，看着没什么大毛病的「手」。

同时，因为高反射的干扰，高光和白色很容易让不锈钢材质呈现出磨砂质感。

Prompt Polished stainless steel bust of a goddess with white feathered wings, black rocks, lava, flames, dark clouds –chaos 21 –ar 3:4 –v 6

这就是上文说到的跑题千里的材质表达。

同是 Polished stainless steel 这个词，但无论是躯体还是面部，都完全没有 Polish 的意思。整体观感更像是光滑的石头，它的质感表达完全被白色羽毛给搞混了。但同时，羽毛也呈现出石雕的质感，完全不是羽毛的质感，和上面几组实例的羽毛完全不是一类表现。

本轮测试总计生成了 659 份方案，筛选出以上 19 张我认为可以的成品图。

在我看来，这个比例过于低了。

希望在     V6 的正式版本中，能优化这方面算法。

2025 款五菱星跃 Safari EV 四驱四座

SUiTHiNK

Steven

16 November 2023 at 21:36

这是一个玩笑。

这其实是我使用 Midjourney 画的一款概念车。初始的构思是，一款小型电动越野车，比一般的 K-Car 稍微大一些，但得有越野车的强壮感，同时要贴合当代审美的流畅线条。

为了测试大家对它的反应，我把五菱的标志合成到了我最终在 MJ 上输出的图上，并虚构了这个型号，没有任何多余解释，直接发出来。我会观察一阵子，看看会发生什么。

在这张图里，我所使用的描述词：

正在行驶在路上的四轮微型车，小巧的车身，简洁和硬朗的造型，硬朗和锋利的车灯造型，黄色车身，光洁的表面，流畅的曲线，越野设计风格，背景是黑色的玄武岩山脉，3D模型，虚幻引擎渲染

prompt：

Four-wheeled miniature car driving on the road, compact body, clean and hard styling, hard and sharp lamps styling, yellow body, glossy surfaces, smooth curves, off-road design style, black basalt mountain range in the background, 3D model, Unreal engine rendering

用 MJ 画一辆车非常简单，但想要看上去能骗到人，还是得在细节上多做调整。所以我除了调整描述词外，最主要的尝试，是不断用 Vary(Region) 这个功能来调整局部，以使其达到我想要的效果。包括但不限于车身轮廓、车灯造型、C柱与尾部的衔接、防护栏造型与车身的衔接、轮毂、远山等。

同时也保留了一些 bug，来确保有人可以发现其非真实性，例如被我抹掉的 A 柱和门把手，被抹掉的前舱盖的缝之类的。

以下是未经处理的大尺寸原图：

你可以拿去玩，把你喜欢的或你认为适合的品牌标识合成上去，拿到任何地方发表，不需要经过我同意。祝你玩得开心！