Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

探索 JPG 和 PNG 图片的压缩表现、算法与应用

By: 李瑞东
10 December 2024 at 10:02

前段时间做了些展示页,工作时需要给到切图给前端。以我的习惯,每次都会导出 PNG 并压缩后才交付给前端。有一天我突然想到:

为什么我每次切图时下意识都是会提供 PNG 格式给开发,而不是使用 JPG 格式的图片?这是什么时候开始的习惯?

回想起来应该是我刚刚进职场的时候,在一些设计文章里听过的说法:

  1. PNG 图片支持透明通道,适用场景比 JPG 要更加宽广,无脑 PNG 即可;
  2. PNG 图片支持 “无损压缩”,所以图像质量会比 JPG 好一些。

第一点毋庸置疑,但对于第二点我是有点怀疑的:PNG 图片的质量真的在任何时候都比 JPG 要高吗?并且更想知道所谓的 “无损压缩” 是什么,真有这么厉害的技术?所以我打算花点时间做下研究,顺便将研究结果分享给其他团队的设计师们。

这篇文章是一篇在团队月度分享会的记录,分享会内容主要是在回答这个问题:

JPG 和 PNG 分别适合储存什么类型的图片?

回答完这个问题后,我会简单介绍下 JPG 和 PNG 图片压缩机制。正是因为 JPG 和 PNG 这两种图片格式的压缩机制的不同才导致适合储存不同类型的图片。

以及扩展一下思路,会介绍一个我已经实际工作用过的方法:通过 CSS 的混合模式节省网页图片资源

一、图片压缩分析

分析方法

这次我用了三种类型的图片进行分析,都是我在实际设计工作中有可能导出成位图交付给前端开发的图片类型:

  1. 颜色丰富的 Banner 图:测试压缩算法在细节保持方面的表现
  2. 过渡柔和的背景图:测试压缩算法在处理低色彩复杂度时的表现
  3. 界面设计图:测试压缩对大色块、文字和边缘清晰度的影响

具体的分析过程:拿三个在设计工作中常用到的图片类型(相同尺寸、均无透明通道)进行压缩,以对比 JPG & PNG 图片在压缩前后的表现。分两个维度进行对比:图片体积图像质量

分析结果

一、图片体积对比

由上图对比可以比较直观的看到,前两个类型(颜色丰富的 Banner 图、过渡柔和的背景图)在图片体积上,JPG 格式图片的体积要比 PNG 格式的图片体积小得多。

通过这一轮对比,我们可以得出结论:

  1. 画面颜色丰富、颜色过渡比较细腻柔和的图片,JPG 图片的体积比 PNG 的更小;
  2. 画面颜色越丰富,JPG 图片越能节省空间;
  3. 颜色数量较少时,PNG 图片的体积比 JPG 图片的更小;
  4. PNG 图片在压缩后,色块、文字的边缘的质量会比 JPG 图片要好得多。

二、图像质量对比

对比一:颜色丰富的 Banner 图

这一轮我们会放大图片的局部,对比 JPG 和 PNG 图片在经过压缩后,图像质量的区别。

在颜色丰富的图像中,JPG 图片的颜色过渡质量比 PNG 好得多,即便是压缩过后也能保持柔和的过渡。反观 PNG 图片,则是出现了明显的色块。

在文字、边缘的展示方面,PNG 图片则比 JPG 图片好一些。PNG 图片保持了原本清晰、锐利的边缘,而 JPG 图片则在处理边缘时有些许杂色。

对比二:过渡柔和的背景图

这是一个令人意外的结果,在图像内容比较简单,仅仅只有一些色彩过渡的时候,JPG 和 PNG 图片的质量都很接近。只有在放大很多倍的时候才能看到 PNG 的图片过渡效果比 JPG 要差一些,还是出现了和前一种类型类似的色块现象。

为了探究得更深入些,我在这里用了一张暗色系且过渡柔和的背景图进行同样的压缩测试,这次的测试结果对比会明显很多。

在深色系且有柔和过渡的图片当中,JPG 图像的质量明显比 PNG 要高。如上图所示,PNG 图片的色块和噪点已经比较明显了,而 JPG 仍然保持较柔和的过渡。

对比三:界面设计图

在对比界面设计图时可以看到,PNG 格式的图片在处理色块边缘、文字边缘时都比 JPG 图片要好得多,边缘很清晰锐利,甚至和压缩前的原图没有什么分别。

三、总结

经过上述对三种不同类型图片的图片体积、画面质量对比后,我这里总结出了以下规律:

  1. JPG 格式适用于颜色丰富,过渡柔和,有丰富的颜色渐变和复杂的视觉元素的图片。比如网站 Banner、大场景、3D 渲染图、摄影图片等,此时用 JPG 图片可以得到体积小且颜色漂亮的图片;
  2. PNG 格式适用于颜色数量少,色块切割明显的图片。比如界面、扁平插画、Logo,带有文字的图片等,此时用 PNG 图片可以得到体积小,色彩准确且边缘清晰的图片。

二、图片压缩过程

这一章会探索 JPG & PNG 图片的压缩过程,这也是导致上文提到 JPG 和 PNG 压缩后图像差异的原因。

JPG 图片压缩过程

JPG 图片压缩过程主要有以下几步:

  1. 色彩空间转换(预处理)
  2. 下采样(有损压缩)
  3. 分块和离散余弦变换(预处理)
  4. 量化(有损压缩)
  5. 编码
  6. 存储

在整个压缩过程中会进行两次预处理和有损压缩,分别是第 1、2 步和第 3、4 步。其他步骤与图像质量之间的关系不大,所以我这里就只介绍这两次的预处理和压缩。

第一次预处理和压缩(色彩空间转换和下采样)

我们设计师平常接触到的 “RGB” 或 “CMYK” 色彩空间,一个字母代表一种颜色,比如 “RGB” 意味着 “红绿蓝”,“RGB” 的色值代表红色、蓝色、绿色分别占多少。

而压缩工具拿到 JPG 图片后,会先将图片转换为一个叫 “YCbCr” 的色彩空间。其中 “Y” 代表了这张图片的亮度信息,而 “Cb/Cr” 分别代表图片中蓝色和红色与亮度 “Y” 的差值。经过这种转换,可以针对性地保留更多的亮度信息,而减少色度信息。简单来说就是能够让人眼难以感知到的方式来减少图像中的色彩信息,减少图片文件体积。

色彩空间转换之后,会进行一个叫 “下采样” 的压缩动作。维持亮度信息的同时,统一处理每个 2x2 的像素区块的色度信息(比如在一个 2x2 区块内 4 个像素在色彩上会被统一处理,看起来拥有相同的色度,但明度是不同的)

第二次预处理和压缩(分块、离散余弦变换和量化)

分块、离散余弦变换指的是会将图像分成多个 8*8 像素的色块,然后将其从像素域转换成频率。转换成频率域的意思是能够让电脑分辨图像中的:

  1. 高频成分。颜色变化剧烈的部份,如色块、文字的边缘;
  2. 低频成分。颜色变化平缓的部份,如下图所示的黄色渐变。

而量化则是利用了人类视觉对于图像中的高频变化不是很敏感这一点,通过减少高频区域的数据量,同时在低频区域保持一定精度,让人感觉到图片仍然很清晰。

简单来说,就是压缩算法知道图像里哪些部分的色彩过渡比较缓和,哪些部分的色彩过渡是强烈的,然后对色彩过渡比较强烈的部份使用较高的压缩率。

结论

所以正如前面对比分析时看到的结果那样,JPG 图片对于色彩丰富的图片的压缩效果比较好,因为 JPG 的压缩算法会根据人眼的特点来优化图片的不同区域。

PNG 图片压缩过程

PNG 图片的的压缩过程主要有以下几步,其中只有前三步对图像画质有影响,这里只介绍前三步:

  1. 量化(有损压缩)
  2. 过滤器选择(预处理)
  3. DEFLATE 压缩(无损压缩)
  4. 合成输出

量化

第一步的量化是根据图像的需求选择合适的颜色类型和位深度,简单来说就是直接减少图片的颜色数量。这是最直接有效的压缩方式,同时也对图像质量损耗较大。

下图可以看到一个图像从 24 位(能储存 1677 万种颜色,又称真彩色)减少到 8 位色(能储存 256 种颜色,又称索引色)时,会出现色带现象 (Color Banding)

过滤器选择和 DEFLATE 压缩

这一步才是 PNG 图片的无损压缩。首先会先扫描 PNG 图片的每一行像素,然后以一种新的方式计算每个像素格子的颜色值。比如一个叫 “Sub” 的过滤器,每个像素值是通过当前像素值减去该像素左边像素值得到的;一个叫 “Average” 的过滤器,每个像素值是通过当前像素值减去当前像素左边和上方像素值的平均值得到的。

而 DEFLATE 压缩,这里会用到的方式有很多,比如 LZ77 编码和哈夫曼编码,这里不展开说明了,简单来说就是对过滤过的数据以更优的方式编码,达到减少文件大小的目的。

结论

基于上文提到的过滤器,不难想象到这种无损压缩的方式对于颜色分明的图片 — 比如纯色图标,App 界面截图,扁平插画等 — 很有用,因为像素之间存在细微差异的地方不多,画面上都是大色块居多。

三、其他解决方案

前面提到了很多跟图像压缩相关的事情,这些都是与网页加载优化息息相关的。正好我前段时间做了一个需求,我让前端帮忙做了一件事来节省了大量的图片素材,也算是一次网页加载优化的小案例。

我的设计方案里需要用到八种主题色来作为对卡片的区分,然后我会给这八种主题色的卡片提供一个有简单渐变图像的背景图用以装饰画面,让其过渡不太生硬。设计稿如下图:

如果按常规的做法和给予上文的调研,我将要提供八张代表不同颜色主题且经过压缩的 JPG 图片给到前端。但是在实际工作中,我只提供了一张灰色的背景图,然后让前端帮忙用 CSS 的颜色叠加 “Screen” 方式来给这张灰色图片上色,达到的效果是与设计稿一模一样的。

下面这张图或许能直接地解释其原理,我先提供一个灰色的素材图,里面只有黑和白之间的明度变化,然后前端会写一个颜色块在这个图片上面,最后使用 CSS 属性 background-blend-mode: screen; 将这张灰色的图片和色块进行叠加,得到了与主题色对应的背景图。

最终我仅用一张素材图实现了原本需要八张素材图才能实现的效果,成就感满满!

总结

这次做的调研确实打破了我从业以来多年的错误观念,现在我清晰地知道了:

  1. JPG 和 PNG 适合储存的图像是不一样的;
  2. JPG 和 PNG 的压缩算法导致了图片在压缩后的表现不一样。

虽然这些跟设计技能无关,但也算是一种视野的开拓吧。

这次的分享会是从一个 UI 设计师的角度去探索的,实际上我在 SHEIN 的工作更多是以交互设计师的角色去完成的,我已经有计划在之后的文章中分享更多交互设计的案例,读者们敬请期待吧。

The Tesla, The Future, The GE&GM

By: Steven
12 October 2024 at 00:27

Elon Musk 真是个讲故事的好手。

The future should look like the future.

虽然看着有些冰冷,虽然还有一段时间,但把这么激进的设计落地,真的令人佩服。

尤其那只手,和那辆大车。

我要收回之前的话,Tesla 不是下一个丰田,丰田太小了。

它更像「通用」,即是 GE,也是 GM。

Sharing: 3D modeling & rendering flow on Figma

By: 李瑞东
5 October 2024 at 16:38

Sharing: 3D modeling & rendering flow in Figma

Background

Current situation

I have been working for the current company for half a year. I have a clear picture of the working pattern: We are a small design team, but each member has to be responsible for both the UI and UX design for many internal systems.

Some of the design requirements are not complex at all, but the stakeholders want to make the interface aesthetically beautiful and different from other internal systems. In contrast, other demand sides hope designers can provide a clear and understandable solution to tackle the complex interaction flow.

The previous one was much more difficult for me since I was interviewed for the senior UX designer position, and I had not expected to address these design requirements, which may have occurred considerable times.

So it is time-consuming to design a portal website or refine a running internal system since I have to try multiple design solutions to ensure it will be aesthetically beautiful and outstanding.

Ideation

I wonder if 3D pictures could be a great approach to suit this type of design requirements. So I researched external products from large firms, trying to know how they use 3D pictures in their SaaS products.

Screenshots of four different B-end products are shown, focusing on the application of 3D assets within these product interfaces. Each webpage design incorporates 3D elements of various styles to enhance visual appeal and user experience.

After collecting and investing in multiple products, I found the patterns:

  1. 3D pictures are most likely used in landing pages, login pages, portal pages, and the like;
  2. Admin panels and dashboards do not use 3D pictures frequently, but they would appear in entries, feedback, and background decoration.

Conclusion

Based on the pattern above, real working conditions, and small-sized tries, I summarized the first conclusion:

  1. 3D pictures are not frequently used on dashboard pages and system admin. However, using 3D pictures could improve the variety of pages. So it is not worth it to spend so much time on it.
  2. 3D pictures can effectively meet the expectations of demand sides when they want to make their dashboard and admin pages distinguish from other similar sites.

Difficulties

Since I don’t have skills in 3D design, and my working strength is too high to spend much time learning, modeling, and rendering delicate 3D pictures, I just simply searched 3D visual elements on the Internet and then applied them to my deliverable.

Initially, this approach was workable and can help me complete my work quickly. However, drawbacks are uncovered after multiple uses:

  1. Difficulties of matching business contexts. 3D pictures on the Internet support common scenarios well but can’t always precisely describe certain business scenarios.
  2. Lack of series of an element. Although we finally found a perfect 3D picture, it is hard to reach other similar elements from the same series, resulting in poor scalability.
  3. Risks of infringement. Using 3D pictures on the Internet might cause infringement, so applying it directly consists of potential risks.
  4. Inconsistent quality. Free elements are not guaranteed quality and sometimes fail to meet the standards of our design team.

Here, I draw the second conclusion:

Searching for 3D pictures on the Internet has limited effectiveness, so we can’t fully rely on this approach.

After drawing this conclusion, I feel horrible: does it mean that I should strive to learn skills in 3D design? My work strength doesn’t allow me to learn professional 3D software like Cinema 4D or Blender.

The logos of two professional 3D design software are displayed, with CINEMA 4D on the left and Blender on the right, emphasizing their importance in the 3D design field.

After thorough consideration, I think the core demand for me is not to learn 3D software, rather, I should have the ability to gain 3D pictures. Apart from that, the whole process should consist of these features that suit my workflow well:

  1. Quick render. Since it is not worth it to spend much time on it during my work time.
  2. Consistent style. Ensuring our design has great scalability.
  3. Great customizability. It means that I can fully control elements on 3D pictures, ensuring outputs highly represent the business requirements and contexts.

By chance, I know there is a plugin in Figma called “Vector to 3D”. By learning outputs published in the community, it seems that this plugin could meet the features above well, improving my work effectiveness and quality. So I asked my team leader if I could spend some time discovering this plugin and sharing my experiences with team members, and she approved.

Therefore, this post is to record my internal sharing: My experience of how to build 3D modeling & rendering flow in Figma that improves our design effectiveness and quality.

Work with Vector to 3D

Introducing the plugin

This is a paid plugin, we can search for and install it in the Figma community.

A screenshot of the Figma plugin ‘Vector to 3D’ interface shows how to search for and open the plugin page in the Figma community, with the right side displaying the plugin interface during the 3D conversion process.

The control panel is comprised of three parts: Global, Object, and Animation settings. Here I will simply introduce the interface of the first two parts, ensuring all readers learn what this plugin can make.

For the Global setting, we can adjust the cameras, and background on the “General” panel; apart from that, we can set the render quality and details on the following panel called “Render”; and then we can control lights on the next panel named “Light and Shadow”, this panel supports varies functions of lights, like the number, size, position, strength, color and so forth.

A layout settings screenshot of the Figma plugin ‘Vector to 3D’ shows global configuration options for the 3D scene, including modules for rendering quality, shadows, and lighting editor.

For the Object setting, we can make a 3D model by extruding, inflating, or revolving, and then increase the detail of the model by setting “Mesh Quality”. Moreover, this plugin also supports material settings, like roughness, metallic, transmission, and the like.

These features are more than sufficient to handle nearly all of my design tasks.

A screenshot of the configuration interface for individual objects within the Figma plugin ‘Vector to 3D’ displays options for adjusting specific parameters of the 3D object, such as material, color, and refractive index, along with material preset selection.

Make a template

In this part, I will introduce two functions of this plugin: Save Preset and Template Preset.

Saving preset allows us to memorize the current view, modeling, and material settings of the frame. We can reload all the settings by the next open, even sharing with friends.

A screenshot of the configuration saving and loading interface of the Figma plugin ‘Vector to 3D’ shows how to save the current configuration to a Figma layer and how to load preset configurations onto 3D objects.

Templating Preset is not only the masterpiece of connecting the plugin with Figma but also a key factor in effectively generating 3D pictures.

Once we built a template, the plugin would memorize all the raw object preset, next step, we can replace the raw object with anything else, and succeed the raw object preset to it.

This approach is highly convenient for us when producing 3D elements. We just have to create a template, and then we replace various shapes, finally, we can produce endless 3D elements that fit our actual needs well.

How it works: First, we need to set the frame as a component and make the replaceable element that we want to replace with a new one a child component. (In the following example, I set the square bottom as a replaceable element.)

A screenshot of converting elements into components in Figma shows a semi-circular element and a blue rectangle being converted into sub-components.

Second, we duplicate the whole component and tune settings in the plugin, then save it. (In the following example, I make a glass ball and a square bottom base with a metallic surface)

A screenshot of saving 3D configurations in Figma, with the left side showing a blue rectangle component with a pink semi-circle, and the right side showing a 3D sphere and rectangular base generated using the ‘Vector to 3D’ plugin.

Third, we need to create a bunch of shapes that are to replace the replaceable element, making them an individual component and ensuring their layer number, order, and name are the same as the replaceable element.

A screenshot of creating interchangeable elements in Figma displays multiple shapes (square, circle, star) as components.

Last, we can hold the keys “cmd” + “option”, drag a new shape component to replace the replaceable element, and then reload the model again. Now we can see the new shape is applied to the same presets.

A screenshot in Figma shows replacing component elements and reloading the model using Cmd + Option, with the left side showing the process of replacing a circular base with a rectangular base, and the right side displaying the circular base adopting the rectangular base’s style after the replacement.

Now we successfully made a template, we can produce endless 3D elements by creating and inserting new shapes.

Actual practice

Here, I will share a case that is already used multiple times in my daily workflow.

A screenshot shows a blue 3D glass-style icon library, including symbols such as code, star, trash can, like, share, chat bubble, download, dollar sign, lightning, heart, plus sign, and quotation marks.

In this template, the shape of icons and background are replaceable, generating endless pictures and fitting nearly all of my design tasks. So it can be a resource library, empowering other team members.

Meanwhile, I created a color pattern, which not only can be used to represent states like success, fail, warning, and the like but also can be applied to the system with different color themes, ensuring our outputs are highly scalability.

A screenshot shows a color palette icon library with 3D-style icons in red, green, and orange, including symbols such as an exclamation mark, bell, cross, t-shirt, star, directional arrow, checkmark, music note, heart, and play button.

Benefits

In the post above, we learned the interface of Vector to 3D, how to make a template, and how I use this flow in actual workflow.

We are familiar with the 3D design workflow in Figma. To conclude this post, I’d like to summarize the key advantages of this process.

1. Low learning costs

We can simply recognize that the plugin “Vector to 3D” is a lite version of 3D software, simplifying complex functions from traditional 3D software and keeping essential functions.

2. Full design process within Figma

This workflow allows us to produce great 3D elements that don’t have to leave Figma. Apart from that, we can simply tune colors in Figma, which doesn’t like the traditional workflow that always switches from software to software.

3. High scalability

One of the core features of Vector to 3D is that makes up models from vector shapes, by taking advantage of this, we can efficiently produce 3D pictures that effectively meet our needs and align well with business contexts.

4. Consistent styles

The plugin Vector to 3D can coordinate with the components of Figma, not only remembering global presets like lights and cameras; but also allowing replacements to succeed presets like materials and position from previous elements. By templating these presets, we can endlessly produce 3D pictures with the same style.

This workflow is not only successfully used in my daily work but also influences my colleagues. After this sharing, 50% of my team members purchased and used this plugin in their design tasks.

Solution for non-Figma users

If you or your team are not using Figma for work currently, or you are not a designer but just simply want to try the flow from SVG shapes to 3D models, you can visit the online version of Vector to 3D: https://www.meimu.design/vector-to-3d/


Sharing: 3D modeling & rendering flow on Figma was originally published in Bootcamp on Medium, where people are continuing the conversation by highlighting and responding to this story.

十三岁的唱片制作人!敏锐的设计洞察力来自街头?设由心声:序 Vol.0

By: Steven
28 July 2023 at 19:05

🎥 点击跳转至 B站 播放视频:https://www.bilibili.com/video/BV1SN411a72T/

🎥 点击跳转至 YouTube 播放视频:https://youtu.be/o3XL_woaCUs

这是新企划的设计师视频系列《设由心声》的序章。在这期视频里,你将会看到设计意识自我觉醒的过程,以及不可遏制的创作冲动是如何生长的。

这是想重启很久的一个全新大坑:设计师访谈 + 产品与设计背后的内幕信息。

这一条是今年三月份去上海参观《拍照的人》线下展的时候,和 akira 在前台做的采访。你将会看到一个设计师自我觉醒的过程,和他的学习方法。

因为原本就有重新开启这个新企划的打算,于是借机做了这一期访谈,作为整个系列的开篇。 这个系列应该都会是这种类型的类似纪录片的形式,来展现设计和产品的业内信息和观察。为什么说是「重启」呢?因为很多年前做过一个设计师访谈的专栏,因为各种原因只做了七期就终止了,现在想用视频的形式复活这个企划。

早年的设计师采访文章见:

创新 vs 混乱:iPhone 在 AI 时代下的牙膏和迷茫_10.ylog

By: Steven
1 October 2024 at 08:01

这是一期 荒野楼阁 WildloG 和 皮蛋漫游记 的串台节目,由我和零号、初号一起,聊聊今年 Apple 发布的新产品以及一些周边的信息,作为 设以观复x两颗皮蛋 合作的那期视频内容的一些补充。

今年 iPhone 16 系列着实挺闹心的,一方面是 Apple Intelligence 的大饼迟迟未能落地,另一方面 Camera Control 独立按键加得有点莫名其妙。但我们还是决定在深入体验和使用 iPhone 16系列之后,能够匹配我们的深度测评内容一起,跟大家聊聊今年库克又挤出来了多少牙膏?

2:03 关键词:初号「过山车」苏志斌「意料之中」零号「Ridiculous」

8:10 AirPods 4 代很值得购买,刀法也足够精准

11:01 AirPods 助听器功能的背后

17:32 中文字体字重的调整

20:11 Siri 物理意义上变快了

22:31 相机控制按键:理想很丰满,现实…….

31:53 Mac 预览和 shownotes 支持 HDR 视频的延伸和补充

36:55 色彩风格+魔改 RAW

40:44 App Intents:让系统 应用互相直接能联动

45:57 Apple Watch:9 代到 10 代减薄的背后,11 代可预期的更大显示尺寸

54:55 相机按键如果是 AI 的视觉按键成立吗?

1:00:40 加了这个按键之后到处都是混乱和矛盾

1:06:25 手机为啥(暂时)不能 edge(显示)to edge(中框)

1:12:19 什么是产品的核心体验?

1:23:34 苹果会做折叠屏吗?

1:34:00 Meta Orion 是否是比 Apple Vision Pro 更正确的验证路线

1:41:54 为什么最好的虚拟现实 AI 设备一定是眼镜?

|登场人物|

苏志斌:从业 15 年的工业设计师,车联网智能硬件企业联合创始人及产品经理

零号:两颗皮蛋的零号,前手机行业产品经理,主管运营和项目管理

初号:两颗皮蛋的初号,前手机行业产品经理,主管内容创作和出镜

|更多皮蛋|

B站@两颗皮蛋 微博@两颗皮蛋 小红书@两颗皮蛋

|拓展阅读|

录这期播客时遗漏的话,聊一聊苹果的设计团队「怎么了」

视频:设以观复 x 两颗皮蛋 联合深度解析 iPhone 16 系列

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

内忧外患的 Apple 与中年危机的 iPhone,表像之下是藏不住的迷茫!设以观复 vol.15|Ft.两颗皮蛋

By: Steven
1 October 2024 at 08:00

🎥点击观看视频(两颗皮蛋版)

这是一次新的尝试。

缘起是我在自己的群里丢了一张 Apple Watch 10 对比 9 的图,本来今年不打算做视频来讲了,但是有天手欠看了眼图纸,琢磨出一些自己觉得有意思的事,感觉可以简单做期视频分享一下这些想法。于是两颗皮蛋联系我,问我是否有兴趣合作一期节目,他们来负责制作和发行的工作。本来我是不愿意的,这不是说我不愿意跟他们合作,而是一种万事都拒绝的精神状态,是抑郁症在作祟。但我不想被这病控制,我觉得需要像把自己推去东北跟汉洋他们出去走一圈那样,先答应下来,逼自己往外走。毕竟不需要我自己来制作的话,我也轻松了一大截。于是就答应了。

大致的过程就是我们各自写稿,然后整合在一起,再约个时间过去录制。这次合作的整个过程相对还是蛮舒服的,虽然发布阶段因为 B站 的流程复杂而出了点插曲,但总体还是挺庆幸自己踏出了这一步的。

🎥点击观看视频(设以观复版 YouTube)

🎥点击观看视频(设以观复版 B站)

这期《设以观复》是第一次尝试合作的方式来制作,但依然是按照主线的标准来制作的,不是番外篇。其中我的分析那部份的文稿和插图是我自己制作的,视频整体的策划、录制、剪辑、校对、包装等工作都是由两颗皮蛋的团队完成的。

在此感谢他们 4 位的工作!

与此同时,我们还做了一期播客串台的节目,一鱼两吃,双倍更新:

🎵Vol64.畅聊 iPhone16 系列:24 年的库克挤出来多少牙膏?

🎵创新 vs 混乱:iPhone 在 AI 时代下的牙膏和迷茫_10.ylog

🎵内忧外患:苹果设计的中年危机_11.ylog

回看这三个内容还是觉得自己很多地方没做好,只能是下次改进了。

苹果可还有设计哲学?从 iPhone 16 到 Mac,解构三十年苹果设计演变_9.ylog

By: Steven
9 September 2024 at 07:10

在 iPhone 16 发布之际,盘点了手机/Mac等产品线的外形演变史,设计哲学的背后,我们看到了产品理念、技术实力、组织架构也在决定着产品的外形。

03:30 – iPhone 16 设计解析:为什么「胶囊」形状摄像头和新增的按钮是在扶持 Vision Pro?为什么这一代的标准版大概率畅销?

手机设计盘点:为什么说「从 iPhone X 开始,手机的最终形态已经被确定了?」科幻电影中的「黑石」如何影响了 iPhone?

33:30 – 解构 Apple 历代产品设计:从 Mac/Watch 等产品线的外形变化背后,我们看到苹果的变化。Ive 在 2019 年的离去标志苹果设计的黄金年代结束了吗?为什么新一代的设计语言,藏在 HomePod、AirPods Max 和 Vision Pro 的 3D 编织材料里?

本期节目是和 脑放电波 的串台,推荐关注;也是脑放电波 Apple “Privilege”(苹果“特权”)系列的新一期节目,本系列旨在围绕苹果公司的发展历程和商业策略,剖析其在产品设计、品牌营销、供应链管理、隐私(及社会责任)等方面的种种“特权”,帮助你深入理解全球第一市值公司背后的故事,相关节目:苹果供应链迷思 / 苹果广告底层逻辑 / iPhone 15 和它的前任们 / 苹果零售店

欢迎在评论区留言发表你对本期节目的感受与看法。

|登场人物|

  • 主播:托马斯白 – 脑放电波主播,资深科技营销人,前XR创业公司CMO,科技媒体特约作者,养生爱好者; Nixon – 脑放电波主播,XR产品经理,前科技媒体记者,养生爱好者
  • 嘉宾:苏志斌SUiTHiNK – 资深工业设计师,电子行业产品经理,科技企业联合创始人,个人播客 荒野楼阁 WildloG
  • 剪辑制作:Kari,柒

节目中用到的音乐:来自 monkeyman535 的 90’s Rock Style,地址 freesound.org;来自 kjartan_abel 的 Berlin Town,地址 freesound.org;基于 CC BY 4.0 DEED 使用

|拓展阅读|

苏志斌讲解iPhone”无边泳池”及灵动岛苏志斌讲解iPhone 12、我们的标题模仿了李楠的文章 iPhone 可有设计哲学?

脑放电波往期节目精选(搜索关键词可收听)

脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注。

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

分享会文稿:Figma 3D 设计流程分享

By: 李瑞东
1 September 2024 at 17:18
分享会文稿封面,标题为 “Figma 3D 设计流程分享”,背景为渐变深色,中心位置展示了两个带有闪电标志的六边形图标,其中左侧图标是平面设计,右侧图标是3D效果设计,表明了从2D到3D的设计转换。

一、背景

现状

在新公司工作快半年了,我对这里的工作模式已经有清晰的了解了。这里的设计师不多,但每个人要负责多个内部系统的 UI 和交互设计。

有些需求方的系统本身业务不复杂,都是简单的增删查改,但希望自己的系统能够与众不同,让人产生眼前一亮的感觉;而有些系统里的功能交互逻辑比较复杂,不同状态、不同情况比较多,希望设计师出一个交互方案能够让功能简单易用。

按这几个月的工作情况来看,第一种情况对我来说比较棘手。因为我当时面试的岗位是交互设计师,所以心理上和能力上都没有预期是要接触这样的需求的,而现实是这种需求的占比还不少。

所以我在遇到这种要为某个系统进行门户网站的设计,或者将内部系统打造得光鲜亮丽的需求的时候,我会耗费比较多时间,以及进行很多的尝试。

想法

于是我就在想:需求方们都希望自己的系统能在一众的高度规范化和模版化的系统中脱颖而出,那么使用 3D 素材会不会是一个比较好的解决方案?

有了这个想法之后,我调研了下网上其他大公司的对外产品,看看他们在 B 端产品中的 3D 素材使用情况。

展示了四个不同 B 端产品的网页截图,聚焦于 3D 素材在这些产品界面中的应用。每个网页设计中都包含了不同风格的3D元素,用以提升界面的视觉效果和用户体验。

看了一圈下来,我得出了这样的规律:

  1. 3D 视觉素材在展示型页面用的较多。如官网首页,门户首页,登陆页等页面;
  2. 在后台界面中使用较少。但也会用在功能入口、状态反馈、背景装饰等场景。

结论

基于这个规律、现实工作中的情况以及小范围的尝试之后,我得出了这样的结论:

  1. 3D 素材在 B 端后台的场景使用的频率不高。恰当使用可以提升画面的丰富程度。但不必在此花太多时间。
  2. 如果遇到需求方要求该项目需要与那种高度模版化的后台有明显区别的时候,使用 3D 素材确实是能满足需求方期待的。

二、难点

由于我没有 3D 设计的能力,同时公司的需求密集程度也似乎不允许我们专门花时间为一些日常需求来渲染 3D 视觉图,所以在最开始我是通过在素材网站上面搜寻 3D 素材,然后直接应用在工作当中。

这个方法最开始很好用,我可以快速地完成需求,但用久了之后发现短板也很明显。

  1. 难以贴近公司业务。网络素材难以贴合公司内部的业务场景。大部份情况下只能找到通用素材,无法满足具体需求。
  2. 缺乏系列素材。即使找到一个合适的素材,但要找到同系列的其他类型素材犹如大海捞针。
  3. 侵权风险。网上找到的素材可能涉及版权问题,直接使用存在风险。
  4. 质量参差不齐。高质量的素材通常需要付费,免费的素材质量参差不齐,难以满足设计内部标准。

所以我得出了一个结论:

仅靠找素材的方式对我们帮助有限,不能完全依靠这种方法。

如果不能仅依靠找素材的话,这意味着我需要有 3D 设计的能力?

当初我得出这个结论的时候,心里感到一丝的恐慌:现在的工作强度,还哪有时间学习复杂的 Cinema 4D 或者 Blender 之类的专业 3D 设计软件啊!

展示了两款专业 3D 设计软件的标志,左侧为 CINEMA 4D 的标志,右侧为 Blender 的标志,表明了这两款软件在 3D 设计领域中的重要性。

然后我再往深处想了想,其实我需要的不是 3D 设计的能力,而是需要有获得 3D 素材的能力!意思是我不一定得会用这种专业的 3D 软件,但我要有办法获得想要的 3D 视觉素材,并且这个过程必须具备以下特点才能满足我的实际工作情境:

  1. 出图耗时短。因为实际工作中就是不值得在这方面投入过多时间。
  2. 风格高度统一。才能保证扩展性,以及系统风格的统一性,而这正正是通过找素材的方式没法做到的。
  3. 可定制程度高。指的是我要有办法定制 3D 素材里面的图像和元素,这样做才能确保产出物贴近实际业务,那用起来才有意义。

在想到这些东西的时候,刚好我了解到有一个叫做 Vector to 3D 的插件,似乎能够满足到以上三点需求,来提升我的工作效率和质量。于是我向领导提出这个设想,她也支持我去探索这个新工具。

这篇文章是公司内部分享会的文稿,记录着我当时探索出来的经验:如何利用 Vector to 3D 插件在 Figma 建立 3D 设计流程来提升我们的设计效率和质量。

三、通过 Vector to 3D 进行工作

插件介绍

这是一款付费插件,可以在 Figma 社区搜索并安装。

Figma 插件 “Vector to 3D” 的界面截图,展示了如何在 Figma 社区中搜索并打开该插件的页面,右侧为插件的操作界面,正在进行 3D 转换操作。

这款插件的 3D 能力分为两部分,全局配置项和当前物体配置项。接下来我将通过介绍这个插件的界面来简单介绍下这款插件。

对于全局配置项,我们可以在 “常规” 面板里配置视角和背景等参数、“渲染” 面板可以配置渲染质量、“光影” 面板可以配置灯光相关参数,如灯光数量 / 大小 / 位置 / 强度和颜色等。

Figma 插件 “Vector to 3D” 的界面布局设置截图,展示了 3D 场景的全局配置选项,包括渲染质量、光影和灯光编辑器等功能模块。

对于单个物体配置项,我们可以通过 “厚度” 或 “旋转” 等的方式建立模型,并使用 “细分品质” 提升模型的质量。值得注意的是,这个软件是通过将矢量图形挤压或旋转生成出 3D 模型的,不能像传统 3D 软件那样有多种建模方式(比如克隆、布尔运算或雕刻等)。

除此之外,该插件还支持配置材质参数,如粗糙度、金属度、折射率等。这些简单材质足以应对绝大部分的 B 端场景了。

Figma 插件 “Vector to 3D” 中单个物体配置的界面截图,展示了对 3D 对象进行具体参数调整的选项,包括材质、颜色、折射率等设置,并显示了材质预设的选择。

制作模版

这一小节会介绍两个该插件的功能,保存配置模版化

保存配置允许我们将当前画框内的视角参数、建模参数和材质参数等记录到该画框当中。下次打开编辑,或者分享给其他人打开的时候可以读取之前的配置,一键将矢量图形变成之前保存好参数的 3D 场景。

Figma 插件 “Vector to 3D” 的配置保存和读取界面截图,展示了如何保存当前配置到 Figma 图层中,以及如何读取预设配置应用到 3D 对象上。

模版化则是该插件与 Figma 原生功能联动的完美范例,也是高效产出 3D 素材的关键因素。

先说效果:插件会将当前物体的配置项(如厚度、位置、材质等)记录,然后用户可以将任意元素与该物体替换,并继承该物体的配置项。

这个能力极大便利了模版化生产素材。我们只要做好一个模版,然后无限替换元素,就可以生产出适用于各种业务场景的素材了。

方法很也简单,我们需要将画框设为组件,想要替换的元素也要作为这个画框组件内的子组件。(下面的例子中,我将圆球的底座作为可替换元素)

在 Figma 中将元素转换为组件的界面截图,显示一个半圆形元素和蓝色矩形被转换为子组件。

将这个画框组件拖一个出来,在插件中设定好 3D 配置并保存。

在 Figma 中保存 3D 配置的界面截图,左侧是一个带有粉色半圆的蓝色矩形组件,右侧展示了使用插件 “Vector to 3D” 后生成的3D圆球和矩形底座。

然后做出其他可供替换的元素,确保图层的数量、排序、命名与画框内的替换元素一致

在 Figma 中创建可替换元素的界面截图,展示了多个形状(正方形、圆形、星形)的组件。

最后我们在左侧面板中按住 Cmd + Option 将其他替换元素与画框内的替换元素进行替换,然后在插件中重新加载一遍模型,我们能看到新的形状也应用上原有替换素材的参数。

在 Figma 中通过 Cmd + Option 替换组件元素并重新加载模型的界面截图,左侧显示将圆形底座与矩形底座替换的操作过程,右侧为替换后继承了矩形底座样式的圆形底座。

这时,我们的模版已经制作成功了,后续只要无限制作替换素材,就可以获得无限的视觉素材。

实际应用

这里分享一个我在工作中实际应用的例子。我制作了一个生成蓝色 3D 玻璃风格图标的模版。

展示了一个蓝色 3D 玻璃风格的图标库,图标包括代码、星星、垃圾桶、点赞、分享、聊天气泡、下载、美元符号、闪电、心形、加号和引号等不同的图形符号。

这个模版中,图标和背景面板的形状均可以替换,由此可以生产出很多种变化,适应不同的业务场景。所以也可以积累成为素材库,供团队的其他成员使用。

同时,我也建立了一个色板,可以用于表达一些状态(成功、失败、警告等),或者用在不同颜色主题风格的系统内。这样我们的模版能产生更多的变化,适用到更多的场景中。

展示了一个色板图标库,图标包括红色、绿色和橙色的3D风格图标,符号包括感叹号、铃铛、叉号、T恤、星星、方向箭头、勾选、音乐符号、心形和播放按钮等不同的图形符号。

四、总结

上文介绍了 Vector to 3D 的界面使用、如何制作模版以及分享了我在实际工作中应用的例子,我们现在已经掌握了在 Figma 中进行 3D 设计的流程。文章的最后总结一下做这件事的优点。

1.学习成本低

可以将 Vector to 3D 理解为是一个简化版的 3D 软件,移除了像传统 3D 软件比如 Cinema 4D、Blender 里面的很多复杂功能,仅保留基础能力。

2.Figma 内完成全流程

用这套工作流程可以使设计师不离开 Figma 工作环境就能生产出不错的 3D 素材,并且出图后也能在 Figma 内进行简单调色。不需要像传统 3D 工作流程那样在不同软件里的来回导出导入。

3.可定制程度高

Vector to 3D 的特点是基于矢量图形生成 3D 模型,所以我们能轻松生产出业务相关的元素,使得视觉素材能高度贴近业务场景。

4.风格高度统一

Vector to 3D 能够与 Figma 组件能力联动。可以将灯光、摄像机等全局参数记忆在组件中,替换子组件也能继承原本的材质、位置参数。同时能够将这些参数模版化,无限产出相同风格的视觉素材。

这套工作流除了在我自己的实际工作中有成功应用,也成功影响到了团队中的其他设计师。在这次分享会过后,团队中有50%成员已经用在需求中使用该插件来生成视觉素材了。

五、非 Figma 工作流

最后看到这里的朋友如果当前团队没有在用 Figma 作为工作软件,或者并非 UI/UX 设计师也想试试通过 SVG 图形制作 3D 模型的过程,这里我贴 Vector to 3D 的网页版连接:https://www.meimu.design/vector-to-3d/

审美辨识力UP!如何像专业设计师一样,不被AI带偏?世界花纹与图案大典|非正常读物 vol.5

By: Steven
31 August 2024 at 19:05

如何建立起优秀的审美?很简单,多看好东西。

可是,什么是好东西?什么又是好的审美呢?

封面为通过 AI 用威廉莫里斯的风格所设计的佩利斯腰果花纹。

播放地址:

🎥 Bilibili https://www.bilibili.com/video/BV1XRsMevEhw/

🎥 YouTube https://youtu.be/179cZVweq3M

相关图片:

寻得一件欢喜的发簪

By: Steven
18 October 2023 at 00:24

日常佩戴的发簪,我并没有买一大堆不同款式换着搭配的计划,只想用一把顺手且符合当下心境的款式通配一切场景,最简化日常的盘发需求。

住院手术前就开始在网上物色合适的木簪,心想既然已经选择了夸张与出格,那索性以心为尺,外化于物,寻一个观照自己的镜。

反复挑选三周后,最终决定用凡叔的这把黑石簪,作为日常陪伴。

侠隐系列 · 黑岩 · 石纹簪

制器与设计,本是一体。

偶入这个小众圈子,发现用心造物的创作者,也是快乐。

PS:前两天学会了低盘丸子!

这下不影响戴帽子和头盔了👌

从《骄阳伴我》看职场新手如何进阶成创意大拿

By: Steven
12 September 2023 at 19:00
🎥 点击封面观看视频

跟着太太看了一集《骄阳伴我》,其中两个剧中桥段,非常适合分享给设计系学生和初入职场的设计师。于是,借着剧中的故事,谈谈我对于优秀设计师应该具备的两项素质:

见天地、下泥潭。

不涉及饭圈,没有广告,如果有不同意见,请理性讨论,也请勿攻击剧中角色和演员。

B站播放地址:https://www.bilibili.com/video/BV1hh4y1P7we/

随身听和冰啤酒,流行乐与热咖啡,谁来定义经典设计?非正常读物 vol.4

By: Steven
13 August 2023 at 15:21
🎥 点击封面播放视频,可以优惠价购买这本书

是什么,在炎炎夏日的晚上,让人获得一丝丝清凉与放松的呢?或许,是一段与友人的闲谈,或许是一罐啤酒?可是,你是否想过,为什么,装酒的易拉罐会设计成这样子呢?

🎥 点击播放视频

你可能没有意识到,易拉罐的历史,距今只有短短 61 年。

六十年前,由于消费者需要随身携带开罐器才能打开铝罐,这极大阻碍了初代罐装饮品的推广。自开罐的必要性是显而易见的,但在当时,该领域到处都是失败的原型先例。在一次野餐中,印第安纳州的工具生产商 厄尼 · 弗雷兹 不得不靠着汽车金属杠才打开罐头。经此困扰,他开始着手开发带耳片、可拉开的罐子。他创造了一个跷跷板机制,利用小杠杆,沿着预先半切划线的开口,撬开罐盖。他将小杠杆通过冷焊法固定在罐子的铆钉上,铆钉也使用罐子本身的材料。

他把这个创意,卖给了美国铝业公司。1962年,匹兹堡啤酒公司下了第一笔订单,订购了10万只拉耳罐。许多爱钻研的个人以及公司,继续改进他的发明。1965年,拉耳式开口被拉环取代。1975年,丹尼尔 · 丘德齐克 开发了不必拆卸的拉环装置。打开拉环即可畅饮的易拉罐,撕开了罐装饮料行业的巨大市场,也成为了美国饮品行业的圣杯。

🎥 点击播放视频

方便的工具,总是更受人们的欢迎。尤其是,成瘾性饮料。比起可乐和啤酒,人类更早开始了,对现制咖啡器具的工业化探索。

1933年,意大利人 阿方索·比乐蒂 设计出了摩卡快速咖啡壶。这款炉顶咖啡壶,自1933年首次亮相至今,仍然保持着它的经典设计。

这款壶由3个金属部分组成:用于煮水的底部胆舱,放置咖啡粉的过滤器,以及带有一体式壶嘴的咖啡液收集隔间。煮沸的水穿过咖啡粉,从中间管道顶部如涌泉般流出,一杯富含油脂的咖啡就做好了。

据说,比乐蒂在设计这款咖啡壶的时候,参考了当时的洗衣机。那会儿的洗衣机,由一个锅炉式的底座和顶部的洗涤盆组成。因为铝的导热性能,和多空隙的表面特性,既能快速把水煮开,又能维持住水温,还可以吸收咖啡风味,于是成为了摩卡壶的首选材料。

🎥 点击播放视频

如果说饮料的工业化平权,给人们带去了身体上的享受,那么,随身听播放器则是伴随着流行音乐的黄金年代,给人类带来了空前的精神滋养!

索尼的董事长盛田昭夫认为,人们在任何情况下都需要音乐。这款 1979 年诞生的 TPS-L2,它的外形尺寸仅仅比磁带略大一些,这种便携性,使它超越了不同的市场界限和地域文化影响,大获成功。

德国博朗的设计工作室与日本的极简主义,在索尼身上充分融合。小巧的体型与干净利落的造型,至今仍被津津乐道。

它最初的产品定位是青少年市场,因此在设计上,采用了类似蓝色牛仔布拼接金属色的涂装,并设置了双耳机插孔,以供两人同时靠近彼此。这使得它成为了当时乃至今天许多人心目中,一代经典的流行文化符号。

🎥 点击播放视频

考点众多的设计史,是我读书时期的噩梦。那么多陌生又拗口的人名,我从来都记不住。但是,工作多年以后,我渐渐意识到:

那些经典的设计,都是那个时代下的一次又一次范式革新。

设计史不是设计师史,也不是经典产品史。

当我关注一个设计时,我所关注的是人们如何使用它。人名和产品不是设计史,它们所对应的社会形态、人文环境以及生产技术水平,才是。

设计史是最简便、最低成本的索引目录。

对某个著名设计师的关注,其实远远达不到了解设计。站在宏观的角度去观察,一条已经梳理好的时间轴,就很有帮助。这条时间轴未必符合每个人对历史的认知,但由此发散出来,而关注到的无数分叉,会在日后形成自己的视野有着不可避免的重要性。

任何历史最终都是汇集在一处的。

人类史谈论人类如何进化、如何实用工具、如何创造了古往今来的生活。然而这些生活当中,却也并行着器物进化的历史。这些历史其实是同一部历史,关心设计的历史,就是在关心自己生活在什么样的世界里。

历史是人类的镜子,也是器物的根。

上万年来,人类无数次地重复着同样的错误,然而器物,却一直按照自己的节奏在进化着,从最粗糙的原型里诞生,伴随着人类不断地尝试,衍生出了丰富的世界。

这样的过程,怎么能不迷人呢?

设计史不是人名、地名,不是产品和公司的名字,它是人类和器物之间,相互扶持,纠缠不清的故事,是古往今来的人们,用对生活的热爱,所写下的诗。

在我看来,每一位设计爱好者、在职设计师,我们的案头上都应该至少有一本这样子的书。

做为一本观察世界的魔法目录,它是我们随手可得的一条又一条线索,每一次翻开,都能对我们所处的世界多一份联系和了解。

🌟从视频入口下单,会有观众的福利优惠券!

这次是为 中信出版社 推荐一本新书。这本书由 英国费顿出版社 编著,内容非常丰富。书籍主题专注于探索人类的创造力和想象力,其中包含了许多激发灵感的故事和实用的技巧。无论你是学生、艺术家、工程师还是企业家,这本书都会为你提供独特的思维方式和创造力的启示。通过精心编排的章节,书中详细介绍了各种创造力的来源,从观察自然到探索文化,再到引发思维火花的不同方法。而且,书中还包含了一系列的练习和案例分析,帮助你在实际生活中应用这些创造性思维的技巧。这本书不仅能帮助你在个人生活中拥有更多灵感和创造力,还可以帮助你在工作中更具创新性和竞争力。如果你对提高自己的创造力和想象力感兴趣的话,不妨考虑阅读这本令人兴奋的新书。无论你是专注于艺术、科学、写作还是其他领域,这本书都将成为你的灵感宝库。购买这本书不仅能丰富你的知识,还可以激发你的创造力,并为你的个人和职业发展提供指导和启发。(此段落由 AI 拓展)

🌟从视频入口下单,会有观众的福利优惠券电脑端和手机端都有对应的入口。

🎥点击这里,可播放相关视频

视频下方入口可以优惠价购买这本书。

镜头的变幻就是故事|Midjourney V5.2 Zoomout 测试

By: Steven
26 June 2023 at 00:18

➡阅读更多 AIGC 相关内容

最近一直都非常忙,所以连续 20 来天都没有碰过 Midjourney 了。前两天在社交媒体上看到,新推出的 V5.2 中有一个向外扩写的功能,因为此前已经在 PS+SD 的组合中见过这类拓展画面的应用思路,所以很想看看 MJ 的 Zoomout 能做出什么样的东西来。趁着端午假期这个空档,我集中跑了几波测试,有一些小小的心得,在此记录一下。

总体结论有三个:

1、Zoomout 可以无限次数地向外扩展,但随着镜头的拉远,Midjourney 自身的联想能力并不足以做出任何有意思的画面,不刻意控制地放大出来的画面,到了第 3~5 步之后,就会明显变得乏味和缺乏美感。

2、通过刻意地控制画幅比例、扩张倍数,以及针对性地调整 prompt 的描述,可以利用这个功能讲出有意思的故事。关键在于,使用者对于「镜头语言」的理解,以及对运镜和故事之间联系的掌控程度。

3、对工业设计的辅助甚微,做点「花活儿」可以,一旦涉及到逻辑,依旧不行。

Zoomout 功能的主交互界面

测试内容目录:

1、通过默认的 Zoomout X2 按钮连续放大 3 次

2、通过默认的 Zoomout X2 按钮连续放大 15 次

3、通过自定义 Zoomout 微调构图

4、通过自定义 Zoomout 构建人物画像

5、通过自定义 Zoomout 构建人物性格

6、通过自定义 Zoomout 完善场景氛围

7、在 niji 中应用自定义 Zoomout 构建人物和场景

8、自定义 Zoomout 构建情绪与故事

9、通过焦点变化构建故事的场景

10、通过镜头变化,构建故事的起承转合

以下为部分测试过程记录:

test case no.1:通过默认的 Zoomout X2 按钮连续放大 3 次

⬆ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 3 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:在奔跑的场景中增加了后方的人,有一点点故事性,但继续放大后会明显失焦,花面焦点始终在最开始的小女孩身上,继续放大生成的场景和人物都是模糊的。

test case no.2:通过默认的 Zoomout X2 按钮连续放大 15 次

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 15 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:外围拓展的场景越宏大,有效信息和故事性就越低,除了在阴影中无意间冒出的人影,没有任何惊喜和意料之外,拓展的画面也很单调乏味。

test case no.3:通过自定义 Zoomout 微调构图

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:不对 prompt 进行修改,按 1.1 和 1.2 的拓展比例小幅度调整画幅。

输出成果: 初始图像是近景特写,根据图像本身的特点,对画幅进行小幅度地微调来获得完整的全景镜头,以及合适的构图比例。

test case no.4:通过自定义 Zoomout 构建人物画像

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个黄色漩涡图案,然后拓展时改写 prompt 为一只眼睛,进而生成一个带特征的面部局部画面,再次拓展时修改描述词为一个洞穴中的原始部落男性。

输出成果: 成功构建了一个有目标特征「黄色漩涡瞳孔」的男性角色,通过控制拓展比例以达到最终效果—-人物整体和局部特征均得以完整呈现的画面。

test case no.5:通过自定义 Zoomout 构建人物性格

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个红色皮夹克的女性胸像,再改写 prompt 获得其坐在摩托车上的局部画面,再改写画幅比例获得完整的人物与车辆的全景照。

输出成果: 成功构建了一个有目标特征「红色皮衣+摩托车」的女性角色,通过控制拓展比例以达到最终效果—-人物细节和整体氛均衡的画面。

test case no.6:通过自定义 Zoomout 完善场景氛围

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:在初次生成的几批图像中,选择合适的画风和画面主体,再根据已有画面特征修改画幅比例。

输出成果: 在选定风格和主体后,将竖幅主体拓展为气势更足的全景影像。关键是拓展比例并非默认的 2 倍或 1.5 倍,而是根据实际需求来控制比例,同时也需要关注怎样的画幅比例可以传达对应的氛围。最终图像画幅比例是 3:1,适合展现有足够细节的宽幅场景。

test case no.7:在 niji 中应用自定义 Zoomout 构建人物和场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、使用 niji 5 的 style original 生成一个细节丰富的初始人物;

step 2、以 1.2 的 Zoomout 比例纵向拓展出人物的半身画像,画幅比例是 1:2;

step 3、以 1.1 的 Zoomout 比例和 2:1 的画幅比例重构画面,得到外围场景;

step 4、以 1.2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成人物全身像;

step 5、改写 prompt 添加「宫殿」关键词,以 1.65 的 Zoomout 比例和 3:2 的画幅比例重构画面,生成人物在场景中的全景画面。

输出成果: 虽然人物细节和场景氛围的融合程度还不错,但因为漫画角色的细节较多,在多次 Zoomout 的过程中,场景的丰富会逐渐抢掉中心人物的视觉焦点。因此在每一次修改画幅比例与关键词的时候,需要多加注意对视觉元素的控制。

test case no.8:自定义 Zoomout 构建情绪与故事

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个情绪和神情符合目标的初始人物;

step 2、改写 prompt 同时添加「马」关键词,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成后续画面的基础,此时需要注意人物与马的位置关系,否则后续生成的画面会非常扭曲怪异;

step 3、以 1.05 的 Zoomout 比例和 2:1 的画幅比例重构画面,生成完整的马匹造型与部份环境信息;

step 4、对比改写 prompt 产生的变化,黑发组不改描述词,以 1.1 的 Zoomout 比例和 3:4 的画幅比例重构画面;白发组添加「巨大镜子」关键词,以 1.6 的 Zoomout 比例和 3:4 的画幅比例重构画面。

输出成果:通过控制 Zoomout 的幅度、画幅比例和 prompt 的调整,可以生成指定场景的画面,且人物的神态到位、情绪饱满,整体画面焦点清晰。但美中不足是,构图不够自由。

test case no.9:通过焦点变化构建故事的场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个在河岸上的粽子;

step 2、修改 prompt 为「熊宝宝正准备吃粽子」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面;

step 3、修改 prompt 为「小熊一家在野餐」,以 1.2 的 Zoomout 比例和 4:3 的画幅比例重构画面。

输出成果:通过对 prompt 的修改,控制 Zoomout 的幅度、画幅比例,可以改变画面中的焦点和表达主题,适合不同文化元素之间的混搭。

test case no.10:通过镜头变化,构建故事的起承转合

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一幅鲜花山谷的画面,人物要明显;

step 2、修改 prompt 为「一面巨大的镜子在草地上」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,此处竖构图是为了生成较高的全身落地镜;

step 3、修改 prompt 为「少女站在镜子前」,以 1.5 的 Zoomout 比例和 3:2 的画幅比例重构画面,改为横构图是为了囊括少女全身以及环境信息。

输出成果:通过改变画面中的焦点和增加元素,在镜头逐渐拉远的过程中,故事缓缓托出。

➡阅读更多 AIGC 相关内容


我的整体感受是:

通过 Midjourney V5.2 的 Zoomout 无限拓展,一次次修改画幅比例、提示词内容,可以用镜头语言的变化来讲故事了,也可以基于一些初始的「点子」延展成有意思的融合作品。但越是这样,越发显得对话式、指令式的交互界面( SD 那种也不算图形交互 )的局限太大了,我很希望今年之内能发展出图形交互界面。

没错,今年 AI 的爆发指向了一个新的趋势:对话式交互界面。但人类之所以发明绘画,开始通过设计图来制作各式各样的新工具,恰恰就是因为语言本身的效率太低。这个逻辑其实也可以从媒体形态上找到端倪:文字–> 图像–> 视频。仅仅依靠对话,我们无法构建出一个一把剪刀;仅仅通过语言表达的播客,也无法传达任何需要视觉才可以精准理解的信息。对话指令的交互界面与图形交互界面之间的关系,并非只是 dos 和 windows 之间的差异,更重要的点在于,后者可以更直观地完成交互,以及精准地进行创作行为。AIGC 的重点不仅仅只是 AI,而是我们如何使用 AI 进行「Generative Content」。

我说一句话,AI 给我一个东西,这不是创作。

创作是一个生命在主观意志的驱使下,刻意的、有目的地表达其心中所想。

因为 GPT 的爆发而说对话式交互是未来,这样的断言是过于冲动的。只要是一个严肃的创作者,就会立刻意识到,真正的创作一定需要多纬度的交互界面。这其中不仅仅包含对话指令,同样更需要图形界面以及在数字虚拟空间中的三维交互。AIGC 工具与 PS、表格、PPT、思维导图等已有工具的结合,就是这类多维交互的雏形。

那一刻,我们不会等太久。

➡阅读更多 AIGC 相关内容

两年内 Apple Vision Pro 不会出现杀手级应用|设以观复 番外篇 Vol.2

By: Steven
9 June 2023 at 19:05
点击封面到 YouTube 观看视频

点击这里到 bilibili 观看视频

这期视频是一期比较随性的闲聊,主要从产品、设计、混合现实三个角度,谈谈我对 Apple Vision Pro 这款产品的看法。因为几乎都是独白,所以也可以当作一期 podcast 来收听。

以下为文字大纲:

先说我的观点:苹果选择了一条更艰难的路线。但只要「不做缸中脑」的价值观继续贯彻,这款产品的生态和迭代就是非常值得期待的。但是,它不会取代iPhone,它的目标也不在此。从它的产品定义来看,恐怕还有一个更大的 one more thing 在等待发布。

关于产品

1、不是VR!太好了!

2、之前的预测基本都对了:一体机、眼手控制、层与深度的交互、空间建模、空间音频、LiDAR 人脸建模。技术路径的连贯性。我之前说 M2 芯片单独划出了图形引擎,可能是有手势操作的考虑。但当时我还觉得,可能得要到 M3 才会实装,那是我低估了苹果,从各方体验的反馈看,M2 处理手部操作已经非常强悍了。这样子的话,M3 就真的不着急了。

3、从各方体验的反馈来看,初代产品的完成度非常高。但第一代产品很显然不是面向消费者的,从售价和硬件配置来看,都是给开发者的入场券:「想在下一个时代展示你的才华吗?加入我们的开发平台吧!」所以,买不起没关系,因为不用买。虽然,它有初代 iPhone 的感觉了,但很多人不免怀疑是不是要等三四代以后才堪可用?我到觉得不用那么久,因为软硬件的完成度已经是接近 iPhone 4 的状态了,也就是说,它先奠定了空间交互的完整逻辑和操作体验,硬件也足够强大。要知道,iPhone 初代除了大屏幕和多点触控,几乎没有一样拿得出手的东西,但它的交互设计改变了整个时代。所以 avp 剩下需要做的,就是把软件生态做起来。以苹果今天的开发者号召力,软件神态会比 iPhone 初代更快达到 4 代的状态,这个过程会更短。

4、发布会时,我第一处惊讶的地方,外部屏幕显示实时的眼神:你看着它,它也在看着你,实时计算双方关系。之前的观点:空间重建,让设备认识世界。因此设备下方有大量摄像头,用于捕捉用户手部的精细动作,这种程度的认识现实世界,是 avp 空间交互的基础。

5、我之前说过,头显设备不会替代手机,它的续航、应用场景、对空间的要求以及使用方式,都不会是一台手机这样的随身电子设备。这一点,我们从后续的官方设计原则上也能看到苹果对这件事的理解。人是在室内、坐着使用的。因此续航在现阶段并不是问题,它可以连接常电来使用,和我们的任何一台桌面显示器一样。苹果甚至不建议开发者去设计界面还原的操作,因为它们直接在系统内处理好这件事,你换个座位、换张沙发、换张床后,设备自己识别环境来让你视野内的界面回到合适的位置上。

6、官方设计建议,移动时从沉浸空间中淡出,稳定下来后再回到沉浸空间,这也是官方在主动表达,坐下来、在固定的空间内使用。一方面,这是创造沉浸感的条件,另一方面也是考虑到人身安全,在虚实结合的环境里快速地移动或手舞足蹈是很容易弄伤自己的。因此,我们在用现有的 vr 产品时都会有划定安全区这个操作。

7、杀手级应用?很多人说「3D照片/视频」,但我不觉得这个有足够的吸引力。它确实可以提供新的、生动的体验,但要成为「杀手级应用」,需要足够的便利条件。手机摄影之所以可以动摇传统摄影,是随身携带和随时按下快门。但 avp 的拍摄,更类似无人机视角,是一个你需要这样的视角时,才会需要的东西,它不够便利,不够快。avp 真正的的杀手级应用一定不会在一年内出现,甚至是上市后的一年内也不一定有,它需要开发者和时间一起酝酿和探索。况且,比特与原子的融合,还需要很多后台的工作来完善,比如更大的世界模型,或者催生出新的需求场景。总之,独属于这个平台的杀手级应用,一定诞生在基础建设更完善的时机。

工业设计和交互设计

1、现有产品的大融合吗?在我看来,它更像加大号的 aw:如出一辙的曲面玻璃盖板,复杂的曲面贯穿铝合金机身和玻璃,有机的整体轮廓搭配编织物绑带,贴身部分全部由织物和硅胶材质构成。这就是苹果这几年做手表和耳机的过程中总结下来的,穿戴数字产品的设计原则。avp 上的所有细节,都能在 aw 和 app 上找到对应的处理方案。

2、可以说,继铝合金后,另一个材料探索的方向:织物。亲和力、强韧、富于变化,很适合穿戴式计算设备的设计。这类材料是传统工业设计师并不熟悉的,通常只有部分家具设计师和家纺类产品的设计师会接触到。但是要注意一点,编织物是一种复合材料,它不仅不是塑料、金属这类单一实体材料,它甚至可以是不同种类材料的混合编织,因此可探索的边界,以及可变化的范围,是具有很大想象空间的。这类材料师师会比我了解,看看她有没时间出些视频给大家讲一下这类材料的设计。许多年前的宝马概念车和“大白”,都是柔性材料在科技领域很好的启发。我觉得,这是苹果在工业设计上的进一步探索,也将会带来产业链上的变化,类似氧化铝合金的普及,设计师和产品经理可以关注。

3、所有界面片层化、小组件化,所以小组件可以交互了。在分析灵动岛那条视频里我就说,它是中间交互层在 Face ID 上的具体结合。现在再看 avp 的交互,尤其是应用边缘的交互菜单,是不是很自然地从已有的交互习惯转移到新的空间交互里来了?

4、与 iPhone 初代的拟物化界面类似,AVP 采用了和现在 Mac 一致的界面布局和风格,帮助用户和开发者尽快适应新的空间交互。但是,界面风格其实从 iOS7 开始就固定了,毛玻璃一方面是让界面与环境保持良好的光照、氛围的互动,也能让更多层的展开显得自然。值得注意的是,在设计时,设计师和开发者不需要自己做出立体的分层效果,只需要做好平面的分层,毛玻璃的立体分层效果,是系统来处理的。这些协助和预设不起眼,用户也不会注意到,但对于开发者来说是非常有帮助的,它们不仅规范了所有应用的整体品质,也减轻了开发工作量,让更多人愿意为这个生态去做更多的尝试和探索。这也是护城河的一部分。

5、一个细节:设计原则中建议,层窗口不应跟随视线,而是锚定在现实中的固定位置。换言之,作为设计师和开发者,是可以选择跟随或锚定的。据我了解,把虚拟物品和界面锚定在现实中,是一项比较复杂且难度较大的技术,非常容易因为抖动而破坏沉浸感。这是由于细微误差的累积造成的技术问题。我们目前不知道苹果的技术实现方式,但如果明年上市时看到的确实是稳稳锚定的界面,那这背后的技术储备其实是相当深厚的。

6、观看的内容放大放在远处,操控的部件放在近处并且较小。这里用到了一个符合直觉的设计逻辑:电影、模型、网页这些被观察的对象,应该与人保持距离,和显示屏一样,而操控部件应该在离手较近的地方,方便你的视野锁定并操作,和键盘鼠标触控板一样。

7、苹果对层级的设计有建议,新元素出现时,已有界面和元素应该向后退一些,确保主次关系,保证良好的视觉重心体验。但这个尺度所以所有开发者来说都是比较难把控的,后续的设计规范中应该会有系统层面的自动化方案,不需要设计和开发去重新考虑。

8、设计建议中有一项比较值得注意的,是声音。苹果说你可以让界面的声音从前方传来,也可以四面八方,或者某个指定的角度,这取决于你的应用怎么使用、怎么设计。这一点之所以要重点关注,不仅仅是它有空间音频,更重要的是在空间计算的设备中,声音其实已经是整个UI的一部分了。你对应用的体验、理解,以及交互,都将与空间中的声音紧密相关。因此,参与了这款产品开发的苹果前员工也在推上强调,声音的体验是极少人关注、但极为重要的事情,而这款产品会给人巨大的惊喜。我想,所有设计师和开发者都应该注意这件事。

9、通过最简短、清晰的标签和符号,指引人离开、退出。这不仅仅是 UI 规范的事。因为在沉浸空间内,指引不明确是会比操作电脑、手机,更容易感到困惑、惊慌或愤怒的。在你想离开时,眼睛看向标签,锁定,确定,这种确认方式既符合直觉,也给了人可以随时退出的安全感。

10、因为选定完全依靠眼球追踪,所以为了确保准确度,苹果在设计规范中也提到,按钮的实际可控面积是比按钮本身的面积更大一些的。这里我要补充一点,人眼的活动本身并不是完全线性的,在慢速运动时,其实是一顿一顿的,只是大脑算法弥补了这种抖动。因此,在盯着界面看的时候,人眼实际上就处于这种慢速抖动的状态,眼动追踪也会检测到这种眼球抖动。所以,无论是因为算法矫正,还是优化选择容错率,这种选定范围大于实际面积的设计原则都是必须的。这在触摸屏的交互上,也是很常见的规范。但苹果规定一个按钮至少要保证 60 像素的面积,那就是说,它的眼动锁定范围的极限,大概就是在 60 像素这个区间左右。这一点,在推远玻璃面板时,会自动放大的轮廓也有所体现。因为如果跟随距离缩小,会导致后层界面的交互精度下降,造成系统不可用的问题。至于选定具体文字的精准操作,根据前员工的披露信息,我个人猜测,是由传言中的「眼部脑机接口」的「读心术」来辅助完成的。这件事可以以后再跟进确认。

疑惑

1、交互的力反馈怎么处理?对体感游戏很重要。会有单独的游戏配件吗?

2、混合现实游戏的玩法:不是复原现实游戏,应该是现实中玩不到的玩法,比如巫师棋、游戏王。这样的话,其实也不需要力反馈了。

我对于 XR 的一些看法

1、选择了「不做缸中脑」的价值观,很棒!

2、增强现实和人的链接,是融合,不是制造一个虚拟世界代替。iPhone X 发布的时候,我曾写文章说,需要有边框来界定虚拟和现实的边界,因为沉浸感越强越需要清晰的退出机制,人才会有安全感,才更愿意用。这是交互设计要死守的底线。果然,苹果选择用数码表冠来切换融合程度,而且,这是一个实体旋钮,是唯二的实体操控部件之一。可想而知,其优先级和对交互体验的重要程度。

3、因此,是「多一个」,不是替代关系。但说实话,我对人性没有那么乐观,当其生态足够完善后,肯定会有多数人主动选择待在里面的世界。届时,不仅仅是手机被替代,而是连同电视、电脑、大房子、电影院、足球场这些东西,统统都会被吸引这个黑洞里。

借行业科普聊了一次 AI 与设计师的关系

By: Steven
5 April 2023 at 14:53

上个月去上海之前,@取景框看世界 在微信上邀请我一起做一期关于设计行业的科普视频,面向学生群体做一次对行业整体状况的分享。这次是 B站 向他发起的约稿,也是他频道的主要内容类型之一。答应他后,从上海回来我就根据自己这么些年的体会和反思,录了一期比较掏心窝的内容。由于参与的人比较多,直到前天,节目才终于上线。

🎥 点击图片跳转到播放页面

因为参与的人数比较多,我说的话也比较多,所以在汇总的成片里需要剪掉一些。但我又觉得难得录一期视频(从去年11月到现在都没有更过视频了),为了保证表达的完整性,我还是得有一个自己的版本。但因为实在忙得顾不过来,于是麻烦 @小雨 帮我把这条视频剪了出来。

毕竟是 @怪物尚志 的御用摄影/后期,有他的帮忙,我的视频里头一回多了许多配合文案的动画,比我一个人在镜头前单口相声好看多了。这一期花絮,也在昨天发了出来,跟正片错开一天。

🎥 点击封面跳转到播放页面

这期视频的封面是我昨晚用 midjourney 画的。

在这条视频里,除了科普工业设计的一些基本概念和行业现状,我也特别聊了一下 AIGC 和设计师之间的关系。前两个月虽然一直很忙,但我也一直在关注 AIGC 的动向。这两个月的变化实在是过于惊人了!

以下是我去年八九月用 midjourney 画的一些东西:

然而在这短短半年内,版本已经从当时的 v3 发展到了现在的 v5。ChatGPT 也从 GPT-3 发展到了 GPT-4,坊间传言 GPT-5 的研发已经完成且爬完了全网所有视频,可以直指某一条视频中的某一段话,只是还没发布。可以说开年后的这两个月内,AIGC 的发展速度已经大大超乎了预料,甚至正处于失控的边缘,它们正在开始颠覆一些东西。将来会发生什么,无法预料,但一定有什么事情已经在发生了。

所以我觉得,无论如何,再忙也得重新用起来。光是跟进各种新闻和消息是不行的,midjourney 前两天刚发布了由图片转译成 prompt 的新功能,多模态的 AI 已经不远了,这会更进一步推动人和 AI 之间的交互。我觉得,自己还是得保持使用状态才行。所以前两天我又重新充了值,开始体验它的新版本。

我先试着画了一些机甲的东西,例如这样的:

上面的两张的用 prompt 直接生成的,但下面的两张,是用 /remix 命令修改了部分描述词后的新图。可以看到下面的图和上面的图保持了相关性,于是我想试试,如果用这个命令替换背景会是什么效果,于是有了这组车的图:

上面的两张图是用 prompt 直接生成的,当我用 /remix 替换了背景描述的 prompt 之后,就生成了下面的两张。更换环境之后,车辆的姿态和镜头视角几乎没有变化,车身的反光与环境之间的关系也很自然,这个效果已经可以说非常惊人了!

然后,我随便画了一些白色的机器人站在燃烧废墟上的场景:

用 /remix 替换了机器人配色部分的描述词后,生成了下面这样的图:

对 /remix 有了基本的体感之后,我开始尝试用 /blend 命令来做一些融合的实验。

首先,我随便描述了一个赛博少女,得到一些随机的图:

接着,我再随便生成一个红发少女:

材料准备好之后,开始把它们进行组合。

第一次先尝试融合两张图,一个是游戏画风的机甲人,一个是二次元的赛博少女。

它们俩合成后,得到了以下这个人物:

新角色具备其中一张图里人物的长相特征与体态,也有另一张图的配色和机甲特点。虽然得到的结果具有随机性,但既然可以这样融合,那么应该也可以通过 /blend 命令来得到一些更有目的性的创作。

有了第一次的体验后,第二次我用三张图片进行合成:

图一是现画的半透明金属机器人,图二是上面准备好的红发少女,图三是现画的骑士。

这三个合成出来的新角色,同时具备了细碎的金色细节、波浪红发、银白色盔甲:

但这不是我想要的,我想试试加大红发少女的比例。在垫图的方式下,可以通过 –iw 命令来分配各个图片之间的权重占比,但是在 /blend 中不能这么操作。于是,我想通过把合成的新图作为素材,再一次与红发少女进行融合,并加入机甲的元素来强化她身上盔甲的质感。

二次合成使用的图,如下:

合成出来的新角色我非常满意!

她既有红发少女面部和眼神的特征,又把两副银白外甲融合得非常优雅,也保留了初始半透明金属机器人遗传下来的金色金属关节的特征,又做出了图三机甲的坚硬感和图一外甲的银白光泽。这一次的融合很成功。

但如果 /remix 可以局部替换特征,那么这些没有写 prompt 而是通过 /blend 直接合成的图,能否通过 /remix 加入新的 prompt 来修改已有的特征呢?

为了让实验效果明显一些,我想让盔甲的白色部分比例缩小,增加金属部分的比例,于是就先把这批图重新刷了几遍,直到出现肩甲是金色的变异版本:

然后不断在此基础上进一步变异,强化金色肩甲的特征:

所有图片均可以点击放大下载原图

准备好之后,我在 /remix 中添加新的 prompt:pink armor

以下是修改特征后的结果:

所有图片均可以点击放大下载原图

整体的效果我还是挺满意的。一来,新生成的人物很好地保持了最初红发少女的眼神和神态;二来,金色金属被替换成粉色金属后,金属质感的表达是正确的。虽然头发也一起变成了粉色,这确实是没完全理解指令,但原有的发色搭配新的粉色盔甲也确实不是很和谐。

到此,重新开始用 AIGC 工具的热身完毕,找回一些感觉了。

至于这期视频封面里用到的车图,是我昨晚用 Maserati 和 Ferrari 以及 Apple 和 Tesla 分别杂糅出来的缝合怪。虽然乍一看好像没什么新奇的,但是如果我把去年八月底用 midjourney 画的汽车拿出来对比,就会意识到这是多么疯狂的进化速度了:

上面三个是去年八月用 v3 画的车;

下面这些是昨晚用 v5 画的车:

所有图片均可以点击放大下载原图
视频封面使用的图片
所有图片均可以点击放大下载原图

虽然工业设计有大量的细化和落地工作是 AI 无法干的,但从目前来看,无论是 midjourney 还是 Stable Diffusion + controlNET 都已经可以很好地帮助设计师完成概念发散和快速枚举了。这样的图像质量,通过垫图、remix 和 blend 的组合使用,完全可以在创意初期快速拉出一批高质量的「草图」,设计师可以把更多的精力放在对方案思路的推敲、对细节的考据以及各个环节的沟通协调上。

从今年二三月开始到往后的十一二年,人类社会将迎来一场以破坏为开端的变革和创新。

无论我们是否愿意,都将一起进入新的世界。

AI 会促使设计师成为更完整的人

By: Steven
28 March 2023 at 00:32

最近关于 AIGC 的关注度太高了,自己也时不时会抽空去了解一些情况,或者尝试去用一些工具。很多关于 AI 要替代人的观点大行其道,也一直有不少 AI 要让设计师失业的看法在坊间流传。但我自己的感受和看法是:

在 Midjourney、Stable Diffusion、ChatGPT 这些 AI 工具出现后,「手头功夫」并没有因此丧失意义,它们只是不再具备作为门槛的价值,但依旧是重要的前提。因为「手头功夫」是培养我们发掘问题、判断优劣和快速取舍的重要训练,缺少这部分锻炼,会让人在这一系列 AI 工具面前感到无力。准确地识别问题并提出诉求,这是未来教育的重中之重,也会反过来强调人的价值。

正好,前段时间后浪送了我一本书,是前微软包容性设计的首席总监 Kat Holmes 写的《误配》。一边看这本书,我就一边在结合自己的工作和最近关于 AIGC 的思考,我觉得这本书里提倡的理念,正好回应了当下的舆论思潮。

大部分谈论设计的书,都在试图通过图形和案例来构建一类理论和范式。但在这个 AIGC 日进八万步的新时代里,设计师要以什么身份来参与?我认为所有的既定范式,都会在三到五年之内被全部击碎。串联、融汇、杂交才是新世界的主流,创作者的身份将愈加模糊,甲乙方的界限也会逐渐消失或扭转。怎么回应这样的快速变化?我觉得《误配》这本首版于五年前的「旧书」,提出了很适合当下思考的母题:

设计行为、设计师、设计对象以及新技术之间,如何在智能化浪潮里,互相包容和一起进化?

这本书没有给出直接的答案,但对于有三年以上工作经验的设计师而言,带着经验、问题和困难去阅读,会有启发和收获。「物」的旧体系正在溃散,「系统」和「生态」将是历史的新主角。旧时代的残党,可以下船了。

昨天在各个社交媒体上发了一下自己的读书感受,因为被后浪的微博官号转发了,于是被这本书的译者何盈女士注意到。正巧我的朋友宋喆在刷朋友圈时看到她的这条寻人启事,就这么阴差阳错地跟她直接联系上了。

这种「地球村」的感觉很妙!

这更坚定了我今年一定要 重新启动设计纪录片 的决心了!

如何评价 frog design 上海工作室近况?

By: Steven
24 March 2023 at 23:53

水土不服,frog 不是第一个,也不会是最后一个。

前些年分别跟另外两家跨国设计集团的中国工作室接触过,他们在国内的思路大体上分为两类:

1、觉得中国设计师很便宜,作为劳力消化因为业务增长但原有团队处理不完的工作;

2、挖中国设计公司的资深人员,连带客户资源一起挖走,靠跨国牌子吃掉国内业务。

对于第一种,必然人员极不稳定,因为国内做得好的那些设计公司和产品公司会比这些跨国公司有更多本土优势。语言、业务量、供应链、圈子,跨国公司除了在行业圈子内牌子响,没什么直接优势。很多甲方其实都不认识这些知名设计公司。每年吸引一些刚毕业的年轻设计师去劳碌一两年,基本上留不住有生力量,全靠一两个上年纪的外国设计师顶着。这种本地工作室会带得很累,看上去是利用了廉价劳力,但也因此一直在日复一日地充当学校的角色,效率始终上不去。加之不少国内的公司都已经能给出远高过他们的薪资了,那还有多少年轻人愿意留下呢?

第二种就更离谱了,如果你已经是比较资深的乙方设计师,手里又有客户资源,还会给他们打工吗?能力和资源都是你自己的,国内的客户现在也并不迷信外国和尚的经,那这套商业模式就没法儿跑得通。更何况现在国内的设计公司,无论是沟通效率、对产品和商业的理解、对市场的熟悉程度以及串联各类资源的能力,都已经把市场上能做的大部分客户都做得差不多了,这些外国公司不大可能分到足够维持运营的业务量。

以上是跨国设计公司在中国碰壁的部分原因,但我前几年从设计公司体系里离开,还是因为这个业态本身的根源问题无解。与其问为什么 frog 关闭上海工作室,不如仔细审视一下设计公司这种业态。正在陆陆续续关闭的,不仅仅是跨国设计公司,许多国内的设计公司也在不断收缩或关门,早有体感的那些优秀公司也在近几年纷纷转型。

设计在未来会越来越重要,这已经被很多公司注意到了,但不会是以卖服务的形式。

原文链接:https://www.zhihu.com/question/591582966/answer/2951740181

任何颜色都不属于任何性别

By: Steven
8 March 2023 at 13:23

经过了持续大半年的劝导,太太终于同意我给她换一台新手机,用来替换掉手上这台已经被生活摧残得不灵光的旧手机。一开始她很不愿意,一来觉得还能勉强接着用,其他开销的优先级都远高过于她自己;二来也是从小到大被上一代人灌输的那种「自己不配」的心态,总说算了算了。直到最近聊到自我能量的进出,她才终于把自己的优先级往前挪了挪,我也才有机会给她换新。

挑型号的时候,为了避免她有价格上的心理压力,也因为她多次强调不要高配置,加上她大部分的使用场景里没有很明显的电量焦虑,所以我推荐了 iPhone 13 mini 给她。她之前也在店里上手试过,小巧的手感和屏幕尺寸都很合适。尤其是把 mini 和现在用的 7P 放在一起时,mini 这个与 6s 相当的体型里装着和 7P 一样尺寸的屏幕,平衡的尺度是拿捏得相当好的。

于是她同意了。

上周一看了下取货信息,显示深圳益田店里没有现货,要从广州寄过来,于是我就计划周五再下单,周六可以直接寄到家里。但周五我再看的时候发现,已经变成了店内有现货,于是我果断下单,趁着中午休息的时间直接去店里提了。

为什么选白色?

其实一开始也看了别的颜色,曾经犹豫过红色、粉色和绿色。但实际看下来以后,一是觉得这一款的红色不够正,绿色又偏黄有军绿色的感觉,粉色又太淡了,质感不足;二也是觉得为什么女生非得是红和粉呢?所以最后,按照实际的颜色表现,挑了她觉得真机表现最好看的白色款。

其实她之前的 7P 也是黑色款,并没有选那些所谓的女性颜色。

这也是我多年来对一些数码厂商的做法表示高度质疑的点:女性一定得被特殊处理么?

如果女性就得用女性手机,那么从逻辑上来说就应该有所谓的男性手机。可是,我们从来没有见到过哪个厂商会这么做产品和宣传,唯独把女性作为一个单独的点拿出来营销。当我们习惯了「女生是粉色,男生是蓝色」的时候,其实忽略了在一百年前,蓝色是女性的颜色,而男性是拥有红色的。颜色和性别的关系,完全是被文化构建出来的,是纯属虚构的产物。

任何人选择一款产品,应该是基于自己的需求,而不是被文化构建,更不该被消费主义用概念绑到某个象征的座位上。设计师在考虑产品的时候,重点的也该是产品如何满足场景中人的需求。人与人之间客观的差异应该被看到和重视,但为了细化市场而刻意构建差异以降低设计的包容性,这是不该鼓励的。

至少我们可以从挑选颜色开始,把「粉色适合你」换成「你喜欢哪个颜色」。

真是好没礼貌的前辈啊!

By: Steven
8 March 2023 at 00:29
《中国设计趋势报告2022/2023》第21页

自己创作的内容被富有影响力的前辈「引用」了,是件挺开心的事!但妙就妙在啊,是以我完全不知情的方式发生的~咱们这个设计趋势就还挺喜剧的~

但各位品牌的 PR 同学们,你们有 feel 到 fo 我的观众/读者是怎样的一群人了吗?多值啊!堪称性价比好吗!

有没有设计师出身的脱口秀演员来把这段子写一写?

很妙的是,这本书的主编黄晓靖就和我在同一个微信群里,她也有我的微信,但此前无论是B站的私信还是微信,都没有跟我打过一声招呼。一张截图我也不会收你钱,但打声招呼询问一下这么基本的礼貌,不该是什么难事儿吧?何况是一套如此高价的设计行业出版物,是不是更应该多些严谨和礼貌呢?

随意盗用是种习惯么?当然了,主编不会跟踪到那么细节的事宜,不知道也可理解。但如果已经在行家云集的群里当众@ 你了,我话说得也还算客气,却一夜保持静默,emmm,就有点…… 挺没礼貌的了。

挺好笑的!

尤其是这种行为和书名搭配在一起的时候。

真人 cos AI coser 的 cos 照,不远了。

By: Steven
17 February 2023 at 19:29

摄影把「画得像」逼到了天花板,终结了传统油画,开启了现代艺术。现在能用 AI 把同人图画到真人 Coser 照的程度,基本可以宣告静态图像艺术已经快被逼近天花板了。可以预见未来的一到三个月内,会有一些真人 Coser 或特效化妆的团队开始尝试去 cos 由 AI 生成的仿真 Coser 照。

基于 AI 二次创作基础上的真人再创作,真人和机器的创作界线会发生很有趣的交融。这种灵活机动性和融会贯通的能力,恰恰是人的优势所在,就看谁能更好地拥抱新技术了。

人类历史中新一波的艺术革命会在未来十年间逐步揭开大幕,接下来就看下一个毕加索和塞尚会在什么时间以什么姿态出现了。我还是之前视频里的观点:

未来艺术的主流形态,是动态且可交互的。由人进入场域中的体验来最终完成作品,千人千面的哈姆雷特会成为天龙八部的珍珑棋局。

图像创作者:勘云工造 @auditore_k

图集下载地址:

Arknights-texas

https://drive.google.com/file/Arknights

Password:kanyon

Azur Lane-Cheshire

https://drive.google.com/file/Azur

Password:kanyon

AIGC 和 VIS 的类比

By: Steven
16 February 2023 at 12:06

大概是2016-2018年间,我曾经和我司两任平面设计师说:

你们现在的技能在将来用处不大,但不代表平面设计就到头了。本质上 VIS 和 AI(那会还没有 AIGC 这个说法)是差不多的事情,前一个是你设定好规则,然后在不同的应用场景下不断组合复制,后一个是它学会你教它的规则,它来组合复制。一个是手工活,一个是工业化,他俩只是效率的差别。你们未来需要教会这些 AI 什么是好设计、如何做设计,让它释放你的体力劳动,你把时间腾出来考虑更复杂的事情。

那时候,我判断这个事情就是十年左右,没想到,事实上只用了五六年。

当然,以上只是高度简化的说法,但大意如此。

* 拓展阅读:https://mp.weixin.qq.com/s/pv6ECT8WR4tdNhsYiATt2w

人类的定义正在重构的历史开始了

By: Steven
13 February 2023 at 14:02

上周在即刻看到一个话题:

ChatGPT vs. iPhone 两种技术有何异同? 就它们制造产业变革和影响来说,对比思考能否启发对未来的想象?

我目前的看法是:

iPhone 为代表的技术,拓展了人的外延。人是技术网的中心,是作为生物人抛向空中的一块大腿骨。

ChatGPT 为代表的技术,更新了人的定义。信息和意识不是人的特权,是否只有生物人才是人,需要被认真严肃地对待。

前者的产业革新是建立在人脑上限之中的,超过脑容量的部分,推进速度非常缓慢。

后者不存在理论上限,对自身的推进速度远大于前者。但由于前者高度依赖人这个不确定因素,因此,在后者产生革新的同时,会同时产生大范围的剧烈冲突。前者脆弱,但作为后者的基建,这种大范围冲突可能导致两败俱伤,拖累后者进化速度。但因为发展不平均,所以后者会衍生出全新的社会形态。

AI 不需要代替人才能更新「人」的定义,更不必达到硅基生命的程度,只需要在表达方式上像人(即便它根本不理解自己在说什么),就自然会在生产方式和伦理上产生大量冲击。这些冲击会更新人对自身的认识,配合其自身的效率属性,人会主动更新对自身的定义描述。

在此基础上,设计师将来的工作会和今天大不相同。因为我们在思考人与物的关系时,中间的媒介可能不会再是物理交互和界面交互,而是面向 AI 的交互。这种交互可能是有形的,也可能是无形的。另一种更有可能发生的情况是,你所设计的产品不是给人类使用的,而是面向 AI 的中间件,这会改变很多约定俗成的非物理/生物层面的规则。

我们有幸站在了这段历史的开端之中。

红鼻子日的新红鼻子

By: Steven
2 February 2023 at 20:20

评价一个设计最忌讳用「这不就是纸灯笼吗」这种句式和思维模式,因为粗糙的玩梗阻断了独立思考的可能性。

Jony Ive 团队给「红鼻子日」设计的新鼻子,首先跳出了一整件的旧思路,给它换了一种意象;然后它在材料的环保选择上延伸出了对材料的使用方式,用材料自身的特点构成了结构、形态与交互;最后用两根皮筋串在一起完成了安装与使用的固定。

同时你会注意到,半月形的凹陷处给鼻尖提供了空间,转轴位有针对摩擦力的光亚面处理,弧形边缘外侧有针对夹持的筋。

这么小的东西,这么大的投入和量产完成度,是了不起的!

第三次接触 VR 环境

By: Steven
20 January 2023 at 01:05

小柒第一次进入 VR 环境,是十月份。那时显济约我喝咖啡聊天,他带来了新买的 pico 4 过来玩,并借我玩了一周。期间我带回家,给小柒体验了两天。

那次他体验的项目是拳击运动,感受身临其境的虚拟现实,与软硬件配合的击打手感。

第二次上手玩,是上周末在附近的商场里,他在一个体验 VR 游戏的空间看了很久。我看他想玩,就让他去找工作人员聊天,搞清楚每个项目的费用、时长,然后自己选定一个去玩。他最后选了一个 ¥68 玩十分钟的模拟厨房的游戏。

其实,他已经很多次在旁观摩别人玩 VR 游戏了。不同的商场里,几乎都能看到那些自助游戏机和这些 VR 体验项目。每次他都会看一阵子,那对他来说,是一个新的世界。尽管,这个真实的世界对他而言也是新的,但那个虚拟现实的空间,是一种连我们这些大人都觉得新鲜的事物,他怎么可能不好奇。

临走前我和他说,我们算笔账:你 ¥68 玩十分钟,如果我花差不多的钱,能一直玩,哪个划算?于是我找显济再次借来他的 pico 4,转了 ¥69.9 给他,买了《爆裂厨房》这款游戏,作为这个春节的新增娱乐项目。

这是第三次接触,他将连续体验至少十天。

今晚,我先给他示范了一次,把新手教程做了一遍。

然后,他靠着自己认识的字阅读任务书,独立完成了新手教程的七套任务。凭着对前期任务教会的那些动作的理解,在后面的过程里,他甚至自己尝试了一些非规定但符合直觉的动作。这很关键,这种举一反三的直觉交互,对产品设计很重要,对将来的人也很重要。

小柒此时六岁,他们这代人的世界观将会和我们八零年代的这批人很不一样。

对于未来的世界,我虽然持着比较悲观的态度吧,但看着他,我还是觉得有希望的。对他,我觉得比较有信心会是个不错的人;对他这代人,我觉得他们会比我们强得多。

现实 vs 虚拟,客观 vs 主观,个体 vs 集体,他和我们所经历的先建立再打碎再重建的过程会不太一样,他会从小就体验、观察和思考这些问题,会有他的理解。当然他会面对更复杂的世界,但任何混乱,都是生机。

如果 MacBook 要搭载触摸屏,可能怎么做?

By: Steven
17 January 2023 at 17:32

问题来源:苹果或将在 2025 年推出触摸屏 Mac,此前其一直抵触触摸笔记本设计,如何解读这一改变?

我的观点是:

媒体们捕风捉影的思路错了,克雷格可没有说是什么形态的 MacBook 啊。

我们假设苹果真的要推出触摸屏笔记本,那么:

1、手臂悬空地在屏幕上点点划划,这是人体工学的死穴,体验极差,所以触摸屏的笔记本一定需要搭配外翻折的结构,折过去变成平板电脑才堪可用;

2;苹果自家目前有着全球最好用、市占率最高的平板电脑 iPad,那么一个带触摸屏的外翻折笔记本可以给公司提供什么「价值」呢?有两个,一是冲击平板的销售,二是让 MacBook 变成另一个装了妙控键盘的 iPad Pro。可见,无论是从哪个角度来看,这件事对公司的经营都没有好处。

既然触摸屏 MacBook 不应该是 iPad Pro 的平替,那么如果非要做,可以怎么做呢?一个比较正常的产品思路是,跳出去,成为另一个东西,例如:

《设以观复 vol.14》视频位置 33:31 点击截图播放视频

图中自左向右的白块分别是:Apple Watch、iPhone、iPad 和 iMac

那么,如果苹果需要打造一款搭载触摸屏的 MacBook 的话,更好的做法一定不是直接在笔记本上装一块触摸屏,因为一款既不好用又影响销量和品牌声誉的产品,百无一用。但是,如果跳出笔记本现有形态的固有观念,在 iPad 和 iMac 之间仍然存在一个有待开发的产品形态:

《设以观复 vol.11》视频位置 13:04 点击截图播放视频

也就是说,这块可能存在的触摸屏不是给现在这个形态的 MacBook 使用的,而是为折叠屏形态的 MacBook 去准备的。从这个角度去理解克雷格说的「谁说得准呢?」,意思就完全不一样了。至少这么理解比较符合商业公司的基础利益逻辑,做一个世人都知道不合理的产品,它图什么?

从近几年的消息和产品更新来看,苹果正在全力打造 AR/VR 产品已经是不争的事实,问题只是发布时间在何时了;与此同时,各个产品线的更新一方面在性能和芯片上开始疯一般堆料,另一方面开始在交互设计上有各种动作,无论是AOD、台前调度、灵动岛、悬空的笔尖操作,都在指向那个万众瞩目的 AR/VR 产品方案。

一头是打破产业困局的新形态产品,是引领全新交互设计的探索;另一头是早已完整的旧形态的非必要、高争议、不赚钱的更新。但凡是个正常脑回路的产品经理,都不会选后者。

何况现在公司的精力都在 AR/VR 和汽车这两件生死攸关的事情上,哪还有多余的研发力量折腾这种没钱途的东西?简单算一下投入产出,这项目就当场黄了。

*本篇内容为应 巫冬 邀请所写

意外的特等奖与阿凡达的海洋

By: Steven
16 January 2023 at 12:31

简要记录一下,最近几天的三件开心小事。

其一:年会中抽奖,被抽到特等奖。

我是真的完全不抱任何期待的,因为无论是学生时代还是毕业以来的十几年,我一向都没有抽奖运。甚至在我言中同桌同事「你染了红头发,必定鸿运当头,下一个就是你了」之后,我作为抽奖人在箱子里摸出了她的名字时,我依然觉得今晚抽奖与我无关。

我倒是蛮喜欢这个红包封面的。

特等奖:¥3800 现金

其二:年会下半场的 KTV 里,被两个男同事用近乎表白的方式夸了半个小时,觉得很安慰。

我的 2022 年过得很难受:一方面是绝大部分时间脱离了设计师的本职工作,一手伸到产品端,一手伸到项目端,事情做得非常不顺手,还得处理很多鸡零狗碎的事情,极其没有成就感;一方面是确实在动摇,在思考自己接下来的几年应该怎么做,处于新一轮的自我怀疑和抉择之中。

天恩和我说,全公司他最敬仰我,认为只要我认为这个设计好,那么就一定是好的。他说欣赏我对设计的理念和追求,以及执行过程中的理性与坚持;更说我应该属于世界舞台,如果资源给够,一定是世界顶级的一流设计师。他作为软件部门的老大,甚至经常和同部门的同事表达对我的敬仰。

而莫则和我说,他很开心跟我搭档,因为他知道我一定始终在看着前面,在产品和设计上追求更好,所以他才乐意主动揽下各种项目的杂事。一个抬头看路,一个低头走路,他说我们是最佳搭档。

在今年工作的一切不顺利中,这两个人的酒后真言,给了我很多安慰。

其三:一家三口一起看了《阿凡达:水之道》

2010 年初,我和筱烨刚在一起没多久,一起看了《阿凡达》。当时震撼了我俩许久,时不时还会提起。

13 年后,我们周末带着小柒一起,一家人看了纳威人一家六人的故事。

要说故事,确实是俗套,但是这不重要。即便是第一部的《阿凡达》,也并不是故事见长的电影。它仿佛是卡梅隆带着摄制组去了潘多拉星球拍的一部纪录片,不止是做得像,更是创造了一个真实的世界。

还有一个感受是,我发现自己没有十三年前看第一部时那般愤怒了。一来是自己年纪增长,见多了,人就逐渐平和了;二来是电影把视野拉出了森林,来到了海洋生态圈,让我看到了这个美丽星球的丰富与完整,而且有着完全不同于人类的智能与社会形态,看到了一颗星球生态圈的坚韧和力量,所以不再有看第一部时的那种压迫感。所以,当小柒说出「人类好卑鄙啊」时,我才没像以前一样愤怒,而是提醒他「所以我们要做好人」。

筱烨在手帐里画的插画

❌
❌