Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

叫板 Sora! Adobe 推出 AI 视频神器,一句话 P 视频

By: 范津瑞
16 October 2024 at 14:30

最近 AI 视频领域异常热闹,Adobe 也刚刚加入了这场混战。

在今年的 Adobe Max 大会上,Adobe 正式推出了自己的 AI 视频模型——Firefly Video Model,进军生成式人工智能领域。

Adobe 的首席产品营销经理 Meagan Keane 表示,Firefly Video Model 的推出旨在简化加速视频创作,并且增加视频的故事讲述能力。概括来讲,这个模型包含三个有趣且实用的功能:

  • Generative Extend(生成拓展)
  • Text-to-Video(文生视频)
  • Image-to-Video(图生视频)

其中,Generative Extend 已经被集成至 Adobe 所开发的专业视频编辑软件 Premiere Pro 当中;Text-to-Video 和 Image-to-Video 则刚刚在 Firefly Web app 中推出 beta 版本。

顾名思义,如果你拍摄的视频片段太短或缺失某些部分,Generative Extend 可以帮你在视频片段的开头或结尾进行「生成式扩展」。

也就是说,假如所需的镜头不可用,或者某个镜头的剪辑时机过早或过晚,剪辑师只需要拖动该视频片段的开头或结尾,Generative Extend 就可以自动填充生成式内容,以保持视频的连贯、平滑。

▲Generative Extend 的生成式视频扩展功能演示(图片来源:Adobe)

这意味着如果视频创作者在拍摄过程中得到了一个「废镜头」,他可能不再需要回到原场地重新拍摄,而是利用 Generative Extend 直接对原片段进行扩展和修复。

一定程度上讲,这确实有助于提高视频创作效率——当然,是在 Generative Extend 所延伸的片段质量过硬的情况下。

遗憾的是,该功能目前的最大分辨率限制为 1080p,且片段最长只能扩展两秒钟。

因此 Generative Extend 只适合对视频片段进行微小的调整,即它只能帮助用户修复某些细节,却不能代替创作者本身,进行大篇幅的创作。

Generative Extend 还可以帮助用户拍摄过程中进行调整,纠正在拍摄过程中视线偏移或其他意外产生的移动。

除了视频之外,Generative Extend 还可以用于音频的平滑编辑。它可以将视频中的环境背景音效扩展长达十秒钟时间,但无法对对话或音乐进行拓展。

▲Generative Extend 的音频扩展功能示意(图片来源:Adobe)

如果你想在视频创作过程中省点力气,你可以使用 Text-to-Video 功能直接生成。同它的「老前辈」Runway 和 OpenAI 的 Sora 一样,用户只需要输入他们想要生成的视频的文本描述,它就可以模拟「真实电影」、「3D 动画」和「定格动画」等各种风格生成相应的视频片段。

以下是一些使用 Text-to-Video 功能生成视频片段,感受一下:

▲提示文本:电影无人机飞越广阔的红色火星景观,它从我们脚下飞驰而过,当太阳升起时,地平线是红色的。在镜头的结尾,太阳从地平线上升起。(图片来源:Adobe)

▲提示文本:电影特写和夜晚街道中央一位老人的肖像细节。灯光气氛沉闷,充满戏剧性。颜色等级为蓝色阴影和橙色高光。这个男人有极其逼真的细节皮肤纹理和明显的毛孔。动作微妙而柔和。相机不动。胶片颗粒。老式变形镜头。(图片来源:Adobe)

▲提示文本:在墨西哥一个美丽、柔和的天井内拍摄的视角。水清澈湛蓝,在傍晚的阳光下闪闪发光。颜色是温暖和神奇的魔幻风格。高品质,电影感。(图片来源:Adobe)

除了逼真的,电影般的视觉影像,Text-to-Video 还支持生成一些「抽象」的画面。例如,它可以被用来生成包括火焰、水、漏光和烟雾等元素的视频,并覆盖叠加到现有的视频上,来增加现有内容的视觉深度和趣味性。

▲提示文本:黑色背景上的电影漏光,有机质感,逼真。(图片来源:Adobe)

▲上述视频与现有视频合成后生成的视频片段(图片来源:Adobe)

值得一提的是,用 Text-to-Video 生成的视频片段还可以使用一系列「相机控制」进行进一步细化处理,这些控制能够模拟真实的相机角度、运动和拍摄距离等。

▲ 相机控制选项(图片来源:Adobe)

Image-to-Video 功能则更进一步,允许用户在视频创作过程中添加「参考图像」,以生成更加贴近用户想象的视频。

视频创作者可以从一张图像和照片出发,利用 Image-to-Video 功能直接制作「B-roll」(电影和视频制作术语,指的是除了主要拍摄内容(A-roll)之外的辅助视频素材)。

用户还可以通过上传视频的单帧,并由 Image-to-Video 自动补充缺失帧,以此来创建完整的特写镜头。

▲提示文本:花朵在风中摇曳,一只美丽的蝴蝶落在其中一朵花上。(图片来源:Adobe)

「众所周知,视频不能 P,所以一定是真的。」

然而,Image-to-Video 的「赛博重拍」功能,直接让这句话变成过去式。它宛如一只「上帝之手」,可以让用户对视频内容(视频中的人物动作等)直接进行操作和修改。来看下面的例子:

▲ 原视频片段(图片来源:Adobe)

▲修改后的视频片段,提示文本:一只戴着手套的宇航员的手进入画面,并拔掉了其中一根黄色电缆,具有电影感。(图片来源:Adobe)

目前,Text-to-Video 和 Image-to-Video 功能生成视频片段的最大长度仅为五秒钟,质量最高为 720p 和每秒 24 帧。视频生成时间大约为 90 秒,Adobe 正在开发「涡轮模式」来缩短这一时间。

视频生成质量的不足表明,用户还无法用 Firefly Video Model 生成一部完整的电影,暂时只能作为创作辅助工具来使用。

Adobe 强调,Firefly Video Model 只会在许可内容(如 Adobe Stock)和公共领域内容上对该模型进行训练,而不会在客户提供的内容上进行。

此外,使用 Firefly Video Model 创建或编辑的视频可以内嵌内容凭证,旨在为创作者和内容出处提供归属证明,有助于声明 AI 使用情况和所有权权益,以保证「商业安全」。

感兴趣的读者可以在以下链接加入 Adobe Firefly Video Model 的体验候补名单:
https://www.adobe.com/products/firefly/features/ai-video-generator.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


十三岁的唱片制作人!敏锐的设计洞察力来自街头?设由心声:序 Vol.0

By: Steven
28 July 2023 at 19:05

🎥 点击跳转至 B站 播放视频:https://www.bilibili.com/video/BV1SN411a72T/

🎥 点击跳转至 YouTube 播放视频:https://youtu.be/o3XL_woaCUs

这是新企划的设计师视频系列《设由心声》的序章。在这期视频里,你将会看到设计意识自我觉醒的过程,以及不可遏制的创作冲动是如何生长的。

这是想重启很久的一个全新大坑:设计师访谈 + 产品与设计背后的内幕信息。

这一条是今年三月份去上海参观《拍照的人》线下展的时候,和 akira 在前台做的采访。你将会看到一个设计师自我觉醒的过程,和他的学习方法。

因为原本就有重新开启这个新企划的打算,于是借机做了这一期访谈,作为整个系列的开篇。 这个系列应该都会是这种类型的类似纪录片的形式,来展现设计和产品的业内信息和观察。为什么说是「重启」呢?因为很多年前做过一个设计师访谈的专栏,因为各种原因只做了七期就终止了,现在想用视频的形式复活这个企划。

早年的设计师采访文章见:

寻得一件欢喜的发簪

By: Steven
18 October 2023 at 00:24

日常佩戴的发簪,我并没有买一大堆不同款式换着搭配的计划,只想用一把顺手且符合当下心境的款式通配一切场景,最简化日常的盘发需求。

住院手术前就开始在网上物色合适的木簪,心想既然已经选择了夸张与出格,那索性以心为尺,外化于物,寻一个观照自己的镜。

反复挑选三周后,最终决定用凡叔的这把黑石簪,作为日常陪伴。

侠隐系列 · 黑岩 · 石纹簪

制器与设计,本是一体。

偶入这个小众圈子,发现用心造物的创作者,也是快乐。

PS:前两天学会了低盘丸子!

这下不影响戴帽子和头盔了👌

避免自己染上爹味儿

By: Steven
5 July 2023 at 13:49

不和比自己小的人说「应该怎么做」和「我是这样成事儿的」,就大概能避免掉大部分「爹味儿」,也可以让自己保持清爽。一切表达都只是「我此刻是这么考虑的/看待的」,因为表达就是大脑的排泄,没有谁应该接收和接受;同时,也可以让自己保持弹性。

自从意识到自己不再是小年轻后,就会对这些不经意间流露出来的排泄物保持警惕。可以少说一些,但每次说的时候,尽量看管好自己的心神。

这个时代没有「过来人」,经验没「原理」有力量。

我现在是带着这样的心态,在表达中学习的。

正在一点点发生转变的三十六岁

By: Steven
20 March 2023 at 22:28

虽然已经对自己的年龄不太有感知了,但今年却因为前段时间的一系列事情,而感受到了一股力量在推动着某些事情前进。那是一股巨大的浪潮,一股将会被历史记录的洪流,而我隐隐蹭到一些浪花,感受到了来自三十六岁的礼物:转变的推力。

最开始是从去年八月开始接触 AI 创作,短短半年时间,到今年二月就明显感受到了巨大的进步。如果说前面几年的各种什么元宇宙元年、AR/VR 元年、Web3 元年都还只是一波波热钱推动的热闹的话,那么这一波 AIGC 所带来的冲击,已经不是元年这种概念了。它已经直接冲到了我们的面前,正在以肉眼可见的速度,迅速拓展到各种方面。我向来都是技术进步派,这种变化让我感到兴奋,比起担心、忧虑,我更加希望参与其中,拥抱这一切的变化。

然后,是在一段很长时间令我感到厌烦但必须处理的各种工作之后,突然收到了来自熊小默苏兆阳的邀请函!他们的线下展终于要开了!先和筱烨商量了一下,得到她的支持后,我果断买了去上海的飞机票,奔赴一处让我得以喘息的「他处」。

我太需要一次「离开」了!

逃离这些令我感到厌烦的、繁复的文书工作,以获得片刻自由呼吸。尤其这是一次我期待已久的见面,与这两位朋友时隔一年的见面,与他们的展览以及这些艺术家们的见面,以及与他们的作品的见面,一次让我可以从世俗中抽离,与自己的见面。

第三晚,回深圳前去现场 say bye,却遇到了启发我做视频的 Flypig
作品代有强烈私人情绪的林洽
多年观众和网友,前锤子产品经理,杰里开
新认识的朋友,很棒的小泽zz6

看到大家都在认真地做着自己热爱的事情,这非常打动我。

其实在 2015 年的下半年那几个月,我做过一个叫做《搭讪》的设计采访栏目,一共做了七期,采访了不同领域、不同阶段的设计师。后来因为工作原因,就搁置了。大概从前年开始吧,我就隐隐希望把这件事再拾起来。尤其在看到《拍照的人》第一集播出后,更加刺激了我要把这件事重新拾起来的想法。

我要把设计师们和产品的故事挖出来,用纪录片的方式。

左起:苏兆阳、熊小默、苏志斌
第一晚留到最后的人:熊小默、苏兆阳、akira 以及所有参展艺术家和朋友们
全画幅相机取景器里的苏志斌和熊小默
苏兆阳送的非卖品:《拍照的人》泡泡骚

结束后我们一起去吃饭,期间我问熊小默为什么想做这件事,他说他要歌颂摄影,不是精英化的摄影师身份或者某些作品,而是摄影这个行为以及那些一直在拍照的人。我说这很动人,因为我也一直想做这件事。

我今年要重新开始做这件事。

正好二月初的时候,迪龙找我聊,关于传播他和曾德钧老师搁置了十年但正在重新制作的那一对特殊的音响。他们最开始只是想写一篇文章,但我建议,应该是一条视频,一条记录了你们共同的作品以及你们的采访的纪录片。于是,这件事终于有了一个开始的契机。

郑冬平和他的设计师们在讨论设计方案
郑冬平办公室一角

从上海回来后的第一个周一,我去见了刚重组了公司和工作、生活的郑冬平。他把上善设计的工业设计业务解散了,专心在现在的小家电新品牌上,原本的上善收缩成一家品牌设计公司。我跟他说了我想做这个纪录片系列的想法,我想以他为开始,做第一条片子。

他答应了,他的合伙人也觉得很有意义。

即刻公司的大门,可见即刻和小宇宙的logo
来过小宇宙录音室的主播们
相当专业的小宇宙录音室

在上海的第二天,在雨医生和 Kael 的带领下,参观了即刻。

很羡慕这样有活力的年轻人的公司,并不是说互联网公司的工作环境轻松的意思,而是觉得他们有想法就立刻执行的环境,非常激励人。他们告诉我,原本这些位置是空的,但大家因为对这些事情有兴趣,就主动投入精力来做。

我喜欢这种活法。

雨医生一直在向我发出录播客的邀请,她和 Kael 都是我的观众,总说我这样的内容在互联网上独此一家,很难得。前一晚,熊小默和苏兆阳也是这么说我的视频。独特才是最重要的,不存在所有人都喜欢的东西。这也是我所赞赏的。我还有一个理论,是关于把两个领域结合在一起做到自己独门独院的工作才是最好的状态。只是,我目前还不知道可以用播客聊什么。

我想,我也会开始做播客的,但还需要一个契机。

左起:苏志斌、yoga、显卡

同样在进行工作和生活转变的,还有 yoga 和显卡的B站频道

两人终于彻底脱离音乐老师的身份,把工作的重心转移到运营频道上来。我为他们的选择感到高兴,不是因为离开或转移,而是他们明白自己要什么,找到了明确的目标和方向,并正在努力付出和尝试。这是最珍贵的!

他们接下来想做的事情,多少也和我想做的方向有不少重叠。这可能就是奇妙之处,当我下定决心要做这件事情的时候,事情居然都这么慢慢地靠拢过来了。更妙的是,事情还把朋友们互相串起来了。我希望能串得顺利和成功,这样才不枉费这些认真的人们如此热爱生活。

头一回有品牌方主动给我的合作打分,是索尼

我的想法甚至引起了另一些朋友的关注,开始问我,这个项目有没有品牌冠名。

虽然事情还八字没一撇,但我很开心有这么多人在支持我。这让我想起以前在一些书和文章里看到的一个说法:如果你想要一个东西或者想做一件事情,不应该藏在心里,而是大方地告诉所有人,这会让更多的机会和帮助向你靠拢,也能驱使你更有动力地去完成。

我其实一直是一个「怀孕没坐稳就不敢说出来」的个性。因此,一直都是默默独自完成一些事情之后,才和大家分享。但也许最近这些事情就是在驱使我,要做出一些改变。

同时还穿插了雷雨的闭社风波!

突如其来的闭社通知!
紧急召开的跨度达二十届人的会议
没停止过的群内讨论和时空联动

很难想象,国内还有哪一个大学社团能够这样。一个二十多年的学生话剧社团的新人旧人为了一个团体的存亡,一起跨时空地想办法解决生存问题!

本着不干扰和信任的原则而默默关心社团的老鬼们,在存亡之际,一起发挥大家各自在社会里打拼的经验,组织会议、了解问题、梳理问题、寻找解决方案、组织新的人事关系,推动社团改革,确保延续和发展。

话剧人的魂呐!

筱烨送我的生日礼物:给我平时吸眼泪的手帕
vendor 的咖啡师拍的我
杠杠镜头里的我,大家说显得很乖巧

今晚用在 coffee venodr 写博客的方式过生日,让杠杠帮我拍了两张照片记录一下,快到九点的时候还送了我今天的最后一块蛋糕做生日蛋糕。

面对这两周的经历,我该说什么呢?

“ 地球还是蛮不错的!我应该还能再住 60 年吧!”

真人 cos AI coser 的 cos 照,不远了。

By: Steven
17 February 2023 at 19:29

摄影把「画得像」逼到了天花板,终结了传统油画,开启了现代艺术。现在能用 AI 把同人图画到真人 Coser 照的程度,基本可以宣告静态图像艺术已经快被逼近天花板了。可以预见未来的一到三个月内,会有一些真人 Coser 或特效化妆的团队开始尝试去 cos 由 AI 生成的仿真 Coser 照。

基于 AI 二次创作基础上的真人再创作,真人和机器的创作界线会发生很有趣的交融。这种灵活机动性和融会贯通的能力,恰恰是人的优势所在,就看谁能更好地拥抱新技术了。

人类历史中新一波的艺术革命会在未来十年间逐步揭开大幕,接下来就看下一个毕加索和塞尚会在什么时间以什么姿态出现了。我还是之前视频里的观点:

未来艺术的主流形态,是动态且可交互的。由人进入场域中的体验来最终完成作品,千人千面的哈姆雷特会成为天龙八部的珍珑棋局。

图像创作者:勘云工造 @auditore_k

图集下载地址:

Arknights-texas

https://drive.google.com/file/Arknights

Password:kanyon

Azur Lane-Cheshire

https://drive.google.com/file/Azur

Password:kanyon

人类的定义正在重构的历史开始了

By: Steven
13 February 2023 at 14:02

上周在即刻看到一个话题:

ChatGPT vs. iPhone 两种技术有何异同? 就它们制造产业变革和影响来说,对比思考能否启发对未来的想象?

我目前的看法是:

iPhone 为代表的技术,拓展了人的外延。人是技术网的中心,是作为生物人抛向空中的一块大腿骨。

ChatGPT 为代表的技术,更新了人的定义。信息和意识不是人的特权,是否只有生物人才是人,需要被认真严肃地对待。

前者的产业革新是建立在人脑上限之中的,超过脑容量的部分,推进速度非常缓慢。

后者不存在理论上限,对自身的推进速度远大于前者。但由于前者高度依赖人这个不确定因素,因此,在后者产生革新的同时,会同时产生大范围的剧烈冲突。前者脆弱,但作为后者的基建,这种大范围冲突可能导致两败俱伤,拖累后者进化速度。但因为发展不平均,所以后者会衍生出全新的社会形态。

AI 不需要代替人才能更新「人」的定义,更不必达到硅基生命的程度,只需要在表达方式上像人(即便它根本不理解自己在说什么),就自然会在生产方式和伦理上产生大量冲击。这些冲击会更新人对自身的认识,配合其自身的效率属性,人会主动更新对自身的定义描述。

在此基础上,设计师将来的工作会和今天大不相同。因为我们在思考人与物的关系时,中间的媒介可能不会再是物理交互和界面交互,而是面向 AI 的交互。这种交互可能是有形的,也可能是无形的。另一种更有可能发生的情况是,你所设计的产品不是给人类使用的,而是面向 AI 的中间件,这会改变很多约定俗成的非物理/生物层面的规则。

我们有幸站在了这段历史的开端之中。

Ai 绘画将从何处开始进入日常生活?

By: Steven
10 January 2023 at 21:30

最近几个月 Ai 绘画这个话题很火,但基本上大家都只是看个热闹,跟普通人的生活没多大关系。或者说,大家感觉不到它和自己有什么关系。只有相关从业者,感受到了巨大的生存压力和身份危机。

但和当年支付大战的春晚红包类似,能让普通人都参与进来、玩起来的场景可能才能让大家感受到:Ai 绘画意味着什么,能做什么。

尽管众多以文生图的 Ai 工具已经大幅度降低了创作门槛,但是在那之前,各种咒术、法门终究是拦住不少普通人接触 Ai 绘画的一块巨石。我自己也曾在用过某些 Ai 工具后,在一条展示初次接触的创作成果的视频里提醒大家,不要忽视它,但也不要过分害怕它。它一定会给我们的生活带来巨大的变化,只是目前还没积累到那一刻,仅此而已。

如果说有什么场景,类似发红包那样简单明了,人人都可以参与,我觉得有一个非常合适的应用场景,那就是用 Ai 生成定制头像。对于不具备绘画能力、不懂念咒语、不会使用绘图软件的大多数人而言,Ai 画头像就是各类修图美容软件一级的场景,既有尝新和娱乐,也有充分的社交属性,和红包非常相似。

最近试用了一下漫镜,一个感觉是,神情抓得不错,风格也足够多,用它来探索自己不同造型的可能性,还是挺有启发的!因此中途我想到一件事,如果这类产品的效率再高一些,跟各大连锁发型屋合作,预约时就上传几张照片,生成几套发型方案,人到了现场就让托尼老师根据效果图来剪,这不是非常好的体验升级么?谁说 Ai 必然逼得人失业呢?还得是看人怎么用。

除了头像,你觉得还有哪些场景,适合普通人体验 Ai 绘画呢?

点解图片体验 AI 制作头像

买了个预售中的字体

By: Steven
19 July 2024 at 20:14

「明净黑」是一款等线黑体字,灵感来自于民间机械雕刻牌上的告示字型。

它集结了美术黑体字和机械雕刻字手工感的特点,当中竖弯钩的大幅度圆弧造型是此款字体的显著特征之一。

明净黑在风格造型上参照了传承字形的写法。当它放大作为标题来使用的时候,黑体字的特征会十分明显;缩小作为短篇幅句子排版呈现的时候,又会有手写字的优雅感觉,而且非常适合一些艺文类空间用作告示字。

这是我在小红书上的第一次消费。

因为如果喜欢一件作品,不希望它夭折的话,最好的方式就是早点用钱投票。未来等这款字体正式发布后,我会把它应用在《设以观复》和《荒野楼阁 WildloG》之中。

故事之为故事

By: dimlau
19 June 2024 at 13:40

直到去年之前我都不知道有位克罗地亚裔荷兰作家:杜布拉夫卡·乌格雷西奇。不知道这样说是不是能为自己的孤陋寡闻找点借口——名字那么拗口,又来自不那么被人熟知的国度;稍微动下脑子就意识到这个借口其实只会让自己显得更孤陋寡闻,因为这位作家书里写的可也是我所熟悉的世界,她写中国的民间传说、写日本的稻荷神、写谷崎润一郎……

当然,很合理,毕竟她是作家我是读者,作家必须要涉猎广泛,故事之为故事,就是要摄入、消化、再产出。正如在她《故事之为故事的故事》里提到的,本雅明关于世界文学的一段话:

世界文学就像一条鲸鱼,身边聚集着一群吸盘鱼,像老练的海盗一样。它们附在鲸鱼的身体上,吸食鲸鱼皮肤上的寄生虫。鲸鱼同时是食物、保护和交通工具的来源。如果没有吸盘鱼,寄生虫就会在鲸鱼的身体上定居,它的身体就会散架……我对自己的文学才华不抱幻想。我是一条文学上的吸盘鱼。我的使命是维护鲸鱼的健康。

fin.

播客的收听数据似乎很符合我的期待

By: Steven
7 June 2024 at 00:30

其实有点出乎我意料,除了 Apple Vision Pro 那期,最受欢迎的居然是聊《九龙城寨》和《暗恋桃花源》的这两期。而且,刚发的《谈判专家》这期的收听量也在稳定上涨。聊 AI 那期尽管内容很多,但收听量比这些都少得多。

从博客后台数据能看到,最近一周的主要收听量中,三分之二都来自这三期聊戏聊剧的节目。

我原本以为,收听我节目的主要人群,是过去在知乎和 B站看我讲设计的读者和观众。

这么看下来,我有一个猜测:收听我播客的人群当中,有很大一部分比例,可能是此前并不认识我的路人,他们对科技类话题的兴趣,没有对娱乐类型的话题高。

挺好的,这也挺符合我最初对播客的预期,这样我就可以不用老聊设计和产品了!

荒野楼阁 WildloG:https://suithink.me/zlink/podcast/

小宇宙: https://suithink.podcast.xyz

Spotify:荒野楼阁 WildloG

YouTube:荒野楼阁 WildloG

Apple Podcast 在中国大陆地区目前只支持通过 URL 订阅:

https://suithink.me/category/podcast/feed/

输出是一种排泄

By: Steven
20 May 2024 at 21:13

在不同的平台上时不常的都能看到一些内容创作者他们会有疑问,说我的东西明明很有深度,准备得也很充分,制作也很用心,但是为什么没有获得很好的流量,或者其他的回报?这种时候要么就是真的有疑问,要么就是想通过这种疑问的方式,来表达对于这种流量的不满或者鄙视。

每次看到他们说这种话的时候,我就会代入到自己。我也有很多内容是花了很多心思很认真做的,但就是没有什么人看,没有什么人听。前几年确实会有疑惑,但现在我很坦诚地接受自己就是不擅长做那种大众流量欢迎的内容。

这里并没有鄙视大众流量的意思,我是真的发自内心的不懂,哈哈哈哈哈~

因为我做内容 99% 的动机,都只是为了把脑袋里的东西腾出来,它只是我的一个思考过程的外化。有人获得共鸣和启发,那就最好,没有那也无所谓。因此我确实没有真的花过心思在研究怎么样制作大家都喜欢的那种类型的内容,因为我也确实没有发自真心地想把自媒体作为自己的一条所谓职业赛道来看待。

因此,没有获得那样的流量,是很正常,也应该的。

偏见和缺陷是创作的灵药:人类和 Ai 有什么区别_3.ylog

By: Steven
16 May 2024 at 21:00

无论你对 Ai 秉持怎样的态度和观点,都希望这期节目能给你带去一些思维激荡的时刻。作为工业设计师,我认为,如果不时常忏悔,不为自己做的东西(无论是否在自己的意志下,通常都不在)对这个世界造成的影响抱有歉意,这样的人很容易成为误以为自己是夜神月的弥海砂。

这是一期需要配图食用的播客,从近期一组以「戏剧感」为创作目标的十二生肖聊起,关于 Ai 创作的评价和人类作品之间的区别,谈到如何在这个 AIGC 爆发的时代下找到自己的位置。

创作者的骄傲和创作者的骄傲,是南辕北辙的两件事。

在这一期,你会听到:

—— 什么样的作品是有「人味儿」的?

——「偏见」和「缺陷」是艺术创作的灵药?

—— 为什么 Ai 会在创作领域疯狂爆发?

—— 现当代艺术常被人诟病的原因之一:抽象

—— 细节!什么是令人信服的细节?

—— 这些 Ai 正在拓宽我的眼界;

—— 人不能创造出自己从未见过的东西,吗?

—— 设计不是天马行空地想象,它是一种「劳作」;

—— 超人的诞生;

—— 超人的洞察和创新,与人类无关;

—— 能耗、模型与错觉;

—— 涌现、艺术与创新;

—— 马车夫的工作经验如何平移到汽车司机?

—— 选择 AIGC 工具的基本思路;

—— 向藻类致敬!

|相关图片|

—- 十二生肖系列中的兔、马、猴,完整图集和介绍 见链接

—-《城堡下的人群》(参考马列维奇的风格)

—- 毫无表达意图的随手测试图

—- 似是而非的剃须刀设计图

—- 汽车设计草图的测试

|相关阅读|

—- 十二生肖·Midjourney·戏剧角色设计

—- 描觀念 繪感受|超微型 AI 觀念畫展

—- 艺术可以糊弄,体力劳作也是高级智能

—- 表达的精度就是人类外延的尺度

—- 镜头的变幻就是故事

|登场人物|

苏志斌:工业设计师,智能硬件产品经理,《设以观复》作者

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

💾

让 MJ 学我画两张小画儿

By: Steven
7 April 2024 at 12:58

昨晚吃饭前跟儿子一起画画,我随便画了一下我们在 Minecarft 里的第二个家,和随便画的一个岩浆包围的高堡:

后来想说看看 Midjourney 能模仿成怎么程度,就丢进去试了一下:

emmm,画得还行……

就是画风不太相关,它有它的训练痕迹,哈哈哈哈哈哈哈~

测试所使用的 prompt:

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

艺术可以糊弄,体力劳作也是高级智能

By: Steven
19 March 2024 at 21:05

昨天发现 AAAny 更新了发图的功能,于是就顺势发起了一个讨论 AIGC 的话题

轶轩在话题下问我为什么对外发表的图都是一些细节比较丰富的类型,是否有基于 AIGC 的生成方式而做的一些突破方向的尝试。我觉得,针对这个问题,我可以在对他的回复上,再做一期视频来谈一谈我的观点。

用于风格参考的马列维奇的画作
基于马列维奇而生成的《城堡下的人群》

但与此同时,我也想做一些「简练」或「抽象」的图来辅助说明我的看法。于是,今天在工作之余,用一些碎片时间,做了一些图出来。

对此,我尝试比较随意地做了一些「东西」。它们都没有什么明确的「表达」,仅仅只是我随手写的一些 prompt,或者就是在 Midjourney 的社区里复制修改的 prompt,最终出来的东西都是一眼看上去有一些「意境」或者没那么精致细节的但表现比较能唬住人的图像。

你会发现,在这些人类认为偏「抽象」的表达上,AI 反而是比较容易做「好」的。

但是,这种好不是真的好,只是这些风格上,并不需要对细节有很认真的考据,在表现层面上是非常容易「糊弄」的。

这也是现当代艺术作品常常被人诟病的原因之一,因为那些作品浓缩了大量的思考和抽象提炼,但表现形式上,其实并没有比传统艺术更复杂,或更需要技艺和体力上的付出。也就是说,作为当代艺术最核心的「观念」,在完全不需要理解的情况下,一个外行的人或者一个数据量管够的 AI 就可以模仿出「看上去像那么回事」的东西。这种模棱两可的状态,恰恰是江湖神棍和 AIGC 擅长处理的对象。

这里说的「糊弄」「神棍」并非贬义,而是借着世俗的话语体系来表达,这样的「生成作品」并不需要 AI 具备「意识」和「创意」也可以轻松地实现。

那么,什么东西是更难的呢?

细节,是令人信服的细节。

这些是我用 AI 生成的男士剃须刀的设计方案。

你会发现,这些方案咋一看是那么回事,但只要你多看两秒,立刻就会意识到它不对。它们的空间关系、形态的处理、物理交互的关系、电子器件的布局,通通都有很大的问题。这些就是不可信的细节。

因为 AI 实际上并不理解它学习的那些图像。

这些令人信服的关键点,是无法糊弄的。因为它们当中包含了大量精确的思考和训练,也包含了海量的脑力和体力劳动,如果一个「智能体」不理解一个图像背后的复杂逻辑,那么它就没有办法真正地创作出这个对象。它只能模仿,只要模仿得足够像,就可以唬住外行。但是对于以此为生的从业者,这样的智能工具,还不足以成为生产力。设计师可以用这样的工具拓展自己的思维,但这些过程并不能替代设计行为。

从创意到落地,中间还有漫长的路需要人类设计师去走完。

现阶段,更适合工业设计使用 AIGC 的方式是这样:

我的意思并不是让 AI 画手绘图,这仅仅是一种表现方式。但是,这是一种不需要追求精确的表达方式,很适合 AI 用「抽卡」的方式来快速堆想法。除了这种,当然也可以让它生成上面剃须刀那样的图,但同样的,目的不在于出方案,而是借助 AI 的海量数据库,快速地堆出一批发散性思维的「胡编乱造」的混杂图像来。

人类的视野有限,但 AI 看得一定比人类个体的平均值多。

工业设计不是天马行空地想象,它是一种「劳作」。

从初期的构思,从草图推延到模型和效果图,再从设计方案导入结构设计和工艺、制程,这意味着工业设计不是一项纯脑力劳动,不是一种只运行在计算机里的行为。它包含的体力劳作同样是设计的一部份,甚至可以说,是更关键的那部份。这种体力劳作,不仅仅是肌肉和工具的配合,更是人脑对环境、事件、社会群体、物质的反应和处理,设计师的动作意味着这个人对世界的认知。这种程度的认知,对于只运行在计算机内,仍然缺少复杂的传感器和理解过程的 AI 而言,暂时还是无法实现的。

我当然相信它未来会具备这样的能力,但是在目前的技术条件下,依然需要大量的人类来完成这些真正代表了「智能」的「体力劳作」。

欢迎加入我们的讨论:

https://aaany.app/aaa/ltwu3txza

想注册体验 AAAny 的话,请给我留言

我会给你留言的邮箱发送注册邀请码

運動無國界,嗎?

By: Steven
21 February 2024 at 21:35

🎥 點擊封面播放視頻

由一個提問開始,我從設計師與創作的角度,談論體育運動中的民族主義,警惕「分類」思維對思考過程的影響。

今日戶外步行運動記錄:開發了一條四分馬的路線!

🎥 B站播放地址:https://www.bilibili.com/video/BV1yv421k7Mg/

🎥 YouTube 播放地址:https://youtu.be/w2KQoic8LAg

這是春節過後的第一條視頻,主要是起個頭跟大家聊聊天。如果你有任何想法,歡迎在視頻中的彈幕或評論區里和其他人一起理性討論。

疲惫困境与一八定律

By: Steven
25 January 2024 at 19:05

近一年来,我非常低落。其中一个主要原因,是没有成功的经历。

小时候大家受到的教育都是说「失败是成功之母」,但这是错误的,或者说,这句话的成立是需要一些前置条件和约束范围的。成功之前可以有很多次失败的体验,但这个失败的体验必须是完整的。你得经历完整的周期,这样你失败的时候才有机会好好复盘,看看什么地方可以改进。每次周期结束后,都能获得一些经验。这样才能谈得上进步。

但如果你的失败是浅尝辄止,是一次次的试探,那么不会获得任何有价值的东西。你没有触及到失败的原因。

失败不会是成功之母,原因在于,一次次的失败不仅仅会击溃你的信心,也会一次次重创你的认知体系。最近《繁花》热映,大家都说「王家卫受害者联盟」壮大了。从所有控诉王家卫工作过程的演员嘴里说出来的,都是一次次的尝试和自我怀疑,是导演方法对演员自我信念的挤压。在我看来,王家卫就是拿着大量斯坦尼派的优秀演员,却用布莱希特的方法来达成自己目标的创作者。你给我五十种表演状态,我来剪辑成我想要的表达。这对创作者而言是开心的,因为手里拿着大量优秀素材,我想怎么搞都可以,我可以历遍无数种可能成功的体验;但对于经历其中的演员,就是既不知道什么可以,也不知道什么不可以,他没有经历过完整的失败和成功,他甚至不知道导演最终会剪出什么东西来,他是迷茫和无助的。这就是我目前的状态。我很清楚知道我可以,但在此刻这里,我不知道我可不可以。

回到失败这件事上来说,我这几年来的工作距离设计是越来越远,但我依旧可以从一些产品和项目的工作上获得少许的成就感;可是最近一年来,对接了那么多的人和事,都是非常飘渺的互相试探和观望。一次次的无疾而终和信息不对称性,让我一次次地触达不了失败的核心。我在这些事情上的体验,是不完整的,是稀碎的。

这让我感到非常心累。

我一直对前沿的技术趋势、市场、人性保持着观察,不断培养自己的洞察力,但这些东西在我目前的工作内容中都使不上力。或者说,这个体系和架构中,无力于实现那些尝试。

破碎感因此愈加清脆。

这些事情拖着我,以至于我连完整的视频都几乎没有产出过。此前,我还能通过做视频来给自己制造完整的创作流程和体验,从话题、逐字稿、拍摄、剪辑到封面设计和发布,整个过程既满足了我表达欲的抒发,也提供了「成功」的体验。这个「成功」指的不是视频成为爆款那种,而是在这件事情上的完整经历和反馈。这曾经是我的一个出口。然而,今年以来我因为各种事情而停滞了,视频创作所带了的成功体验也停滞了。

持续缺少正向的反馈,让我感到很疲惫。

最近在 Netflix 上看《贝克汉姆传》,正看到他当年因被罚红牌出场,导致英格兰队输给阿根廷后,举国上下对他持续的精神暴力。在那无数的负面反馈中,支持他走出来的,是父母和维多利亚,是曼联的兄弟们,是曼彻斯特的民众,对他的保护和鼓励。我不自觉地会联想到此时此刻的自己,除了筱烨和小柒,我感到孤立无援。这一年来,我能获得正反馈的渠道非常狭小。哪怕就是三月份去了一趟上海,跟熊小默、苏兆阳、小泽、akira 他们待在一起的两三天,都足以安抚我一整年。

失败是失败之母,成功才是成功之母。

人一定需要从一些事情中获得「成功体验」的正反馈,才能脱身。因此,我正在制作的年度回顾视频中,说了这么一段话:

人要直面自己的困境,用语言把它描述出来,它的可怕就消解了一半,直面它、盯着它、分析它,会再消解一半,开始动手,无论是多小的一步,一旦真正动起来,会再消解一半。此时,当你想要打破它,只需要做八分之一的功,这叫做「一八定律」。

我观照到了自己的问题,就得去解决它。

恢复体能训练、多做一些短的视频表达、多完成一些品牌合作、多做一些 AI 创作和表达的尝试,从一件一件力所能及的小事上获得「成功体验」,把自己从中拉出来。这是我接下来半年,对自己的责任。Flag 就不立了,立了不吉利;但从这篇日志开始,从目标在二月前一定要发布的年度回顾视频开始,我得拉自己一把。

❌
❌