Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

专访 OPPO 影像认知总监程卓:会打电话的哈苏,一定是未来

By: 周奕旨
17 October 2025 at 10:00

对我来说,一张人像不是一张关于一个人的照片,而是他与我之间发生的一些事。

2025 年末,全球将诞生近两万亿张照片,其中超过九成,来自我们口袋里的智能手机。

这些无比个人、无比随性的瞬间,汇聚成了这个时代的影像洪流。

OPPO 认为,在数量如此夸张的照片中,一定存在一个最大的「公约数」。

只有找准这个不变的靶心,才能集中所有火力,去攻克移动影像最核心的难题。

这个公约数是什么?

OPPO 影像认知总监程卓给出的答案,是人像。

人,是一切影像的尺度

为什么是人像?

这是我第一个疑问,非常简单直接,但又非常重要——

在移动影像的军备竞赛中,厂商们习惯于将长焦、广角、夜景等技术点作为攻坚的堡垒,但从 Find X6 开始,OPPO 却反复将这个看似最普通、却也最复杂的词挂在嘴边。

解读这个词,便能洞察 OPPO 对影像的根本理解,和最终想抵达的方向。

没有人像,就没有摄影史,这背后有更深的关于移动影像未来美学与技术的考量。

面对有些笼统的问题,程卓给了一个宏大视角的解释——OPPO 认为,想要摸清手机影像的方向,必须跳出手机这个小小的取景框,将视野拉回到整个摄影史的长河中去审视。

在这近两百年的时间里,器材和载体一直在变,但有些东西是恒定的:

你甚至可以理解为,整个摄影史就是一部关于人的影像美学与社会文献史,如果把其他题材拿掉,摄影史可能只是没那么饱满,但如果抽掉人像,那整部历史就坍塌了。

程卓进一步阐述,无论是从推动技术革新的要求,还是从承载艺术成就的高度来看,人像都是贯穿整个摄影史的基本轴线。

《无题电影剧照》第二十一张——1978 年,Cindy Sherman

《无题电影剧照》第二十一张——1978 年,Cindy Sherman

作为一个不太拍人像的摄影师,我下意识地质疑这句话,但细思下来,这句话的确并非夸大其词——

纵观影史任何题材,都离不开人的参与、人的存在以及人存在过的痕迹。

它是一张面孔,可以像《阿富汗少女》那样,用一个眼神承载一个民族的苦难与坚韧;它也是一个瞬间,能将战火中奔跑的女孩所代表的残酷,或是巴黎街头跃过水洼的诗意,凝固成永恒;甚至在亚当斯看似空无一人的壮丽风景里,我们看到的依然是人类精神的向往与烙印。

PARIS SOUS LA PLUIE # 2——ELLIOTT ERWITT

PARIS SOUS LA PLUIE # 2——ELLIOTT ERWITT

人的面孔、姿态、情感、存在过的痕迹,跨越题材,始终是摄影师镜头下最核心、最着迷,也最具感染力的共振媒介。 

由此,人像两个字的背后,承载了无可替代的文献价值、人文价值与情感价值,一个「人」字,关乎美学、也关乎我们如何看待自身与世界。 

若是用一个我们熟悉的词来概括这一切,就是以人为本。 

其实说到这里,已经可以察觉,OPPO 的意图,已经从早期狭义地记录人物的样貌的「肖像」,走向更广义地记录某些群体的生活环境、某个人的具体处境的「环境人像」——这也是 OPPO 在移动影像领域首先提出这一观点背后的深度思考。

《我们这个时代的面孔》摄影师奥古斯特·桑德

《我们这个时代的面孔》摄影师奥古斯特·桑德

这种趋势,在每年的 OPPO 影像大赛(imagine IF Award)上也能看到。

OPPO 年度超影像大师-梁喜兵拍摄

OPPO 年度超影像大师-梁喜兵拍摄

当然,哲学的选择,终须技术的回答作证,程卓认为从技术层面看,人像这个题材的包容性就像航天发展对于民用科技的促进那样,同样强大——

人像是一个相当特别的题材,它最难,也最保值,最有推动力,它像一块最硬的骨头,一旦啃下来,其他的影像难题便有了迎刃而解的基础。

人,是一切影像的尺度

确立了「人像」为灯塔,一个更具体的问题便接踵而至:

什么样的人像,才是「好」的?

美学是感性的,一百个读者可以有一百个哈姆雷特,但对于掌舵移动影像的厂商之一,OPPO 必须将好看拆解成可以评价的维度,才能在影像的汪洋中走得稳、走得准。

程卓的回答,让我有些意外:

我们最终想做出来有「相机感」的影像。

「相机感」,这个听起来有些玄妙的词,是程卓整个影像认知团队的工作靶心,也是他们认为「好照片」的标准。

他们将这个词儿进一步拆解开来,分为三个要素,分别是: 

  • 影调 

  • 色彩 

  • 画质

影调的重塑工作,从 Find X6 系列就开始了,目标是建立「正确的影调关系」,将扭曲的光影曲线拨乱反正,这是地基,是让一张照片首先「看起来舒服」的底线:

我们早就明确,不能为了秀肌肉,把光影关系搞得很别扭。

地基打好,Find X7 系列开始构建大厦的框架——攻坚「中间调」。

「中间调」这个词,对于普通用户来说可能有些陌生,但对于摄影师而言,它是一张照片的灵魂所在,程卓解释说:

大家可能对中间调不太熟悉,它不是画面最中间的部分,我们参考安塞尔·亚当斯的区域曝光理论,在对动态范围的极致追求下,重点管控的是 3 区到 7 区的影调关系,这里面既有高光也有暗部,是最能体现影像厚实感的影调区域,是影像魅力和表现力的核心所在。

安赛尔亚当斯的分区曝光理论

安赛尔亚当斯的分区曝光理论

如果说极致的黑与白是情绪的两端,那丰富、细腻、过渡自然的中间调,就是承载故事的主体,对中间调的精细打磨,让 OPPO 的影像开始呈现出一种过去手机罕见的「质感」。

Tina Signesdottir Hult

Tina Signesdottir Hult

理顺了过去,未来的道路也呼之欲出了:

只有把影调这个骨骼做健康了,色彩才可能谈得上丰富而又统一,才不会有「塑料感」。

OPPO 从 Find X8 Ultra 开始,正式向摄影史的「深水区」——复杂光线下的色彩表现发起冲击: 

这已经进入摄影史的「深水区」了,在复杂光源下的色彩表现,一直是摄影史上最难的问题之一。

演唱会变幻的舞台光、城市霓虹与路灯交织的夜色、餐厅里温暖的烛光……真实世界的光线远比胶片甚至数码相机时代更为复杂。 

如何在这种环境下,还原出既真实又富有美感的色彩,尤其是人的肤色,是影像能否成为「作品」的关键。 

通过首次搭载的丹霞原彩镜头,智能地将画面分区,对不同光源下的不同区域进行独立计算和色彩还原,最终融合出一张和谐自然的照片,保证人物肤色的准确,为解决这个行业难题,迈出了关键一步。

至此,OPPO 完成了从影调到色彩的基础构建,但要真正实现「相机感」,还有一座最高、也最难攀登的大山——画质。 

也正是在这里,程卓抛出了一个反直觉的论调: 

摄影诞生之初,其实没什么画质问题。

之所以这样说,是因为当摄影出现后,大家使用的都是尺寸远超今时今日所有主流拍摄设备的「大画幅」——这个逻辑也延续至今,画幅大就是王道。 

真正的挑战,始于摄影权利的普及: 

画质的挑战,恰恰来自于相机要小型化,想要更多的人拍照,相机就势必越来越小,而画质问题也随之出现。我们现在要做的,就是在尽可能轻薄的机身里,把画质尽可能地做好。

于是,OPPO 在 Find X9 系列上延续前面历代打磨好的影调功夫、全系普及丹霞色彩还原镜头外,对画质这座高山也提出了相应的要求——

在 Find X9 Pro 上,OPPO 搭载了与哈苏联合研发的全新两亿像素长焦,光圈达到了夸张的 F2.1——这是目前进光量最大的两亿像素长焦,结合精度达 0.1 微米的 AOA 主动光学校准技术,在硬件上做到了极致。

而要实现清晰画质,多帧融合必不可少。在算法层面,OPPO Find X9 Pro 首次支持了「2 亿像素多帧融合计算」,可同步采集3帧 2 亿像素原始图像并进行智能融合处理,直出真哈苏 2 亿超清照片。

这些努力的目标只有一个:在长焦端,实现前所未有的解析力。

而作为基础的广角主摄,则首次搭载了第四代传感器曝光技术。这颗与索尼联合研发的「满血版」LYT-828 传感器,支持「瞬时三曝光」,在大幅拓宽动态范围性能的同时,也显著增强了抓拍能力,实现了高动态与高速抓拍的兼得。

强大的硬件之上,如何处理巨量的像素数据,OPPO 带来了全新的 LUMO 超像素引擎,将「画质好」这件事,贯穿到了所有场景——Find X9 系列会判断当下环境的条件,在条件充足时,智能提供 5000 万像素的 8K 超清照片直出。此外,用户首次能在小红书上发布的 4K 超清实况照片,封面帧与动态画面,也都拥有一致的 4K 超清质感。

清晰是画质的骨架,而精准的色彩还原,则是其血肉。 

在 Find X9 系列上,OPPO 带来了第四代色彩还原方案——升级后的丹霞色彩还原镜头被扩展到全系列机型,它能更智能地与影像硬件全面协同,尤其在以往手机最头疼的低色温、大面积纯色等场景下,带来前所未有的色彩准确性。 

只有做到了精准的还原,才有资格谈论画质。

至此,影调、色彩、画质三位一体,OPPO 所憧憬的「相机感」轮廓已然清晰,什么是好人像这个开放性问题,也有了一套逻辑严密的闭环答案。 

或许会有人质疑,在移动影像的时代,为何要执着于回望「相机」,程卓是这样理解的:

无论手机影像怎么卷,也只是漫长摄影史中的惊鸿一瞥。近两百年培养起来的摄影美学,有着不可抗拒的向心力和矫正作用,为我们指引着方向。

换言之,OPPO 并非让手机完全取代相机,而是在汲取相机百年沉淀的养分的同时,结出属于移动影像时代自己的果实。

那么,这个移动影像自己的东西,是什么呢?

计算摄影,是移动影像的独属道路

在聊到「相机感」的三个要素时,程卓反复提到了一个词儿——计算摄影。

这就是移动影像的新东西。

不可否认,对比相机,手机这种需要在螺蛳壳里做道场的方案,在光学层面永远戴着镣铐,但它也拥有相机无可比拟的优势——算力强劲的芯片,让计算摄影成为了可能。

老实说,在过去很长一段时间里,计算摄影的名声算不上好。 

为了弥补硬件的不足,过度锐化、过度提亮的「计算味」成了主流,照片看似光鲜,却充斥着塑料感,算法痕迹流于表面,向用户邀功。 

人们开始厌恶计算摄影,这是算法「用力过猛」的必然结果。 

而 OPPO 的解法,便是为这头算力猛兽套上审美的缰绳——用程卓的话来说,就是用审美牵引技术的发展。 

如何牵引?OPPO 的方式是「修内功」—— 

团队深入研究了各种经典胶片,用极其客观、量化的方式去拆解它们的光影响应曲线和色彩科学,再将这些从物理和化学世界中总结出的美学规律,「翻译」成数字世界的算法语言。 

Find X6 系列的影调、Find X7 系列的中间调,以及备受欢迎的胶片风格,都是由此而来的。

紧接着,就是在 Find X9 系列上,用强大的算力与算法,为更高画质提供可能。 

这种「审美先行」的工作模式,迥异于我们更为熟悉的「技术有什么,产品用什么」的开发逻辑,程卓所带领的影像认知团队将率先标定一个明确的审美方向,再由算法、硬件、调校等各个团队协同,集中力量办大事儿,朝着这个既定方向去实现。 

也由此,我们在 OPPO 的影像传承上,得以看见手机领域较为少有的长期主义。

我们的团队就像一个指南针。 

程卓这样形容自己和影像认知团队的角色。 

这根指南针,为强大的计算摄影指明了方向,最终的成果,是让计算隐于无形,让摄影重回中心。 

计算摄影,成为了 OPPO 的审美载体,将成熟的影调、健康的色彩与优秀的画质打包成方法论,用户按下快门,就能得到一张好照片的办法。 

一如柯达百年前的浪漫口号:

 你只需要按快门,剩下的交给我们。

走入影像的深水区,三个突破口

采访的最后,我们聊到了一个更宏大的话题:移动影像的痛点和未来。

程卓认为,行业尚未完美解决的,是三个进入「深水区」的终极问题:

画质、高动态下的复杂光线,以及长焦。

如今的旗舰手机,已经从单纯的堆料,走向一边追求极致影像,一边还要向厚度与设计发起挑战。

正如程卓所说,画质的痛点,正是伴随器材小型化而生的历史性难题,而手机,依然在这条路上作斗争。

另一面,高动态下的复杂光线,背后则隐藏着新元器件的研发与计算摄影两道难题,如何解决多颗镜头的画面一致性、如何更好地还原人的表现,都是亟待解决的问题。

至于长焦,则是对机身设计、防抖性能与焦段设置的权衡,这颗小小的镜头,还在寻找工业与人文之间的最优解。

这三者,恰是构成「相机感」不可或缺的基石,也与 OPPO 选择的「人像」息息相关,三个要素环环相扣,共同决定了一台手机影像能力的上限,只要有任何一点取得关键进展,移动影像就有希望再前进一步。 

在采访的最后,严肃了一整场对话的程卓难得调侃了一下: 

X8 发布后,我一个艺术家朋友有一天打电话给我,说:卓哥,我买了一个哈苏。

我说:你买哈苏不是很正常吗?

他说:可是我的哈苏会打电话!

「会打电话的相机」,这一定是未来。
让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刘棠希|把底层视作牛马?“驭民五术”背后的情绪逻辑

12 October 2025 at 05:16

很多年前的网络上,苏绰的“具官论”曾大肆流传:

某天,西魏权臣宇文泰问大臣苏绰“何以立国”,对话就此展开。

CDT 档案卡
标题:刘棠希|把底层视作牛马?“驭民五术”背后的情绪逻辑
作者:刘棠希
发表日期:2025.10.11
来源:微信公众号“刘希提灯夜行”
主题归类:以史为鉴
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

苏绰的回答让人触目惊心,他说:“用贪官,弃贪官。”

宇文泰又问:“贪官何以用?”

苏绰的话翻译如下:

“贪官要用,也要抛弃,这就是权术的奥秘。天下没有不贪的官员,贪污没什么可怕的,可怕的是他们不够忠心。那些不忠的官员就是异己,利用肃贪的名义清除他们,如此一来,君主既可以高枕无忧,还可以落个反腐的美名,何乐不为?”

“官员贪腐,国君才好控制他们,如果他们不贪就没有把柄,难以驾驭。如果国家全是清官,老百姓倒是开心了,但君主的位子就岌岌可危了。”

“要利用好贪官,用反腐来表明君主的立场,让朝野都知道君主也恨贪官,违法乱纪的是贪官,国之不国不是君主的错,是贪官的错,如此一来民怨就消除了。”

《具官论》

……

这段对话以文言文写就,最初标明的出处是《北史•列传•卷六十三》,后来又说出自《周书•苏绰传》,遗憾的是,两本史书中都没有与之对应的记载。这段用文言文精心炮制的谣言不攻自破。

但是,网络上至今仍然流传着苏绰的这套“具官论”,仍有许多人相信这是古人的权术阴谋,造成难以消除的负面成见。

img

以此为引,我们要说另外一个流传面更广、影响力更大、情况更为复杂的争议——驭民五术。

所谓“驭民五术”,指的是愚民、弱民、疲民、辱民、贫民。

愚民:统一思想,使民愚昧无知,只知道唯命是从。

弱民:国强民弱,治国之道,务在弱民。

疲民:为民寻事,疲于奔命,使民无暇顾及他事。

辱民:一无自尊自信;二唆之相互检举揭发,终日生活于恐惧氛围中。

贫民:除了生活必需,剥夺余银余财,人穷志短。

网络流传的驭民五术

这只是“驭民五术”的一个版本,另有版本在五术之后还加了一句“若五者皆不灵,杀之!”

无一例外,各版本宣称这套帝王权术源自商鞅和《商君书》。

“驭民五术”的说法不止存在于网络,许多出版作品中也有这一说法,例如《西方人文经典演讲录》《历史这么有意思》等等。

那么,“驭民五术”的真相到底是什么?

需要澄清的是,商鞅从未提过“驭民五术”,《商君书》也没有这个说法,甚至连“驭民”二字也没有,“驭民五术”是后人根据该书内容概括而来的。

以中华书局石磊译注版的《商君书》为参照,我们来具体说说这驭民五术。

img

第一,愚民,有的版本也称“壹民”。其核心理念是统一思想,让百姓愚昧无知,只知道唯命是从。

《商君书》中的确多次出现“民愚”二字,最贴近愚民思想的一句是“民愚则易治也”,民众愚昧就容易统治。联系上下文,它要表达的意思并非是“使民众愚昧”,而是要统一法令,让人人都能守法。

书中其他几处“民愚”与此类似,都不是让民众变得愚昧。

但是,《商君书》中的确存在统一思想、清除儒家思想以及禁止思辩的主张,这与五术中的“愚民”如出一辙。石磊译注版《商君书》前言中也说,“愚民政策”是该书不可取的观点之一。

第二,“弱民,国强民弱,治国之道,务在弱民。”

《商君书》有专门的《弱民》篇,里头也的确有“民弱国强,国强民弱。故有道之国务在弱民”一句,直译过来是“民众弱,国家就强;民众强国家就弱。”

看起来十分贴切弱民的观念,但书中所说的强指的是“放纵”,弱指的是“质朴”,合起来的意思“民众质朴就弱,弱就会守法;民众放纵就强,强就会肆意妄为不受控制。”

所以,弱民的字面意思并不是“让民众变得弱小”,而是让民众变得更加质朴。这其实是商鞅“农战”思想的延伸。

在商鞅看来,只有务农才能质朴,才不会变得放荡。“让民众变得弱小”明显也不符合商鞅的变法逻辑。在变法前的御前辩论中商鞅就说过,只要对人民有利,就不必因循守旧。

从国家变强的逻辑上看,“弱民”也不是成功之道。秦国的百姓是国家的税源、兵源,让百姓变弱不等于让国家变弱吗?一群弱小的人又怎么能攥成一个强大的拳头?

第三,“疲民:为民寻事,疲于奔命,使民无暇顾及他事。”

《商君书》中并无“疲民”的说法,这里说的可能是书中的“杀力”,也就是集中民众的力量参加战争。书中的解释是,消耗民众的力量是为了消灭敌人,鼓励民众立功。

也就是说,商鞅并不是让君主无缘无故地去消耗民众,而是要集中这股力量投入战争,这当然会使民众疲惫,但秦国的最终目标是富国强兵,并非疲民。

当时的秦国面临的是生存危机,战争是不可避免的,他的变法是一种战时法治,不是和平时期的治国宝典,所以疲民不是目的,而是可能造成的结果。

第四,“辱民:一使之无自尊自信;二唆之相互检举揭发,终日生活于恐惧氛围中。”

《弱民》篇中有类似的说法,但它的表达是这样的:“民,辱则贵爵,弱则尊官。”民众地位卑弱就会崇尚爵位,怯懦就会尊敬官吏,这里的“辱”指的是地位,不是侮辱民众,让他们没有自尊和自信。

而且这句话只是一种现状陈述,并非主张让民众处于“地位卑弱”的状态。

说句诛心的话,在战国及后世封建王朝中,民众地位卑下不都是事实吗?统治者根本不需要出台任何政策和措施,普通百姓本就处于社会底层。

《商君书》陈述这个现状是为了引出后面的策略,既然百姓地位卑微又弱小,那就通过赏赐来鼓励他们改变现状,这也是商鞅变法推出军功爵制的理论基础,商鞅的目的,是让地位卑弱的百姓也能通过军功获得爵位。

所以,“辱民”不存在侮辱民众的意思。

至于“互相检举揭发,终日生活于恐惧氛围中”,这应当是指商鞅变法时推行的“连坐法”“告奸法”。

实事求是地说,“让民众互相检举揭发”的确是商鞅变法追求的效果,但他的初衷并非让百姓“终日生活于恐惧氛围中”,而是防止作奸犯科的人影响农战。所以,这一点也存在片面之处。

第五,“贫民,除了生活必须,剥夺余银余财,人穷志短。”

这个说法简单理解就是让百姓为生活而奔波,让他们时刻在生存线上挣扎,无暇顾及其他。

《说民》篇对此的论述是“民众贫穷,那么国家就弱;民众富裕,那么就会放纵自己。”

所以,它并非主张要让百姓处于贫穷状态,而是“令贫者富,富者贫”。

学者叶自成认为,这句话中的“贫”“富”含义不一:“令贫者富”中的“贫”指的是赤贫,“富”指小康或小富;而“富者贫”中的“富”指的是大富、巨富,“贫”则是小康或小富。

《商君书》的意思,一个国家不能有太多赤贫的人,也不能有太多有钱人。可以理解为一种中间状态,不让百姓变穷也不能让他们太富,这是一种极端的“均贫富”思想。

比如书中提到,如果有人通过田地(比如地主)变成巨富,那就让他用粮食换爵位,这样他就不会在耕作上怠惰。

这说到底还是为了“农战”,其目的是防止民众过富而疏于农战,同时也不希望民众贫穷导致国家无法生力。

因此,“贫民”的说法不够客观,它提倡让百姓处于“贫富”的中间状态,而非真正的贫穷。商鞅变法也的确以此为目标,他重农抑商,最终乡邑大治,秦国“家给人足”,这显然不可能是“贫民政策”的效果。

此外,商鞅对军功的高规格奖励也与“贫民”政策背道而驰。一个农民在前线斩首立功,人还没回来这边就给田地、给宅基地,这能是一种剥夺吗?

作家冯唐借用企业管理的法则回应过“驭民五术:

疲民,是指疲于奔命。为什么要疲于奔命?疲于奔命的人民、军队,如何能战胜别国?辱民,更不是商鞅想做的事情。如果军队、人民都被侮辱了,你怎么能期待他们拼命去打胜仗?贫民,剥夺余财,这跟不上业绩管理。

之所以说“驭民五术”只是存在争议而非谣言,正是因为它存在一部分客观的描述。但是,整体分析下来我们又能发现,商鞅所谓的“驭民五术”与真实历史相去甚远,并且也有以今度古的嫌疑。

“驭民五术”中最后一句——“若五者皆不灵,杀之”——情绪化太浓,非但不符合历史,也跟常识相去甚远,所以没有分析它的必要。

在许多人眼中,驭民五术是历代专制君主的常用权谋,不管皇帝们看没看过《商君书》,但是他们的许多做法都跟五术不谋而合。

更激进的观点甚至认为,驭民五术造成中国封建王朝长期暗无天日,更是中国近代停滞不前、屡屡遭受外敌欺凌的思想根源。

这显然是对着空靶子开枪,而且言过其实。当然,“驭民五术”的出现也并非单纯的读史错误,它产生的原因应该和苏绰的“具官论”类似,这里就不做深究。

总体而言,《商君书》中的确存在许多糟粕,例如道德观念淡漠、缺少人道主义关怀、将民众工具化等等,为此,商鞅也付出了沉重的名誉代价。但如果说《商君书》和商鞅是古代中国所有苦难都始作俑者,那未免也太看得起商鞅了。

img

再说句无奈的话,《商君书》中的许多思想并非商鞅原创,其变法时的主张也都是借鉴改良而来。商鞅之后,还有《韩非子》这样更加露骨的法家著作,如果要怪罪,商鞅总有垫背的。

泰勒·斯威夫特再次陷入 AI 风波,但这次粉丝「倒戈」了

By: 莫崇宇
9 October 2025 at 21:24

屡遭 AI 伤害的泰勒·斯威夫特,最近却因 AI 被粉丝「围攻」了。

起因是一场全球营销活动。

为了宣传她的第十二张专辑《The Life of a Showgirl》,泰勒·斯威夫特(Taylor Swift,昵称霉霉)在上周末联手 Google 策划了一次寻宝游戏,在 Google 上搜索这位歌手的名字,就会看到一条神秘提示:「12 个城市、12 道门、1 个待解锁的视频。」

接着,粉丝需要根据线索去世界各地找这 12 扇「门」,扫描门上的二维码,就能看到 12 个视频,每个视频里都有解谜的线索。当粉丝们集体解出正确答案并在 Google 输入那句话时,会出现一扇橙色的虚拟门。大家得一起疯狂点击这扇门 1200 万次,才能「敲开」它。

最终,门被「打开」,专辑曲目《The Fate of Ophelia》的歌词版 MV 将正式上线。

这本是一次充满仪式感的粉丝狂欢,直到有人开始逐帧拆解视频。

联手 Google 搞营销,却被粉丝扒出 AI 的「马脚」

一些忠实的粉丝注意到,宣传的视频里出现了许多诡异的画面:

  • 长着两个头的旋转木马,酒保的手凭空穿过一张纸巾
  • 一个小型摩天轮的辐条在转动时出现了模糊和不自然的形态变化。
  • 挂在衣架上的两件外套的衣架似乎融合在了一起
  •  …

除此之外,粉丝们还指出了视频中普遍存在的其他视觉瑕疵和伪影,整体画面透着一股廉价 CG 的塑料感。而这些,都是 AI 视频生成的典型穿帮。

据连线杂志引用 AI 检测公司 Reality Defender 的结论:部分片段「极有可能是生成式 AI 制作」。

截至发稿前,Google 与霉霉团队都没有回应,但外界普遍猜测这些视频可能采用了 Google 刚发布的 Veo 3 AI 视频生成技术。

Veo 3 是 Google DeepMind 旗舰级 AI 视频生成模型,它能根据文本或图像提示,自动生成高清短片,风格从电影预告到 MV 都能自适应。

有网友猜测,Google 与霉霉的合作本身就是一个信号:巨头们急需为其 AI 工具寻找「杀手级应用」场景, 而娱乐营销正是最佳试验场。

传统制作一支宣传片可能需要高昂的费用和数周时间, 而 AI 可以不断压缩时间和金钱成本。对于需要持续产出内容的艺人团队而言, AI 是难以抗拒的诱惑。

伴随着相关报道的不断涌现,X 和 TikTok 等海外平台上掀起了话题 #SwiftiesAgainstAI,粉丝们不仅针对 AI 技术本身, 更指向一种对偶像的背叛感。

你被刺伤之后,怎么能反手拿起那把刀?

粉丝的愤怒,源于霉霉一贯的立场。

2024 年 1 月,大量由 AI 生成的、带有露骨色情内容的霉霉图片在 X 等平台病毒式传播 。其中一张图片在被删除前,浏览量就已超过 4700 万次 。她也因此成了 AI 滥用最著名的受害者之一。

面对这场恶意的网络攻击,霉霉的粉丝群体迅速组织起来。

她们发起了 #ProtectTaylorSwift(保护霉霉)等话题标签,用积极正面的内容冲刷和覆盖恶意图片的传播,并大规模地举报发布这些滥用内容的账户 。

除了色情滥用,霉霉的形象还被用于制造政治虚假信息——比如伪造她给特朗普「背书」的视频 。在回应这一事件时,霉霉发表了她对该技术最直接、最公开的谴责。

「这真的唤起了我对 AI 的恐惧,以及它在传播虚假信息方面的危险。」

如今,这句话被不少粉丝反复引用,成了「打脸」她的铁证。

许多粉丝认为,一个曾公开表达对 AI「恐惧」并亲身经历其危害的人,更不应该在自己的商业活动中采用这项技术。

更重要的是,霉霉从出道起就把「真实」和「创作主导权」当作事业的底线。比如她为了夺回自己前六张专辑的母带版权,不惜重新录制所有歌曲,那场「Taylor’s Version」圣战让粉丝们坚信:

她是站在创作者这一边的。

然而,生成式 AI 技术的一个核心争议点,恰恰在于它抓取学习其他艺术家海量作品时,往往未经许可、不付报酬。因此,在粉丝看来,当她(或者她的团队)用 AI 来生成视觉内容时,她其实是站到了创作者的对立面。

需要补充一个细节,多年来,泰勒·斯威夫特和她的团队刻意塑造了一种「亲力亲为」的创作形象。这种设定让粉丝更死心塌地,却也让她在争议面前失去了甩锅的余地。

当危机爆发时,「那是团队的决定」这类说辞就会彻底失效,因为粉丝不会相信一个全程操盘的大艺术家,会对宣传片的制作方式毫不知情。

于是,质疑的声音像潮水一样涌来。

拥有 50 万粉丝的博主 Ellie Schnitt 写道:

「你比任何人都清楚 AI 带来的伤害,你应该知道该怎么做(You know better, so do better)。」

Reddit 上的评论也一条比一条扎心:

「她是全球最成功的艺术家, 不缺钱不缺人, 为什么要用 AI?」

「她一直呼吁艺术家获得公正报酬, 这次却无视了创作劳动。」

「她不需要靠这种方式,这完全是多余的。」

作为霉霉的忠实粉丝,巴西设计师 Marcela Lobo 说出了最致命的一句评价: 「2017 年她还没这么红, 都愿意雇人做精致视觉。如今预算充足, 反而用了 AI。」

言外之意是,当一个艺术家成功到不再为预算发愁时,却反而更可能为了效率而放弃对细节的坚守。

这几乎是一种成功的诅咒:规模越大,越依赖工业化流程;越工业化,越容易为 AI 打开缺口。在这个过程中,即便是艺术家,也会不知不觉地从被 AI「威胁」的受害者,滑向了主动使用 AI 的争议方。

我们还没准备好,生活在一个由 AI 主导的世界

AI 与音乐影视行业的纠葛,早已进入说不清道不明的「灰色地带」。

近期知名影星 Will Smith 就卷入了类似的争议。他在社交媒体上分享的一段演唱会宣传视频中,观众席里出现了扭曲模糊的脸孔和奇怪动作,被网友指责疑似责合成观众(即用 AI 生成粉丝的画面)。

有网友表示难以理解「这么有钱有名的人还要用 AI 合成观众……」面对质疑,Smith 后续在社交平台上又发布了一个以 AI 喵星人为主题的视频,戏谑批评者。

而在更深层的领域,AI 甚至开始取代真人演员。

英国公司推出「AI 女演员」 Tilly Norwood——精致五官、流畅口音、完整履历、活跃社交账号。她不存在, 却签了经纪约, 抢走了真人演员的工作。有人也在社交媒体讽刺:「谢谢你让我丢了饭碗。」

这些事件都在传递一个信号:AI 已经能够渗透到艺术创作的每一个环节——从演员、观众,到声音、画面、编剧、剪辑。

人类艺术创作的地盘,正在被生成式 AI 一寸寸蚕食。

与此同时,AI 版权的边界,也正在法庭和商业实践中被重新定义。OpenAI、Google、Anthropic 等公司都在法庭上,为使用受版权保护的作品训练模型是否构成合理使用大为辩论。

OpenAI CEO Sam Altman 最近在接受采访时则大胆预测,社会最终会认定,用于模型训练的数据属于「合理使用(fair use)」。

但他认为,直接用 AI 生成受版权保护的内容,则会出现新的规则和商业模式。

他甚至观察到一个新趋势:许多版权方已经从担忧「AI 用了我的角色」转变为担忧「AI 用我的角色用得不够多」。如今,诸如迪士尼、华纳、Netflix 等公司正在测试基于 AI 的 IP 授权方案,允许角色形象、声音与粉丝进行 24 小时对话互动。

那么问题来了,艺术家能不能用 AI?

答案不是「不能」,而是不能「造假」。如果 AI 参与了创作,就该被如实承认。

比如最近,博主 @章鱼养殖基地有话就说版 发帖称,知名美术约稿平台「米画师」在发布约稿请求时,所提供的参考示例图疑似为 AI 生成的作品。对此,该博主更是直接质疑:「米画师官方带头用 AI?」

▲图片出自博主@章鱼养殖基地有话就说版

其实争议的核心并非 AI 技术本身的存在,而是艺术创作者们能否坚守立场,为人类创作的独特价值划定一条不可逾越的底线。

AI 生成内容的根本问题是,它不劳作、不感受、不挣扎——它只是重组过去的作品,伪装成新的创作。它是零劳动的产出。而艺术的本质,恰恰在于不可替代的人性——在失败、偏执、笨拙、意外、反复修改中生长的那种温度。

正因如此,当粉丝们在社交媒体上高举 #SwiftiesAgainstAI 的旗帜, 也是在用他们的方式告诉世界: 艺术的价值, 源于创作者灵魂的在场,而人类还没准备好生活在一个 AI 主导的世界里。

至少现在还没有。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,OpenAI 宣布打造 「ChatGPT 操作系统」,8 亿用户将迎来全新体验

By: 莫崇宇
7 October 2025 at 11:25

2023 年,OpenAI 只有 200 万周活开发者、1 亿周活用户。

两年后,在 OpenAI 刚刚召开的 Dev Day 上,CEO Sam Altman 在会上透露:如今已有 400 万名开发者在使用 OpenAI 构建产品,超 8 亿人每周用 ChatGPT,API 每分钟处理 60 亿 tokens。

多亏了大家,AI 已经从人们拿来玩的东西,变成了人们每天都在用来创造的工具。

就冲这增长速度,可以说是赢麻了。

而且就在上周,OpenAI 通过一笔 66 亿美元的股权交易,公司估值直接冲到了 5000 亿美元,超过了马斯克的 SpaceX,成为全球估值最高的初创企业。

DevDay 划重点:

  • ChatGPT 变超级 App:对话中直接调用第三方应用,AI 主动推荐工具,支持应用内交易变现。
  • AgentKit 工具包上线:可视化拖拽搭建多 Agent 工作流,几分钟完成从开发到部署的全流程。
  • Codex 全面开放:自然语言实时写代码,支持语音控制和 Slack 集成,自动审核 PR 提升团队效率 70%。
  • 模型 API 大升级:最强 GPT-5 Pro 开放 API、语音成本降 70%、Sora 2 支持产品内视频生成和精细控制。

ChatGPT 里直接装 App 了

今天,OpenAI 扔出个重磅炸弹——ChatGPT 现在可以直接调用第三方应用了。

X过去你可能得专门下载 App;现在只需一句话,Spotify、Canva 等应用就能在对话中自动唤起,还能提供可直接操作的交互界面。
如果你已经订阅了某个外部服务,还能在 ChatGPT 里直接登录账户,无缝衔接。

从今天起,除了欧盟地区,所有登录用户都能用,覆盖 Free、Go、Plus 和 Pro 计划。首批试点合作伙伴阵容相当豪华:Booking.com、Canva、Coursera、Figma、Expedia、Spotify、Zillow 等一众大厂。

现场演示环节更是精彩。

OpenAI 员工打开 ChatGPT,直接让 Canva 给一家遛狗服务公司设计宣传海报。几秒钟后,Canva 就给出了好几种设计方案。

然后这哥们又请求基于海报内容生成一份商业展示 PPT——这一套组合拳下来,丝滑得不行。

接着,他又通过 ChatGPT 调用了 Zillow,让它展示匹兹堡地区的待售房屋。Zillow 瞬间生成了一张可交互地图,用户还能进一步提问了解更多细节。

更智能的是,当 ChatGPT 觉得某个应用能帮到你时,它还会主动推荐。

比如你说「帮我做个派对播放列表」,它可能直接唤起 Spotify 来协助——这波操作,属实有点东西。

这一切的背后,是全新发布的 Apps SDK(应用开发套件)。开发者现在可以使用 Apps SDK 预览版开始构建自己的 ChatGPT 应用。

值得一提的是,Apps SDK 构建在 Model Context Protocol(MCP)之上——这是个开放标准,允许开发者把外部数据源连接到 AI 系统,同时也意味着用这个标准构建的应用能在任何兼容平台上跑。

正如 iOS 提供操作系统,App Store 负责分发变现,最后组成移动互联网生态。现在 ChatGPT 就是操作系统,Apps SDK 是开发工具,8 亿用户是生态基础。说白了,就是 ChatGPT 要变成超级 App 了。

此外,今年晚些时候,OpenAI 还将开启应用提交流程,推出专属应用目录,并公布变现机制——包括支持全新的 Agentic Commerce Protocol,能在 ChatGPT 内实现即时结账与交易。

AgentKit 登场,造 Agent 从此不愁

今天 OpenAI 正式推出 AgentKit——一整套专为开发者和企业打造的完整工具。

在此之前,构建 Agent 简直是个噩梦:复杂的流程编排、自定义连接器、手动评估、上线前还要花好几周开发前端。现在有了 AgentKit,包括三大核心组件:

  • Agent Builder:用于创建和管理多 Agent 工作流版本的可视化画布
  • Connector Registry:管理员集中管理数据与工具互通的中心
  • ChatKit:能将可定制的聊天式 Agent 体验嵌入产品的工具包

具体来说,Agent Builder 提供可视化画布,支持通过拖拽节点来编排逻辑、连接工具,并配置自定义安全规则。支持预览运行、内嵌评估设置以及完整版本控制。

发布会上,Altman 也将这个功能比作「用于构建智能 Agent 的 Canva」。

OpenAI 还推出 Connector Registry(连接器注册中心),让开发者能够通过 管理员控制面板 安全地将 Agent 连接至
内部工具或第三方系统,同时确保数据安全与访问控制。

ChatKit 则让开发者轻松将基于聊天的智能 Agent 嵌入自己的产品中,无论是应用还是网站,都能根据品牌主题深度定制。合作示例包括 Canva、LegalOn、HubSpot。

去年 OpenAI 推出了 Evals,帮开发者测试提示词并衡量模型行,今年则新增了四项强大能力:数据集、追踪评分、自动提示词优化、第三方模型支持。

此外,强化微调(RFT)让开发者能定制 OpenAI 的推理模型。目前 RFT 已在 GPT-5-mini 上全面开放,并在 GPT-5 上以私测形式提供,还引入了自定义工具调用和自定义评分器两项新功能。

仅用时 7 分 11 秒,OpenAI 员工就为 Dev Day 网站从零搭建了 AI 助手。通过可视化方式添加分类 Agent 、路由节点、Sessions Agent 处理会议日程、Dev Day Agent 处理通用查询,还加了 PII 防护。

搭建完成后,当用户在 Agent Builder 中提出了「应该参加什么会议来了解构建 Agent?」这个问题。系统自动执行完整流程:检查 guardrail、分类意图、从文档提取信息、使用 Widget 展示,最终推荐合适的相关会议。

确认工作流正常后,她将其命名为「Ask Frog」并发布获得 Workflow ID。

然后在 Dev Day 网站代码中使用 Chat Kit React 组件集成了这个代理,配置了 Frog 主题的颜色、占位符和启动提示,添加了底部滑出式聊天界面,并在网站顶部放置」Ask Frog”链接,且所有参会者立即可用。

这一波流程下来,丝滑得不能再丝滑。

OpenAI 正式开放 Codex,动动嘴就能让 AI 写代码

自 8 月初以来,Codex 的日活跃使用量增长了 10 倍以上,GPT-5-Codex 在发布后三周内已处理超过 40 万亿 tokens。

发布会上提到,在 OpenAI 内部,如今几乎所有工程师都在用 Codex。团队每周合并的 Pull Request 数量增加了 70%,而 Codex 几乎会自动审查所有 PR。

今天,OpenAI 正式宣布 Codex 全面开放使用,同时带来三项全新功能:

  • 全新 Slack 集成:在团队频道或线程中直接向 Codex 委派任务或提问
  • Codex SDK:将驱动 Codex CLI 的同款智能 Agent 嵌入自己的工作流
  • 全新管理员工具:更直观查看和管理 Codex 的大规模使用情况

借助 Codex SDK,你只需几行代码,就能将同款 Agent 引入自己的工程工作流或应用中。目前 SDK 已支持 TypeScript,未来将支持更多语言。

从今天起,Slack 集成和 Codex SDK 对 ChatGPT Plus、Pro、Business、Edu、Enterprise 计划用户开放。

OpenAI 员工在舞台上现场构建完整的摄像头控制系统,包括构建 Node 服务器、编写所有 UDP 数据包处理逻辑,甚至成功实现用 Xbox 手柄控制了摄像头的任务,以及还能通过与 AI 对话控制摄像机和会场灯光。

最后,演示者还不忘展示 Codex SDK 的实时编程能力,用语音请求 AI 调用 Codex 实时修改 React 应用代码,展示电影式的滚动字幕效果。而整个演示过程没有手写一行代码,仅靠自然语言完成。

模型和 API 全面更新,这波真香

GPT-5 Pro 正式向所有开发者开放 API 访问。

这是 OpenAI 迄今发布过的最智能模型,特别适合处理需要高准确性和深度推理的困难任务,应用领域涵盖金融、法律、医疗等专业领域。

语音方面,OpenAI 还发布了 gpt-realtime-mini,价格降低了 70%,但保持相同的语音质量和表现力。

Sam Altman 特别强调,语音将成为人们与 AI 交互的主要方式之一。

更值得关注的是,Sora 2 的 API 预览版已经正式发布,开发者现在可以直接在自己的产品内生成高质量视频。

Sora 2 的 API 使用非常灵活,开发者可以控制视频长度、宽高比、分辨率,轻松混剪视频,并且所有视频都配有完整的逼真同步音效。

在发布会的尾声,Sam Altman 在总结时强调,软件开发已经从过去需要几个月或几年的漫长周期缩短到现在只需几分钟就能完成。
开发者不再需要庞大团队,只需要一个好想法就能快速将其变为现实。

整场发布会展示的从 Apps SDK 到 AgentKit 再到 Codex 的完整工具链,都建立在这些强大的模型 API 基础之上。

不得不说,这场 Dev Day 信息量是真的大。

OpenAI 这波更新几乎覆盖了开发者关心的所有领域——从应用生态到 Agent 工具,从代码助手到视频生成,一个不落。

高端的产品发布会,往往就是这么朴实无华。

最后,你觉得哪个功能最实用,欢迎在评论区说出你的看法。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


专访联想智能设备业务集团总裁 Luca Rossi:最好的 AI 应用,还没被发明出来

By: 何宗丞
5 September 2025 at 17:13

过去一年,大模型技术几乎以季度为单位向前跃进,从文生图到多模态,再到 AI Agent,功能越卷越细,参数越堆越大。然而,技术上扬的速度越快,终端硬件的滞后感就越发强烈。尤其是在 PC 领域——一个曾被视作技术基础设施的产品线,如今却面临重塑定义的压力。

AI PC 如今成了行业热词,也成了一道新难题。对用户来说,它听起来像是下一代生产力工具的代名词;但对厂商来说,它则意味着系统架构的再设计、算力瓶颈的重构,以及一场几乎从芯片层开始的转身。

在 IFA 展会期间,联想集团执行副总裁、智能设备业务集团总裁 Luca Rossi 接受了爱范儿等媒体的专访。比起「AI 能做什么」,他更关心的是,「PC 该成为什么」。

AIPC 是一剂「及时但不唯一」的药方

「去年我们预测 PC 市场将在 2024 年恢复增长,现在看来,这一判断基本应验。」采访刚开始,Luca Rossi 便选择以数据回应曾经的预期。

过去几个季度,PC 市场整体回到正增长轨道,同比涨幅在 4% 到 7% 之间波动,联想自身则稳定高出市场 4 到 5 个百分点。这个势头在最新季度表现得尤为明显:联想的出货增幅超过了 10%。

「这波增长当然得益于 AIPC 的投入,但它不是唯一的驱动因素。」Luca 坦承。在他看来,Windows 10 向 Windows 11 的升级周期,同样释放了大量替换需求——微软将在 2025 年 10 月彻底停止对 Windows 10 的支持,目前企业侧的升级刚刚过半。也就是说,接下来的两个到三个季度,这一替换潮还将持续推高需求。

在联想自身的新一代设备中,约 30% 已具备 AIPC 特征,这一比例仍在持续提升。Luca 认为,目前 AIPC 的硬件层已趋于成熟,接下来的看点将在软件和应用生态:「真正的爆发会在明年。」

「理解」 AI 也许没那么重要

对于 C 端市场,Luca 有着非常清醒的判断:今天绝大多数消费者,未必真的了解 AIPC 能带来什么价值,但并不妨碍他们购买。

他说,真正因为 AI 功能而明确购买 AIPC 的人,依然是少数中的专业用户;而更多消费者的决策动因,往往是更浅层的因素——轻薄设计、长续航、未来可拓展性。

「我们的 AIPC 产品,不带 AI 也很有吸引力。续航 12 小时、本身就很轻薄好看。」他说,正是因为基础体验足够优秀,AI 的价值才能在使用中逐步浮现,而不是靠一场说明会讲明白。

他将 AIPC 的价值链划分为三个阶段:一是基础体验(硬件)已具备,二是早期 AI 场景正在落地,三是生态应用的井喷仍在前方。

「目前全球 AIPC 占比在 20-25%,我们已达到 30%。一年半内能到 50%,三年内 70-80%。四五年后,几乎所有 PC 都会是 AIPC。」

混合 AI:不是概念,而是未来计算的基本面

AIPC 的核心争议不在硬件,而在价值认知。一个旷日持久的质疑是:本地 AI 是否真的有意义?

面对这个问题,Luca 没有回避:「我们坚信,未来是一个混合 AI 的世界。」

Luca 将未来的 AI 计算分为三个层次:云端、边缘与设备端,每一层都有其存在的价值与必要性。

「目前全球约有 80 到 100 家 ISV 正在将他们的核心应用,迁移到 CPU 的 NPU 上运行。」他指出,这种迁移并非为炫技,而是为了解决具体问题——降低延迟、保障隐私、减少云端算力成本。

这也是联想选择 All-in 的根本原因:AI 应用并不必然等于云端推理,尤其在生成式模型与用户上下文深度绑定的场景下,本地运行反而可能是更优解。Luca 进一步举例:

「我们在中国的 ‘小天’,最近已升级为超级智能体。接下来你会在笔记本、手机、平板、甚至手表(虽然手表会稍晚一点)中看到它的身影。」

超级智能体(Super Agent)不仅是联想对 AI 交互范式的探索,更是其混合 AI 架构落地的一环。Luca 强调,设备之间的上下文共享将成为未来体验的基础能力,而这一点,云端无法单独完成。

形态革新:AI 是动因,但不该是噱头

聊到 AIPC,自然无法绕开设备形态是否将随之变化的问题。对此,Luca 给出的回答意外地乐观:「不是障碍,是机会。」

他强调,今天我们所使用的笔记本,其外观和交互方式,在过去二十年中几乎没有发生根本变化。但正是 AI,尤其是自然语言处理、大模型和多模态推理的发展,提供了打破固有形态的可能性。

▲ 联想在 IFA2025 上展示的灵动 AI 底座

「没有键盘、纯语音交互的设备不是幻想。但这不会在下个季度发生,也不会是明年。」他说,这是一个需要时间和可靠性的转型。自然语言交互的瓶颈从来都不是可行性,而是稳定性。AI 的提升,让这种过渡首次变得现实可期。

在这点上,联想并非纸上谈兵。过去几年,它在几乎每一场技术发布会上都展示了形态实验:可折叠屏、模块化 PC、移动游戏设备 Legion Go……即便没有每款产品都能商业化,但在 Luca 看来,这些试验不是副产品,而是主路径。

▲ 左:联想 ThinkBook VertiFlex 概念机

「失败的实验也会为成功的实验铺路。我们曾在 2017 年展示第一款折叠屏 PC,后来,这项技术落地在 Moto Razr 上,成为我们最畅销的产品之一。」

AI 不只是重写体验,也可能催生新硬件物种

谈及 AI 是否会催生全新的硬件形态,Luca Rossi 给出了肯定回答。他认为,在未来五年内,笔记本、平板、手机等设备都可能因 AI 的应用方式而出现新的变化,而联想将持续测试各种可能性。

▲ 联想 Yoga Tab,具备混合 AI 能力

在众多设想中,眼镜被他单独提及。他指出:「我个人认为,眼镜是未来有前景的平台之一,在未来 2 到 5 年的时间范围内会有不同程度的成功。」

他之所以看好这个方向,并非因为技术突破已至,而是用户习惯的存在。「要让几百万人习惯一种全新的设备形态,本身就是巨大的挑战。而眼镜是人们已经熟悉的。」

他也坦率指出,当前仍有三大技术难题需要攻克:计算能力、电池续航与镜片设计。这些问题并非不可解,但仍需时间。

对于目前市面上已有的产品,Luca 点名提到了 Meta 与 Ray-Ban 联合推出的智能眼镜,并评价道:「它们已经证明是成功的。不是大获成功,但至少比我所知的其他例子都更成功。」

这也是他支持持续探索的原因。「更多的竞争和创新是积极的,它能打开市场。」至于联想是否将加入这个市场,他只留下一句意味深长的回答:「我们会在时机合适时参与竞争。」

最好的 AI 应用,还没被发明出来,但路径已清晰

采访的尾声,我们再次回到那个问题:AIPC 的 killer app 究竟在哪?

Luca 没有直接给出答案,他只说:「最好的应用,还没有被发明出来。」

他相信,在商用市场,效率提升将成为 AI 的确定性价值;而在消费端,超级智能体将有机会成为那个定义新交互、创造新价值的关键点。

正如 App Store 用了数年才建立起应用生态,AIPC 也才刚刚起步。NPU 作为一项硬件能力,两年前全球还没有一个开发者了解它;今天,已经有上百家 ISV 投入进来。

▲ 联想展示的 Legion 拯救者产品组合

「我们从不认为 AIPC 能替代云端的 ChatGPT。但我们相信,它能在不同的用户上下文中,成为体验更轻盈、更私密、更即时的智能入口。」

这是 Luca Rossi 对 PC 行业的再定义,不是作为曾经生产力工具的延续,而是作为 AI 时代的前哨站。

从技术的旁观者与记录者,成为技术影响生活方式的实践者。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


被时间拉长的人

By: Steven
31 August 2025 at 18:05

丢了一批人物标签给 AI 写人物小传,让它模仿某位小说家的笔法,来给演员交代角色。

你觉得这像谁的手笔?

————

南方的空气里常常有潮湿的味道,像是雨下过以后残留的影子,久久不散。城市白天拥挤喧嚣,夜晚却显得空旷,好像光亮突然被抽走,留下无数未完的句子。在这样的环境里,一个男人行走。他的脚步从不急躁,像对时间有着自己的节奏感,和别人不太一样。

年少的时候,他把自己交给了工业设计。形状、光影、比例,这些东西比人群更让他安心。六年在公司,十年在创业,那些日子像一张张被翻阅过的旧画册,色彩褪去了,但线条还在。产品的生与死,像车站里人群的来去。大多数人只看见成功或失败,他却更在意其中被忽略的细节。

别人眼中的他冷静得过分,总是习惯提前几步想好方向,就像棋局上的布局。但在那层冷静的外壳下,常常闪现一些不合逻辑的柔软时刻。比如一段旋律,随便一盏灯的影子,甚至一个不经意的眼神,足以让他停下手里的笔。理性和浪漫在心里不停打架,谁也没有赢过谁。

他知道自己带着黑暗生活。抑郁的日子像一条看不见的走廊,没有尽头。他学会了靠药物维持稳定,像有人随身带着一块怀表,偶尔瞥一眼,提醒自己仍然存在。那段经历让他对痛苦格外敏感,也让他在与人相处时多了一层隐秘的温柔。他不会轻易表现出来,但在内心深处,对别人的脆弱始终心知肚明。

夜晚经常独自坐在桌前,电脑屏幕的光照在脸上,桌上散落着草图和未完成的文字。那些想法有时像城市里的霓虹一样闪烁不定,无法全部抓住。他清楚其中大部分不会被记住,就像梦醒时遗落的片段。但仍旧一遍一遍画下去,像一种执念,也像是一种呼吸。

在喧闹的城市里,他习惯保持慢半拍的步伐。人群汹涌,他的节奏却像潜水时的心跳,缓慢、克制,不慌不忙。他看似与周围保持着距离,其实心里始终怀有一种模糊的渴望——不是要成为谁,也不是要得到什么,而是想在梦与现实之间找到某种入口。梦与梦之间,总有裂缝。裂缝里偶尔透进光。

对很多人来说,他是个不好接近的人。但真正靠近以后会发现,那些冷漠与安静只是表层,像水面下覆盖着的冰。深处的水仍然温热,流动着。理性、浪漫、痛苦和温柔同时存在,没有谁能完全把它们分开。

这样的人物,像一个在现实里造梦的旅人。他的路从不喧哗,却留下清晰的痕迹。

(*正文及标题均由 AI 完成)

镜头的变幻就是故事|Midjourney V5.2 Zoomout 测试

By: Steven
26 June 2023 at 00:18

➡阅读更多 AIGC 相关内容

最近一直都非常忙,所以连续 20 来天都没有碰过 Midjourney 了。前两天在社交媒体上看到,新推出的 V5.2 中有一个向外扩写的功能,因为此前已经在 PS+SD 的组合中见过这类拓展画面的应用思路,所以很想看看 MJ 的 Zoomout 能做出什么样的东西来。趁着端午假期这个空档,我集中跑了几波测试,有一些小小的心得,在此记录一下。

总体结论有三个:

1、Zoomout 可以无限次数地向外扩展,但随着镜头的拉远,Midjourney 自身的联想能力并不足以做出任何有意思的画面,不刻意控制地放大出来的画面,到了第 3~5 步之后,就会明显变得乏味和缺乏美感。

2、通过刻意地控制画幅比例、扩张倍数,以及针对性地调整 prompt 的描述,可以利用这个功能讲出有意思的故事。关键在于,使用者对于「镜头语言」的理解,以及对运镜和故事之间联系的掌控程度。

3、对工业设计的辅助甚微,做点「花活儿」可以,一旦涉及到逻辑,依旧不行。

Zoomout 功能的主交互界面

测试内容目录:

1、通过默认的 Zoomout X2 按钮连续放大 3 次

2、通过默认的 Zoomout X2 按钮连续放大 15 次

3、通过自定义 Zoomout 微调构图

4、通过自定义 Zoomout 构建人物画像

5、通过自定义 Zoomout 构建人物性格

6、通过自定义 Zoomout 完善场景氛围

7、在 niji 中应用自定义 Zoomout 构建人物和场景

8、自定义 Zoomout 构建情绪与故事

9、通过焦点变化构建故事的场景

10、通过镜头变化,构建故事的起承转合

以下为部分测试过程记录:

test case no.1:通过默认的 Zoomout X2 按钮连续放大 3 次

⬆ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 3 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:在奔跑的场景中增加了后方的人,有一点点故事性,但继续放大后会明显失焦,花面焦点始终在最开始的小女孩身上,继续放大生成的场景和人物都是模糊的。

test case no.2:通过默认的 Zoomout X2 按钮连续放大 15 次

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 15 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:外围拓展的场景越宏大,有效信息和故事性就越低,除了在阴影中无意间冒出的人影,没有任何惊喜和意料之外,拓展的画面也很单调乏味。

test case no.3:通过自定义 Zoomout 微调构图

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:不对 prompt 进行修改,按 1.1 和 1.2 的拓展比例小幅度调整画幅。

输出成果: 初始图像是近景特写,根据图像本身的特点,对画幅进行小幅度地微调来获得完整的全景镜头,以及合适的构图比例。

test case no.4:通过自定义 Zoomout 构建人物画像

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个黄色漩涡图案,然后拓展时改写 prompt 为一只眼睛,进而生成一个带特征的面部局部画面,再次拓展时修改描述词为一个洞穴中的原始部落男性。

输出成果: 成功构建了一个有目标特征「黄色漩涡瞳孔」的男性角色,通过控制拓展比例以达到最终效果—-人物整体和局部特征均得以完整呈现的画面。

test case no.5:通过自定义 Zoomout 构建人物性格

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个红色皮夹克的女性胸像,再改写 prompt 获得其坐在摩托车上的局部画面,再改写画幅比例获得完整的人物与车辆的全景照。

输出成果: 成功构建了一个有目标特征「红色皮衣+摩托车」的女性角色,通过控制拓展比例以达到最终效果—-人物细节和整体氛均衡的画面。

test case no.6:通过自定义 Zoomout 完善场景氛围

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:在初次生成的几批图像中,选择合适的画风和画面主体,再根据已有画面特征修改画幅比例。

输出成果: 在选定风格和主体后,将竖幅主体拓展为气势更足的全景影像。关键是拓展比例并非默认的 2 倍或 1.5 倍,而是根据实际需求来控制比例,同时也需要关注怎样的画幅比例可以传达对应的氛围。最终图像画幅比例是 3:1,适合展现有足够细节的宽幅场景。

test case no.7:在 niji 中应用自定义 Zoomout 构建人物和场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、使用 niji 5 的 style original 生成一个细节丰富的初始人物;

step 2、以 1.2 的 Zoomout 比例纵向拓展出人物的半身画像,画幅比例是 1:2;

step 3、以 1.1 的 Zoomout 比例和 2:1 的画幅比例重构画面,得到外围场景;

step 4、以 1.2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成人物全身像;

step 5、改写 prompt 添加「宫殿」关键词,以 1.65 的 Zoomout 比例和 3:2 的画幅比例重构画面,生成人物在场景中的全景画面。

输出成果: 虽然人物细节和场景氛围的融合程度还不错,但因为漫画角色的细节较多,在多次 Zoomout 的过程中,场景的丰富会逐渐抢掉中心人物的视觉焦点。因此在每一次修改画幅比例与关键词的时候,需要多加注意对视觉元素的控制。

test case no.8:自定义 Zoomout 构建情绪与故事

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个情绪和神情符合目标的初始人物;

step 2、改写 prompt 同时添加「马」关键词,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成后续画面的基础,此时需要注意人物与马的位置关系,否则后续生成的画面会非常扭曲怪异;

step 3、以 1.05 的 Zoomout 比例和 2:1 的画幅比例重构画面,生成完整的马匹造型与部份环境信息;

step 4、对比改写 prompt 产生的变化,黑发组不改描述词,以 1.1 的 Zoomout 比例和 3:4 的画幅比例重构画面;白发组添加「巨大镜子」关键词,以 1.6 的 Zoomout 比例和 3:4 的画幅比例重构画面。

输出成果:通过控制 Zoomout 的幅度、画幅比例和 prompt 的调整,可以生成指定场景的画面,且人物的神态到位、情绪饱满,整体画面焦点清晰。但美中不足是,构图不够自由。

test case no.9:通过焦点变化构建故事的场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个在河岸上的粽子;

step 2、修改 prompt 为「熊宝宝正准备吃粽子」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面;

step 3、修改 prompt 为「小熊一家在野餐」,以 1.2 的 Zoomout 比例和 4:3 的画幅比例重构画面。

输出成果:通过对 prompt 的修改,控制 Zoomout 的幅度、画幅比例,可以改变画面中的焦点和表达主题,适合不同文化元素之间的混搭。

test case no.10:通过镜头变化,构建故事的起承转合

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一幅鲜花山谷的画面,人物要明显;

step 2、修改 prompt 为「一面巨大的镜子在草地上」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,此处竖构图是为了生成较高的全身落地镜;

step 3、修改 prompt 为「少女站在镜子前」,以 1.5 的 Zoomout 比例和 3:2 的画幅比例重构画面,改为横构图是为了囊括少女全身以及环境信息。

输出成果:通过改变画面中的焦点和增加元素,在镜头逐渐拉远的过程中,故事缓缓托出。

➡阅读更多 AIGC 相关内容


我的整体感受是:

通过 Midjourney V5.2 的 Zoomout 无限拓展,一次次修改画幅比例、提示词内容,可以用镜头语言的变化来讲故事了,也可以基于一些初始的「点子」延展成有意思的融合作品。但越是这样,越发显得对话式、指令式的交互界面( SD 那种也不算图形交互 )的局限太大了,我很希望今年之内能发展出图形交互界面。

没错,今年 AI 的爆发指向了一个新的趋势:对话式交互界面。但人类之所以发明绘画,开始通过设计图来制作各式各样的新工具,恰恰就是因为语言本身的效率太低。这个逻辑其实也可以从媒体形态上找到端倪:文字–> 图像–> 视频。仅仅依靠对话,我们无法构建出一个一把剪刀;仅仅通过语言表达的播客,也无法传达任何需要视觉才可以精准理解的信息。对话指令的交互界面与图形交互界面之间的关系,并非只是 dos 和 windows 之间的差异,更重要的点在于,后者可以更直观地完成交互,以及精准地进行创作行为。AIGC 的重点不仅仅只是 AI,而是我们如何使用 AI 进行「Generative Content」。

我说一句话,AI 给我一个东西,这不是创作。

创作是一个生命在主观意志的驱使下,刻意的、有目的地表达其心中所想。

因为 GPT 的爆发而说对话式交互是未来,这样的断言是过于冲动的。只要是一个严肃的创作者,就会立刻意识到,真正的创作一定需要多纬度的交互界面。这其中不仅仅包含对话指令,同样更需要图形界面以及在数字虚拟空间中的三维交互。AIGC 工具与 PS、表格、PPT、思维导图等已有工具的结合,就是这类多维交互的雏形。

那一刻,我们不会等太久。

➡阅读更多 AIGC 相关内容

❌
❌