Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

为什么说 iPhone 16 最大的卖点,是一块镜子?|硬哲学

By: 肖凡博
4 September 2024 at 18:00

下周二,苹果秋季发布会就要来了,iPhone 16 系列也会一同揭开它「神秘」的面纱。

给神秘打上引号,是因为这台还未发布的设备,已经被曝光得七七八八:蓝绿粉新颜色、拍摄新按键、竖向排列新镜头、新的钛合金颜色。

可能大家最期待的,就只剩下价格,以及终于更新的 AirPods 和 Apple Watch。不过,一条 MacRumors 的最新爆料,还是引起了不小的讨论:

iPhone 16 Pro 及以上型号,将配备 5 倍变焦。

去年 iPhone 15 Pro Max 发布后,专属的 5 倍变焦,成了各大媒体影像评测的聚焦点。一年过去了,虽然对 5 倍的评价褒贬不一,但正面反馈还是居多,毕竟焦距长一段,玩法多一点。

那这颗 5 倍长焦真的给 iPhone 的影像带来了质的飞跃?为什么它能成为 16 Pro 的专属镜头?焦段的扩充又不止苹果一家,为啥就它的讨论度最高?

这一切还得从一项技术说起:四重反射棱镜。

长焦那些事儿

先说结论:15 Pro Max 升级长焦后,拍照效果有了显著地提升。

过去一年,我身边买了 iPhone 15 Pro Max 的朋友和同事,很多都开始在朋友圈炫耀,自己的 iPhone 终于能拍月亮了。比起 14 在晚上拍出的大灯泡,15 Pro Max 拍的月亮细节更丰富,也和真的更贴合。

▲ 图片来自:Reddit.

很多喜欢航空展和打鸟的网友,用新 iPhone 记录了一些转瞬即逝的精彩时刻,即使没有专业的设备,也能拿起手边的苹果救救急。

去年我们在首发评测时,发现这颗 5 倍长焦镜头,暗光下也能正常开启拍照,也支持夜间模式。凭借强大的算法,在噪点满满的预览框按下快门,你能得到一张色彩真实、清晰干净的照片。

虽说苹果的长焦更新进度相较于同行,好像又慢了半拍,但也算拉齐进度,给出了一份不错的答卷。在苹果终于想起在长焦距上下功夫的时候,手机镜头的发展,其实已经经历了好几个阶段,而且几乎每年都会有不同的更新趋势:

2021 年,超广角越来越强,超长焦风光不再;
2022 年,底大一级压死人,计算摄影新赛道;
2023 年,高像素潜望式申请出战,玻塑混合镜头恐成未来;
今年,软硬件携手发展,一手堆料,一手 AI,风格化摄影开始出圈。

长焦镜头也在这几年里,经历了「重视-失宠」后,迎来了自己的第二春,VIVO 甚至直接把潜望式镜头作为了 X100 Ultra 的核心卖点。

那为何手机需要更长的焦距?值得我们展开讲讲,而且也能帮助我们理解 iPhone 四重反射棱镜这项「黑科技」。

聊长焦镜头,就得先了解焦距对成像的影响。「焦距」在传统相机中,指透镜中心到光聚集之焦点的距离;而在手机上,则是镜片光学中心到 CMOS(或 CCD)等成像平面的距离。

▲ 图片来自:Google

焦距的长短,会直接影响成像目标的大小。短焦距对应大视角,画面中所包含的元素也就越多;长焦距对应窄视角,画面会聚焦在某个或某几个对象上,不过相应的也可以把远处的物体拍清楚。

▲ 图片来自:Google

传统相机上的变焦镜头,就是通过镜头的伸缩调整焦距,以此来适应不同的拍摄要求。变焦镜头相较于定焦,适用的场景更广。多劳者多能,多能者也更壮实——体积较大,不便携带又成了变焦镜头让摄影师抓狂的烦恼。

而手机上的长焦镜头,其实是变焦技术制约和发展的共同结果。

一方面,技术进步了,能把镜片、传感器等元件造得更小巧,使得更多硕大的传统镜头技术,能缩小尺寸走上手机。

但另一边,又因为手机体积的限制,和对便携性的追求,不得不把原来一个变焦镜头,拆分成若干个焦距不同的定焦镜头,来间接实现光学变焦的效果。

镜头的分工搞定了,体积也缩小了,但是另一个难题也相应出现:光在手机镜头里的折射路径变短了,焦距就不够了,达不到长焦镜头对焦距的要求。

所以在手机数个镜头中,最难搞定的,往往是焦距和光路最长的长焦镜头。如果采用传统相机上的直立式长焦,的确会更省工夫,但会带来两个棘手的问题:

  • 光学畸变和色散严重
  • 镜头模组的厚度会「更上一层楼」

现在看起来「浑身毛病」的直立式长焦方案,正是手机上的第一代长焦,由 iPhone 7 Plus 率先使用,后来华为 P20 Pro 等机型上也用过,最后碍于要好的成像就要缩短焦距、要拉长焦距就会有很多衍生问题等,最后逐渐被厂家放弃。

大家放弃的是方案,但对长焦的探索从未止步,第二代长焦——潜望式镜头,也就是在这个节点,开始走上智能手机。

潜望式长焦,是通过两块三棱镜(有些是一块),让光线进行一次或数次反射,把光路在手机纵向的传播,改成横向传播,从而增加光路行程,进而增加了长焦镜头的焦段。

因为这种方案参考的是潜水艇上潜望镜的工作原理,因此也就有了「潜望式」的说法。

说「潜望式是为了解决直立式的短板」其实也不为过,因为在横向空间的拓展,使其解决了一代长焦的烦恼:

  • 像距更大,传感器就能用上更大的;
  • 空间够大,有条件配备更复杂的光学系统和防抖模块,成像质量进而变好;
  • 在同等厚度的模组里,潜望式的焦距可以比直立式的更长。

当年华为 P30 Pro 在搭载了潜望式长焦镜头后,拥有了 5 倍光学、10 倍混合和 50 倍数码变焦的能力,影像也成了华为手机的最大卖点之一。

后来几乎每家的旗舰机型都陆续跟进了潜望式长焦,但是主摄镜头最大 48mm 的焦距和长焦 120mm 中间的跨度太大,导致在 3 倍、4 倍变焦拍摄时的成像效果不佳,切换到 5 倍长焦的视角又太小。

针对这些向着更好前进的反馈,厂家又在初代潜望式长焦的基础上优化出了两条技术路线:潜望式光学变焦镜头,和双长焦。

先说明一点,现在几乎所有厂家在宣传的「光学变焦」其实不是真正意义上的连续光学变焦,而更像是数码变焦,只有在 0.6 倍、1 倍、5 倍这些特定焦距下,镜头相互切换工作时,才算是光学变焦。

索尼 Xperia 1 IV 是市面上为数不多在手机上实现真正光学变焦的机型,它的潜望式长焦就支持了等效 85-125mm 的连续变焦。

OPPO Find X7 Ultra 走的则是双长焦的路线,用更多的定焦镜头,间接实现了长焦距多焦段的拍摄能力。

如果潜望式是一个趋于完美的方案,也不会有厂家逐渐对其无感、放弃,甚至冷落了长焦镜头。因为体积、大底、焦段,是手机潜望式镜头的又一个不可能三角——无法同时满足三者。

即使强如索尼做到了真·光学变焦,受限于成本问题,也没办法成为大多数的选择。而 iPhone 15 Pro Max,去年火就火在这一点上。

四重反射棱镜

我们来捋一下上面的逻辑:

手机追求更全面的拍摄效果必须要有长焦镜头→长焦需要有更大的空间来延长光路从而提升焦距→潜望式比直立式更适合长焦镜头因为手机的横向空间更宽敞。

但从目前旗舰机型的重量,和镜头模组的厚度看来,潜望式仍然不是最优解。

刚才讲到,潜望式镜头是通过一个或两个三棱镜,让光先偏转 90° 与手机横向平行,通过光学系统的矫正后再偏转 90° 打到传感器上完成成像(有些品牌只有一个三棱镜,光只偏转了一次,所以传感器是垂直放在手机里面的)。

iPhone 15 Pro Max 走出了另一条路:四重反射棱镜。

传统潜望式中的每个棱镜只能让光发生一次偏转,但苹果运用了光在棱镜中在一定入射角能实现全反射的原理,把入射光打到一块四棱镜的内部,让光线在棱镜中发生四次偏转反射。

从传统潜望式 90° 的反射,改为单棱镜四次反射,有几个显而易见的好处:

  • 光的反射次数越多,更容易增加焦距,满足长焦的要求;
  • 四棱镜比起三棱镜更薄,机身厚度也能降低;
  • 传感器「躺」在手机主板上,横向空间更大。

当然这里只是简单地把大致原理概述了一点,棱镜当中还有很多复杂的工艺,比如镀膜防漏光、开槽防眩光等技术,都是四重反射棱镜里必不可少的元素。

在我们翻阅这份专利文件时,发现了另一个有意思的事儿。四重反射棱镜的发明人,不出意外的也不是苹果,而是一位名叫 Takeyoshi Saiga 的日本光学工程师。苹果在早些年就动用钞能力将这项技术收入麾下,不得不再次感叹这家公司的超前眼光和技术布局。

而且,Takeyoshi Saiga 还在另一篇专利文件里面,对四重反射棱镜进行了升级。

光看这张专利图,不难发现棱镜的主体还在,但不一样的是新方案将反射棱镜一分为二,而且中间断开的部分不是平整切割,而是凹凸不平的球状表面。

没错,之前放在棱镜正上方的棱镜模组,和棱镜完全融为一体,原来偏厚的镜片组合,现在就只剩下一块镜片了,手机的厚度也可以在新设计下,变得更薄。

不得不佩服改良版四重反射棱镜的脑洞,真巧妙。

不知道即将发布的 iPhone 16 Pro 会不会用上相同的技术,不过从已经曝光的参数来看,16 Pro 和 15 Pro 的厚度完全一致(8.25mm),估计这项黑科技离真正商用,还有一定距离。

而且这种结构的长焦镜头,也不都是优点。比如四重反射棱镜的确能让手机平衡好焦距和厚度,但是多次反射后的到达 CMOS 的进光量会衰减得更多,如何解决夜景拍摄噪点过多的问题,可能是 16 Pro 的一道大题。

另外,单棱镜是一个很新的创意,但还谈不上先进,因为这是苹果为了重量厚度长焦焦距「既要又要」的妥协技术。为了这颗棱镜和厚度控制,15 Pro Max 的底,相较于其他品牌,还是偏小了。

而且,众多 iPhone 15 Pro Max 的用户在过去一年陆续反馈,这颗长焦镜头的触发距离,实在是过于严谨,要离目标将近 90cm 才会切换到长焦镜头,小于这个距离 iPhone 大概率会自动切换成主摄拍摄。

长焦微距是今年的新趋势,看看下个星期,苹果会怎么做。

虽说这些问题通过堆料换个大底、加个模组就能轻松解决,但我们得记得智能手机是平衡的技术和艺术,在追求性能和手感的路上,总有人要让让步。

不过能确定的是,iPhone 16 Pro 和 Max,都将采用四重反射棱镜。作为消费者,一般很少去关注技术过程,我们更在意的是新技术在结果上会带来哪些提升。

起码从 iPhone 15 Pro Max 近一年的使用反馈来看,四重反射棱镜让手机的长焦拥有了更多的可能性。

特别是今年也开始大谈特谈 AI 的苹果,应该会把硬件的新技术和软件的新算法,结合得更加紧密,期待通过四重反射棱镜技术的加持,iPhone 16 Pro(Max) 的人像再有新突破,长焦还有新体验。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


镜头的变幻就是故事|Midjourney V5.2 Zoomout 测试

By: Steven
26 June 2023 at 00:18

➡阅读更多 AIGC 相关内容

最近一直都非常忙,所以连续 20 来天都没有碰过 Midjourney 了。前两天在社交媒体上看到,新推出的 V5.2 中有一个向外扩写的功能,因为此前已经在 PS+SD 的组合中见过这类拓展画面的应用思路,所以很想看看 MJ 的 Zoomout 能做出什么样的东西来。趁着端午假期这个空档,我集中跑了几波测试,有一些小小的心得,在此记录一下。

总体结论有三个:

1、Zoomout 可以无限次数地向外扩展,但随着镜头的拉远,Midjourney 自身的联想能力并不足以做出任何有意思的画面,不刻意控制地放大出来的画面,到了第 3~5 步之后,就会明显变得乏味和缺乏美感。

2、通过刻意地控制画幅比例、扩张倍数,以及针对性地调整 prompt 的描述,可以利用这个功能讲出有意思的故事。关键在于,使用者对于「镜头语言」的理解,以及对运镜和故事之间联系的掌控程度。

3、对工业设计的辅助甚微,做点「花活儿」可以,一旦涉及到逻辑,依旧不行。

Zoomout 功能的主交互界面

测试内容目录:

1、通过默认的 Zoomout X2 按钮连续放大 3 次

2、通过默认的 Zoomout X2 按钮连续放大 15 次

3、通过自定义 Zoomout 微调构图

4、通过自定义 Zoomout 构建人物画像

5、通过自定义 Zoomout 构建人物性格

6、通过自定义 Zoomout 完善场景氛围

7、在 niji 中应用自定义 Zoomout 构建人物和场景

8、自定义 Zoomout 构建情绪与故事

9、通过焦点变化构建故事的场景

10、通过镜头变化,构建故事的起承转合

以下为部分测试过程记录:

test case no.1:通过默认的 Zoomout X2 按钮连续放大 3 次

⬆ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 3 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:在奔跑的场景中增加了后方的人,有一点点故事性,但继续放大后会明显失焦,花面焦点始终在最开始的小女孩身上,继续放大生成的场景和人物都是模糊的。

test case no.2:通过默认的 Zoomout X2 按钮连续放大 15 次

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 15 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:外围拓展的场景越宏大,有效信息和故事性就越低,除了在阴影中无意间冒出的人影,没有任何惊喜和意料之外,拓展的画面也很单调乏味。

test case no.3:通过自定义 Zoomout 微调构图

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:不对 prompt 进行修改,按 1.1 和 1.2 的拓展比例小幅度调整画幅。

输出成果: 初始图像是近景特写,根据图像本身的特点,对画幅进行小幅度地微调来获得完整的全景镜头,以及合适的构图比例。

test case no.4:通过自定义 Zoomout 构建人物画像

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个黄色漩涡图案,然后拓展时改写 prompt 为一只眼睛,进而生成一个带特征的面部局部画面,再次拓展时修改描述词为一个洞穴中的原始部落男性。

输出成果: 成功构建了一个有目标特征「黄色漩涡瞳孔」的男性角色,通过控制拓展比例以达到最终效果—-人物整体和局部特征均得以完整呈现的画面。

test case no.5:通过自定义 Zoomout 构建人物性格

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个红色皮夹克的女性胸像,再改写 prompt 获得其坐在摩托车上的局部画面,再改写画幅比例获得完整的人物与车辆的全景照。

输出成果: 成功构建了一个有目标特征「红色皮衣+摩托车」的女性角色,通过控制拓展比例以达到最终效果—-人物细节和整体氛均衡的画面。

test case no.6:通过自定义 Zoomout 完善场景氛围

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:在初次生成的几批图像中,选择合适的画风和画面主体,再根据已有画面特征修改画幅比例。

输出成果: 在选定风格和主体后,将竖幅主体拓展为气势更足的全景影像。关键是拓展比例并非默认的 2 倍或 1.5 倍,而是根据实际需求来控制比例,同时也需要关注怎样的画幅比例可以传达对应的氛围。最终图像画幅比例是 3:1,适合展现有足够细节的宽幅场景。

test case no.7:在 niji 中应用自定义 Zoomout 构建人物和场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、使用 niji 5 的 style original 生成一个细节丰富的初始人物;

step 2、以 1.2 的 Zoomout 比例纵向拓展出人物的半身画像,画幅比例是 1:2;

step 3、以 1.1 的 Zoomout 比例和 2:1 的画幅比例重构画面,得到外围场景;

step 4、以 1.2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成人物全身像;

step 5、改写 prompt 添加「宫殿」关键词,以 1.65 的 Zoomout 比例和 3:2 的画幅比例重构画面,生成人物在场景中的全景画面。

输出成果: 虽然人物细节和场景氛围的融合程度还不错,但因为漫画角色的细节较多,在多次 Zoomout 的过程中,场景的丰富会逐渐抢掉中心人物的视觉焦点。因此在每一次修改画幅比例与关键词的时候,需要多加注意对视觉元素的控制。

test case no.8:自定义 Zoomout 构建情绪与故事

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个情绪和神情符合目标的初始人物;

step 2、改写 prompt 同时添加「马」关键词,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成后续画面的基础,此时需要注意人物与马的位置关系,否则后续生成的画面会非常扭曲怪异;

step 3、以 1.05 的 Zoomout 比例和 2:1 的画幅比例重构画面,生成完整的马匹造型与部份环境信息;

step 4、对比改写 prompt 产生的变化,黑发组不改描述词,以 1.1 的 Zoomout 比例和 3:4 的画幅比例重构画面;白发组添加「巨大镜子」关键词,以 1.6 的 Zoomout 比例和 3:4 的画幅比例重构画面。

输出成果:通过控制 Zoomout 的幅度、画幅比例和 prompt 的调整,可以生成指定场景的画面,且人物的神态到位、情绪饱满,整体画面焦点清晰。但美中不足是,构图不够自由。

test case no.9:通过焦点变化构建故事的场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个在河岸上的粽子;

step 2、修改 prompt 为「熊宝宝正准备吃粽子」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面;

step 3、修改 prompt 为「小熊一家在野餐」,以 1.2 的 Zoomout 比例和 4:3 的画幅比例重构画面。

输出成果:通过对 prompt 的修改,控制 Zoomout 的幅度、画幅比例,可以改变画面中的焦点和表达主题,适合不同文化元素之间的混搭。

test case no.10:通过镜头变化,构建故事的起承转合

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一幅鲜花山谷的画面,人物要明显;

step 2、修改 prompt 为「一面巨大的镜子在草地上」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,此处竖构图是为了生成较高的全身落地镜;

step 3、修改 prompt 为「少女站在镜子前」,以 1.5 的 Zoomout 比例和 3:2 的画幅比例重构画面,改为横构图是为了囊括少女全身以及环境信息。

输出成果:通过改变画面中的焦点和增加元素,在镜头逐渐拉远的过程中,故事缓缓托出。

➡阅读更多 AIGC 相关内容


我的整体感受是:

通过 Midjourney V5.2 的 Zoomout 无限拓展,一次次修改画幅比例、提示词内容,可以用镜头语言的变化来讲故事了,也可以基于一些初始的「点子」延展成有意思的融合作品。但越是这样,越发显得对话式、指令式的交互界面( SD 那种也不算图形交互 )的局限太大了,我很希望今年之内能发展出图形交互界面。

没错,今年 AI 的爆发指向了一个新的趋势:对话式交互界面。但人类之所以发明绘画,开始通过设计图来制作各式各样的新工具,恰恰就是因为语言本身的效率太低。这个逻辑其实也可以从媒体形态上找到端倪:文字–> 图像–> 视频。仅仅依靠对话,我们无法构建出一个一把剪刀;仅仅通过语言表达的播客,也无法传达任何需要视觉才可以精准理解的信息。对话指令的交互界面与图形交互界面之间的关系,并非只是 dos 和 windows 之间的差异,更重要的点在于,后者可以更直观地完成交互,以及精准地进行创作行为。AIGC 的重点不仅仅只是 AI,而是我们如何使用 AI 进行「Generative Content」。

我说一句话,AI 给我一个东西,这不是创作。

创作是一个生命在主观意志的驱使下,刻意的、有目的地表达其心中所想。

因为 GPT 的爆发而说对话式交互是未来,这样的断言是过于冲动的。只要是一个严肃的创作者,就会立刻意识到,真正的创作一定需要多纬度的交互界面。这其中不仅仅包含对话指令,同样更需要图形界面以及在数字虚拟空间中的三维交互。AIGC 工具与 PS、表格、PPT、思维导图等已有工具的结合,就是这类多维交互的雏形。

那一刻,我们不会等太久。

➡阅读更多 AIGC 相关内容

❌
❌