Normal view

There are new articles available, click to refresh the page.
Yesterday — 21 December 2024Main stream

这个 AI 生图神器太好玩了,连提示词都不用写

By: 张成晨
21 December 2024 at 18:08

AI 生图工具,已经多得泛滥了,但 Google 最新推出的 Whisk,还是找到了一种很新的玩法,让见过世面的网友也直呼好玩。

只需输入三张图片,subject(主题)、scene(场景)、style(风格),Whisk 就可以生成一张博采众长的图片。

▲ 图片来自:Google

举个例子,主题是老人,场景是藤蔓,风格是 90 年代复古动漫,写上「角色骑着飞行自行车」的提示词,等待一会儿,一张类似吉卜力画风的新图片诞生了。

▲ 图片来自:Google

老人还是那个老人,戴帽子,穿西装,拿着书,但他骑上了提示词里的车,场景和风格也都变成了参考图片的样子。

Whisk 的长处便在这里——让我们少写、不写提示词的同时,轻松玩转各种风格,妈妈再也不担心我不会写提示词了。

别写复杂的提示词了,直接把图片端上来就行

别看只需要几张图片,Whisk 的玩法简单,却又无穷无尽。

刷刷刷上传三张图片——主题图片,麦当劳薯条;场景图片,莫奈画作《睡莲》;风格图片,像素风游戏《星露谷物语》。

不写提示词,直接生成,Whisk 给出的结果,一张更比三张强。

除了上传自己的图片,我们也可以掷骰子,让 Whisk 随机生成主题、场景、风格。

其实,Whisk 为我们提供的预设风格已经很够用,徽章、贴纸、刺绣、黏土、美漫、马赛克拼贴等等,特色鲜明,效果立竿见影。

只要有脑洞和想象力,无需一个字,仅仅通过不同图片的排列组合,我们可以不断地做完形填空的游戏——主题+场景+风格,而且不是每个空都必须填。

▲ 1.主题图片,熏鸡;2.场景图片,梵高《星月夜》画作;3.风格图片,日本木版画

▲ 1.主题图片,《戴珍珠耳环的少女》;2.场景图片,电影《千与千寻》剧照;3.风格图片,蒙德里安抽象画

▲ 1.主题图片,微信「死亡笑脸」表情包;2.场景图片,电影《星际穿越》剧照;3.风格图片,史努比漫画截图

▲ 1.主题图片,冲浪默认头像粉色恐龙 momo;2.风格图片,Jellycat 玩偶

另外,Whisk 的每一次生成,场景和风格只能选择一个参考图片,但主题可以选择多个。这意味着什么?我们可以让多个角色同框了!

比如,让马斯克、奥特曼、扎克伯格通通变成珐琅徽章。

三位的服装、装饰、神态都还原得挺好,扎克伯格的话筒和项链都没漏掉,但人脸没法保持一致性,全部变成了大众脸。

虽然 Whisk 减少了写提示词的需求,但你需要写的话,Whisk 也鼓励。

在对话框加上一句「角色们都举着一块告示牌,上面写着 AGI」,徽章小人们轻轻松松地遵循了提示词。

如果我们需要某个场景或者某种风格,但一时找不到参考图,Whisk 的预设也没有提供呢?

解决方式很简单,没有图片,那就写提示词,让 Whisk 临场发挥一个。

就像我需要一个让角色站上去的、像素风格的底座作为场景,就让 Whisk 帮我生成了。

然后,再把猫猫表情包作为主题图片,把像素小鸡作为风格图片,就可以得到一个有底座的像素猫猫。

总之,Whisk 就是非常自由,像橡皮泥一样,怎么捏都可以。

既生图又识图,把复杂的工作流包装成有趣的「打蛋器」

Whisk,其实是 Google 多模态模型秀肌肉的一种方式。

为了让我们少写提示词,Whisk 整合了视觉理解和图片生成能力。

Gemini 模型识别图片,自动生成详细的描述,然后这些描述会被输入到 Google 的图片生成模型 Imagen 3,由 Imagen 3 生图。

Whisk 是这样的,用户只要上传和生成图片就可以了,但它自己要考虑的事情就很多了。

Whisk 的每张图片,不管是上传的还是生成的,都写了很长的底层提示词,并且不藏着掩着,我们点开图片就能看,也可以上手修改。

如果把一个人作为主题图片,Whisk 会详细地描述他的外貌特征,场景图片也是类似的。

▲ Whisk 对奥特曼的描述:「一个肤色较浅的男子,有着短而深棕色的卷发,从胸部以上展示。他有着浅色的眼睛。他穿着一件浅米色的针织圆领毛衣。背景是一面斑驳的灰色混凝土墙。男子的表情严肃而中性。光线有些昏暗,他的右脸有轻微的阴影。」

风格图片略有些不同,如果把一张动画截图作为风格参考,Whisk 不会说,画面里有三个人,而是描述这幅画的色彩、光线、线条……

▲ Whisk 对史努比画风的描述:「这张图片以卡通风格呈现,具有粗犷的轮廓和平面着色。色彩调色板有限,主要使用原色和柔和的次要颜色。光线均匀,缺乏强烈的阴影或高光,给人一种简单、几乎孩童般的质感。线条清晰且一致,带有轻微不均匀的质感,暗示手绘的效果。整体美学让人联想到经典的连环漫画或儿童动画。」

所以,Whisk 不是精准地复制图片,而是提取图片的特点和精髓,将主题、场景、风格自然地融合在一起,各司其职,互不干扰。

同时,Whisk 也叠了甲——只从图片提取少量关键特征,结果可能和预期不同。这也解释了,为什么 Whisk 做不到人脸的精准还原。

所以,哪怕选择不那么抽象的复古胶片风格,三位大佬的脸也是和本尊都不挨着,但其他细节都很准确。

物体也是一样,特斯拉的赛博皮卡,经过特征提取再生成之后,变得非常普通。

但如果是麦当劳薯条这种素材丰富的超级 IP,效果倒还不错,可以拿来当广告图了。试过一些迪士尼的角色,Whisk 复刻得也原模原样,但图就不放上来了。

另外,Whisk 还存在一个问题——没法做很细致的风格参考,模仿不了某种特定的画风。

当我让 Whisk 生成蒙娜丽莎的乐高小人,出来的结果让我两眼一黑,但多加一句提示词,「让角色更像乐高人物」,Whisk 又能模仿个七八成。

某个漫画家的画风就更难模仿了,上传漫画截图让 Whisk 参考,它最终给出的是一个非常普通的漫画风格图片,就算通过提示词强调作品、角色、漫画家,也不起什么作用。

其实,Whisk 好玩就够了,它更适合做一些不追求精准的创意探索,俗称整活。

Whisk 可以翻译为「搅拌」或者「打蛋器」,Google 的这个名字取得即视感很强,可不就是把食材都混搭在一起吗?

Whisk 的不精准,也让它的定位和传统的图片编辑器不同,更像是一种创意工具。有了什么脑洞,由它实现粗略的视觉效果。

▲ Whisk 生成,1.主题图片,《火影忍者》截图;2.风格图片,毛绒玩具

以前实现 Whisk 这种风格化的效果,跑通一整个图像生成的流程,我们可能需要在 ComfyUI 搭建工作流。

但现在有了 Whisk,好像就在玩抽卡游戏或者开盲盒,而且只要能登录(限美国地区),目前还免费。

体验指路👇
https://labs.google/fx/zh/tools/whisk

Google 领先的模型能力固然是前提和基础,但设计出被大家需要的产品,仍然需要创造力和审美。

很喜欢 Whisk 的 slogan:「prompt less, play more.」(少写提示词,多玩耍。)

Whisk 出自 Google labs,之前爆火的 AI 播客 NotebookLM,也是出自这里,后来慢慢发展为成熟的项目。这个实验室,本身就是这句 slogan 的最好注解。

强大的模型能力,有新意的产品,开放的心态,曾经似乎被 OpenAI 威胁的 Google,风轻云淡地展现出了王者归来的姿态。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Before yesterdayMain stream

爱范儿明日产品榜单 2024 评委阵容官宣,他们眼中的明日产品是什么

By: 爱范儿
20 December 2024 at 15:36

Tomorrow’s Product Award 是由数字潮牌爱范儿面向趋势消费者打造的年度榜单,旨在发掘过去一年最具标杆意义的「明日产品」。

爱范儿团队联合全球意见领袖,在消费电子、智能出行和人工智能三大前沿领域进行提名并评选,致敬推动行业进步与时代变革的杰出之作。

今天,Tomorrow’s Product Award 的评委正式公布,我们也和这些来自不同领域的创造者,聊了聊什么是「明日产品」。

Tomorrow’s Product Award 评选标准

  • 创新:借助新技术、新设计带来显著的效率和体验提升
  • 改变:重塑行业或生活方式
  • 普惠:具有持续发展并影响更多人的潜力

爱范儿将联合陪审团对所有入围产品进行评选,于 2024 年 12 月下旬揭晓完整榜单,敬请关注。

陈坤:明日的产品是 AI 时代的 Word。
范阳:人工智能时代的「明日产品」应聚焦于一个「更高分辨率」的世界里,提升人与人、人与环境以及人与其他生物之间的沟通分辨率(Communication Resolution)。
费俊:明日产品能够帮助我们拓展认知边界,改变我们的创造力方式。
何宗丞:明日产品是时代的尺度。
胡延平:明日产品应该符合 S 融合感知- I 独立智能- C 耦合连接- A 时空行动-S 协约协同这五个特征,能够帮助每个人成为数智人、超级个体的强智能产品。
李继刚:明日产品让人因它更高效、更强大,而且人人可用。
梁宁:明日产品创造了新功能、新情绪和新资产。
林嘉澍(flypig):明日产品首先应该是「future-proof」,在未来这个东西不会过时。
刘梦霏:明日产品一定是从今日出发的,而且一定要在带来新可能性的前提下普惠公众。
刘知远:明日产品,是理解技术的价值,洞察人的需求,成为恰到好处的创造,并且遵循人性。
慕明:明日产品是对未来需求的预演或原型开发,基于对现实的敏锐观察和对未来可能性的深刻洞察。
朋克周(周子杭):明日产品是让人爱不释手、越用越离不开的产品,不在于技术多先进,而在于真正解决用户痛点,改变生活方式。
拼命玩三郎:明日产品是让我希望 Yesterday 不再 once more 的产品。
沈义人:不同的产品有不同的使命,101% 完成使命的产品就是好产品,而明日产品是能引领使用习惯的产品。
田飞:明日产品站在人的视角,解决今天的问题,看到明天的无限可能
王华东:明日产品应该是交互上是让人眼前一亮,功能上也极大地解决此前没解决好的问题。
王伟兴:明日产品与初始市场份额无关,它关乎用户持续的心智和未来的想象。
俞挺:明日产品就是上手就丢不掉的产品。
赵赛坡:明日产品是对人类未来的恰当诠释。
爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


舒达智能床体验:怎么科学睡个好觉,这里有个答案

By: 肖钦鹏
19 December 2024 at 11:13

人的一生,总有一样东西贯穿始终——

有人说千金难买,但有人唾手可得;它是最长情的伴侣,也是最难征服的对手;哪怕地球上最有权势的人,也无法将其驾驭,那就是:

睡眠。

问鼎《纽约时报》畅销书榜的《我们为什么要睡觉》里提到:

一晚糟糕的睡眠所造成的身体和精神损害之严重,会让那些因食物和运动缺乏造成的损害相形见绌……睡眠是上天赐予我们对抗死亡的最好方法。

但睡眠好的人大抵相似,失眠者的疑难却千差万别。相比「我们为什么要睡觉」,真正困扰大家的事情其实是「怎样才能睡个好觉」。

自出生起,就有人不断教我们怎么吃喝玩乐,但睡觉这件事,老师也教不来。睡眠是件很私人的事情,千人千面,从不循规蹈矩。

我们对如何科学、舒适地睡眠了解甚少。但睡眠从不应该成为一门玄学。比起人适应床,或许更好的选择是,让床来适应人。

现在,能适应人的床出现了——舒达 iComfort 智能床。

智能床,不止于床

当我们谈到「床」这个词时,脑海中通常会浮现出一个固定画面:四条腿,一块平面,也许还有一个床头板。

但舒达智能床的床体有些不一样,由三部分组成:美妙 Pro 床垫、AI Pro 智能底床和云逸床架——有点像汽车的底盘、车身和座舱,智能床的多结构可动设计,可以带动床垫随心所欲地改变形态。

舒达 iComfort 智能床内置了一套专利动力机电系统,可以带动床垫平稳升降,配合美妙 Pro 的定制床垫,就可以让床头和床尾实现多角度无级抬升。

与此同时,整张床还能保持全程静音运行,实际体验下来,在底床带动床垫无感抬升过程,整体很丝滑平稳。

我试睡了一周的智能床,其中最显著带来的变化,是在于它对于卧室空间的改造。

床,通常是卧室里占地面积最大的物件,一张一米八的大床,几乎占到了十平米主卧的一半,考虑到飘窗、衣柜的占地面积,实际上留给人活动的空间并不多。

很多人绞尽脑汁在螺蛳壳里做道场,但试想一下,如果这个空间中唯一不可舍弃的部件——你的床,不仅能用来睡觉呢?

舒达智能床相当灵活,可以通过手机 App、语音、遥控器等多种方式灵活调整床垫和床架的角度,让其变身躺椅,沙发,甚至是个电影角。

当你睡觉前,可以一键把床调成阅读模式,这时候床头会稍微上抬,刚好是手肘能够靠到床垫的位置,这时候床就变成了一张大躺椅,可以舒舒服服看书或刷手机。

如果床头再往上升一些,一部分床垫就成为靠背,这时候床就成了沙发,躺在卧室就能看电视了:

这让我想起大学看《老友记》的时候,每个人都想有一把 Lazyboy 的躺椅,在闲适时候做一个沙发土豆。

其中,我最喜欢的是「太空减压」模式,这个模式下会同时把床头和床尾抬高,让颈部和腿部的疲劳都能得到舒缓,这时候躺床上,就有点零重力座舱的感觉了。

智能床作为一个创新品类,进入家庭空间的日子并不长,而舒达智能床对于卧室功能边界的拓宽,算得上是一个让人眼前一亮的视角。

比躺着睡、侧着睡更好的,是哄着睡

有过失眠经历的人,大抵都会想到同一个问题:

为什么婴儿睡得香,大人反而睡不着?

造成这个情况的原因有许多,但关键在于有没有人「哄着睡」——婴儿只要有人哄着就能产生睡意,而大人要考虑的就多了。

这是舒达智能床为我带来的第二个显著变化。

▲圣母画像,图片来源:Terranuova Madonna (c.1505) by Raphael

「一键哄睡」是舒达智能床一个比较有意思的功能,在一个十来分钟的短周期内,通过四段式的智能助眠系统,帮助你快速培养睡意,进入睡眠状态。

开启「一键哄睡」后,舒达智能床首先会模拟太空失重状态,帮助身体放松,促进脚腿部血液回流至心脏,配合按摩震动,来缓解身体的疲劳感;紧接着,智能床会模仿婴儿摇篮的方式,适度摇摆床身,来营造一种入睡的节奏;之后,床会模拟悬浮状态,来让身体进一步放松;最后,轻缓平稳放平床体,这时候人差不多就已经睡着了。

我想对于大部分人而言,这个哄睡过程是均匀且可接受的,我们试着放了一瓶水在床上,在整个床体摇晃的过程中,基本上水面也不会有太大晃动:

「一键哄睡」最巧妙的地方在于,通过这样一套由「床」来执行的动作,实现了一种入睡的仪式感。

打开这个模式后,原本很方便刷手机看电视的床,变得不那么方便了,相当于进入到一个半强制睡眠的状态,而顺着智能床的摇晃节奏,身心都会慢慢放松下来。睡觉,也就成了一件理所当然的事情。

智能睡眠,是舒达智能床传递的一种产品设计理念——如果你不想睡觉,而是想刷手机或看电影,那么床也能给你提供最合适的支撑,倘若你这时候想睡觉了,那么床就应该给你营造最合适的环境。

让睡觉,成为一件自然的事。

这一点,从舒达智能床的睡眠监测功能上也能看到一脉相承的地方。

舒达 iComfort 智能床内置了 AI Dream 引擎,通过专为睡眠场景调试的 AI 大模型来提供更细致的睡眠监测服务,可以说这个床本身,就是一个巨大的 AI 硬件。

从前,我们习惯把手机放在床头或戴上个智能手表来监测睡眠状况,但也许有更好的办法——让你的床帮你记录睡眠的情况。你只要像往常一样自然入睡,智能床就会悄无声息地收集数据,醒来时就能交上一份数据详实的睡眠报告——不同睡眠阶段时长、心率呼吸率、打鼾情况等十余项睡眠质量评估指标,一目了然。

我想,这就是智能睡眠这个产品理念带来的最大价值。

在智能床试睡的这段时间里,我还发现了几个有意思的小细节:

一个是舒达智能床会分别监测睡在床两侧的用户数据,尽管是睡同一张床,但两个人的睡眠监测数据是分开的,除了用遥控器进行控制之外,也能各自通过手机 app 对床进行调控。

另一个是智能鼾声感应功能,睡眠中,当智能床监测到有打鼾的情况,会轻柔缓慢的调整床的高度,帮助缓解打鼾,确保整晚深睡质量,对于深受打鼾困扰的人来说是个福音。

用科学的办法,睡个好觉

失眠已经成为一种现代流行病,全球范围内有超过 5 亿人患有睡眠障碍,在一些发达国家,每两个成人中就有一位彻夜难寐。

▲图片来源:Birmingham Museums Trust

一张能哄你睡觉的智能床,可以帮你培养科学的就寝习惯,从而获得高质量的睡眠。而你并不需要额外佩戴什么设备或进行某种练习,这是最难得可贵的地方。

最后,无论你对智能床这种新产品是否感兴趣,我都推荐你去读一读《我们为什么要睡觉》这本书,这不仅是个书名,也是一个困扰学界已久的难题,而其中最重要的提醒是:

人类(以及所有其他物种)永远不能把我们之前失去的睡眠「睡回来」。

睡个好觉这件事,什么时候开始都不会太晚。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


火遍小红书的 AI 视频神器,这次整出的新活又让我停不下来

By: 张成晨
18 December 2024 at 13:35

AI 视频的多主体一致性,向来是个难题。让 AI 凭空生成模特和衣服不难,但如果甲方要求,必须要让马斯克代言,穿上毛绒大衣,AI 可能就办不到了。

Pika 最近更新的 2.0 模型,提出了一种很有趣的解决方式——我们上传多张图片,Pika 会精准参考图片中的元素,生成视频。

集齐人物、商品、场景的照片,一个非常基础的广告片就出炉了,而且这些素材在视频里长得都和照片里一样。

这是否意味着,AI 视频的一致性难题解决了,广告行业的朋友们又要焦虑了?其实并没有,经过实测,Pika 的可玩性很高,但论实用,道行还不够。

马斯克和奥特曼看电影,名画吃薯条,同框从未如此简单

Pika 上传多张参考图片的功能,叫作「Scene Ingredients」(场景成分)。

使用起来很简单:1.点击「+」上传图片,上限 6 张;2.在文本框里,写上简单的提示词。

接下来就进入实操——让闹得水深火热的马斯克和奥特曼,化干戈为玉帛,在一起看电影。

▲提示词:两个人坐在漆黑的观众席中。他们手捧一桶爆米花,一把放到嘴里嚼着,全神贯注地看着眼前的场景。他们睁大眼睛的表情传达出热切的期待或着迷,仿佛他们完全沉浸在正在展开的戏剧或场景中。周围的环境表明人群拥挤,但焦点仍然集中在他们的反应上

上传两位的照片就够了,观众席可以用提示词写出来。

对于马斯克,AI 的发挥很稳定。但奥特曼看起来是地主家的傻儿子,吃相恐怖就不说了,眼睛大得要掉出来。

Pika 很有趣的一点是,素材可以「复用」。

所以,我们可以让马斯克和奥特曼过把模特瘾。只上传一张服装图片,然后通过提示词,让他们穿着一样的绿色大衣,拍个时尚大片。

▲提示词:两名男子在壮丽的冬日风景中站在一起自拍。两人都穿着相同的绿色长外套。全身照,从头到脚展现他们。他们摆出专业模特般的姿势,脸上挂着自信的微笑。电影灯光突出了他们的脸庞和外套的奢华质感。高端时尚摄影风格,专业相机品质,时尚杂志美学

两人的照片都找了现成的,绿色的大衣和冰天雪地的背景是另外用 AI 生成的,衣服上的「AIGC」,算是考验 Pika 的附加题。

结果,场景和大衣的一致性保持得不错,「AIGC」的字样依稀可以辨认,两位模特的动作也遵循了提示词。

但最大的问题是,这两人是谁?视频的人脸和照片,不能说一模一样,可以说是毫不相干。

不信邪,继续让 Pika 玩换装。

这次,我们请出扎克伯格,照例先用 AI 图片工具生成衣服,上面写着「I was human」(我曾是人类),呼应经典的机器人梗。

然后,再找一张扎克伯格的图片,和一把尤克里里的图片,让小扎玩个音乐。

▲提示词:一位身穿黑色 T 恤的男子站在温馨的房间里,弹奏着尤克里里琴。镜头从中远景开始,展现他的整个身体,逐渐拉近,最后聚焦在 T 恤上的字迹上

Pika 对提示词的遵循和镜头的运动都挺好,衣服也丝滑地穿上了,但右手,尤其大拇指,还是不完美。

相较 Google Veo、OpenAI Sora 等,Pika 的模型能力不算顶尖,一个问题解决了,还有更多的 bug 被发现。

尝试了写实的,再来试试二次元画风,为了让坂田银时和漩涡鸣人同框,我特意挑选了两张背景都是蓝天白云的图片。

▲提示词:动漫风格的场景,镜头聚焦在两个年轻男子的脸上,背景是蔚蓝的天空和白云。他们一边聊天一边眼神交流,保留了原有的动漫艺术风格

背景融合得很自然,两位正面的表情发挥不错,吹动头发和衣服的风也恰到好处。然而,转身实在太可怕了。银时是死鱼眼,不是真的翻白眼啊喂。

次元壁都打破了,当然也可以让名画跨年代互动——蒙娜丽莎和戴珍珠耳环的少女在麦当劳餐厅吃薯条。

▲ 提示词:蒙娜丽莎和戴珍珠耳环的少女正在麦当劳餐厅用餐。她们相对而坐,桌上摆着薯条。她们边聊天边品尝薯条,摄像机从侧面捕捉她们,两位角色偶尔看向镜头,营造出一种随意而友好的氛围

效果一言难尽,看到蒙娜丽莎,不知道达芬奇想不想掀棺材板。两位好像贴图一样,被放在了视频里,头部也运动得非常诡异。

有时候,回归简单,道法自然,结果反而超出预期。

▲提示词:特写镜头,池塘表面出现气泡,然后咖啡杯从水中浮出

上传一张星巴克的图片,一幅莫奈的睡莲,就可以得到一个「清水出芙蓉」的咖啡杯。

PK 国产模型,控制 AI 视频的门槛更低了

一定程度上,Pika 提高了视频的可控性。话不说满,因为从实践看来,Pika 在场景、服装、物品上的一致性保持地较好,人物的脸容易崩,不管是什么次元。

同时,模型的基础能力,Pika 也有待进步,吃东西、弹琴等物体运动,仍然会出现问题。这些问题,能不能通过抽卡缓解呢?

三个字:抽不起。

Pika 2.0 目前仅对 Pro 和 Fancy 用户开放,如果按月订阅,每月至少花 35 美元,连免费试用的额度都没有。

而且,Pro 用户每月只有 2000 积分,但使用 Scene Ingredients 功能,一个视频就要花掉 100 积分。

▲vidu 界面

其实,国产 AI 视频模型 Vidu,比 Pika 更早地实现了「多图参考」的功能。更拿捏用户的是,它有免费体验的积分。

Pika 的几个案例,我也在 Vidu 跑了一下。蒙娜丽莎和戴珍珠耳环的少女吃薯条,两位像刚出土,但蒙娜丽莎的还原度比 Pika 高。

马斯克和奥特曼一起看电影,马斯克的脸像了七八成,奥特曼的脸依旧灾难。

坂田银时和漩涡鸣人同框,Vidu 居然能基于正脸生成侧脸,但画风和原图不太一样。

另外,在功能上,Vidu 有一点不如 Pika——最多只能上传三张图片。所以,让 Vidu 给马斯克和奥特曼拍时尚大片,我就没有上传背景,只上传了两位的照片和绿色的大衣。

两位给人的感觉很陌生。可以看出,人脸的稳定性,仍然是个难题。

和 Pika 相比,Vidu 效果如何,可以见仁见智。Pika 用的是 Pro 版,Vidu 用的是免费版,客观上也会导致两者的差异。

但 Pika 和 Vidu 的思路是相似的——仅靠几个图片素材、一段简单的提示词,就生成相对稳定的物体。

在 AI 视频生成中,保持主体一致性,目前相对可靠的是 LoRA 方案,用一定数量的、特定主体的素材,对模型进行微调。通过适量的素材和训练,模型能逐渐掌握这个角色的样貌特征。

但为了让 AI 视频被更多人用起来,有更广阔的商业价值,门槛就要降低。至少,从 Vidu 和 Pika 身上,我们看到了可能性。

靠 AI 短视频出圈,在整活的道路上一去不复返

Pika 的 2.0 模型发了没几天,海外网友已经玩疯了。

拿自己的照片,反复生成不同场景的视频,就可以实现「瞬息全宇宙」。

▲ 图片来自:X@EladRichardson

通过 AI 一键试衣,模特和衣服如流水,场景都不带换的,实拍的钱省下来了。

▲ 图片来自:X@martgent

玩着玩着,Pika 给了我一种玩「QQ 秀」和模拟人生的感觉,怎么打扮视频里的角色,我们来决定。

如果让马斯克「圆梦」,很容易,先用其他 AI 工具,生成了一件「占领火星」的 T 恤、一个写着「MAGA」的红色帽子。

然后,把这些图片、火星的场景、马斯克的照片,以及他的擎天柱人形机器人、他特别喜欢的网红表情包 Doge 原型,全部上传到 Pika。

▲提示词:一名男子站在火星表面,身穿黑色T恤,头戴红色帽子。他的左边坐着一只狗,右边站着一个机器人。镜头以广角镜头开始,捕捉男子、狗、机器人的全身。随着镜头平稳拉近,男子朝镜头欢快地挥手,表情洋溢着喜悦和冒险精神

最终,一个阳光开朗大男孩出现,左牵黄,右擎苍,憨厚有余,但就是不像马斯克。

像不像是一回事,只要思路开阔,玩法无穷无尽。

基于我们自己和名人的照片,可以无痛追星。上传帽子、衣服、乐器,能把自己从头打扮到脚。集齐场景、产品、模特,一个 5 毛特效的广告片子就有了……

照片+AI 图片+Pika 2.0+提示词,可以生成很多好玩的画面。同时,这样的生成方式也规避了一些视频模型的短板,比如写字,在图片模型就可以解决。

不和 Google 硬刚模型能力,不和 Runway 这种逐梦好莱坞的对手比较,Pika 有自己的弯道超车玩法。

其实一直以来,Pika 在整活和创意方面就是一把好手,之前的一系列 AI 特效功能 Pikaffect 全网爆火,刷屏小红书和 TikTok,推动 Pika 用户突破 1100 万。

▲ AI 捏捏. 图片来自:Pika

▲AI 切蛋糕. 图片来自:Pika

Pika 切中了一群对整活短视频有高需求的用户,哪怕这些视频是模板化的,稍纵即逝的,但只要有趣,人们就会蜂拥而至。

谁说赢者通吃才是胜利?AI 的市场是广阔的,模拟物理世界固然是个远大的梦想,先完成让 AI 短视频有趣起来的小目标,未尝不是一种成功的方式。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,ChatGPT AI 搜索免费开放!

By: 莫崇宇
17 December 2024 at 05:19

上个月,OpenAI 宣布推出 ChatGPT Search。

但当时这位入局搜索引擎的新选手还谈不上颠覆 Google 搜索,而今天免费向全球用户开放的新版 ChatGPT Search 则旨在补齐关于获取实时信息的短板。

本次更新的主要亮点包括:

  • 高级语音模式现已支持实时网页搜索,并支持多语言实时翻译
  • ChatGPT 能够智能判断是否需要执行网页搜索,用户也可通过点击 🌐 图标手动触发搜索
  • 搜索结果中的视频可直接在 ChatGPT 聊天窗口中播放
  • 支持将 ChatGPT search 设为默认浏览器,提升网页导航效率
  • 移动端搜索结果优化显示,包含完整商业信息描述和丰富视觉内容
  • iOS 设备集成原生苹果地图体验

本次发布会由 OpenAI 首席产品官 Kevin Weil、ChatGPT 搜索产品负责人 Adam Fry 以及技术人员 Cristina Scheau 共同主持。

在接连多天发布会后,不仅蹲守直播的用户感到疲软,就连 Kevin Weil 也显得有些敷衍了,照着提词器念台词的痕迹就差没明着来。

言归正传,升级后的 ChatGPT search 功能变得更「聪明」了。

比如说,当你询问「这个周末在旧金山有哪些好玩的活动」时,ChatGPT 会自动判断是否需要获取最新网络信息,亦或者你主动点击「搜索网络」的图标,ChatGPT 将始终从网络获取最新的信息来回答问题。

ChatGPT 反馈的的答案包含丰富的图片和列表,一眼望去,倒是比 Google 搜索引擎更清爽。

搜索结果会标注信息来源,有效降低 AI 幻觉的危害,你可以直接跳转到相关网站,查看详细的视觉内容和其他搜索结果。

ChatGPT search 最大的特色在于其对话式交互方式。

比如在讨论旧金山雨天活动选择时,想去看场电影,我们可以先在 ChatGPT 搜索并播放新版《狮子王》的预告片,降低踩雷的风险。

对于习惯使用 ChatGPT 作为默认搜索引擎的用户来说,现在已经可以更快速地访问各类网站,如 Netflix。

甚至还能在浏览器地址栏直接搜索酒店预订网站。ChatGPT 会优先展示目标网站链接,并在侧边栏提供相关链接供参考。

在移动端,ChatGPT search 升级后的表现同样出色。

以搜索最好的墨西哥餐厅为例,ChatGPT 会提供包含视觉信息、营业时间等完整商户信息的列表。我们可以通过自然对话进一步筛选,如查找「有户外露台和加热器的餐厅」,无需修改关键词或重新搜索。

嫁入苹果大户人家的 ChatGPT,也让其享受到与苹果地图完美集成的本地化体验,点击地图按钮,就能直接查看这些商户,并使用本地的苹果进行实地浏览。

打字的效率往往比不上语音交流。现在 ChatGPT 高级语音模式同样可以实时进行网页搜索。

比如说,你打算去瑞士度假,在 ChatGPT 帮助下,它能用流畅的语音告诉你苏黎世在某一周有什么活动。

具体的节庆活动,到访的圣诞马戏团,音乐秀等都能娓娓道来。

时间如果更具体一些,包括圣诞市场的开门日期和时间,苏黎世今天的天气,甚至纽约联合广场的开放时间,ChatGPT 都能一一作答。

遗憾的是,这次发布会的结尾没有笑话,演示人员要求 ChatGPT 展示用德语、法语和意大利语说「圣诞快乐」,这对于支持 50 多种语言的 ChatGPT 自然轻松拿捏。

最后,木有感情的 Kevin Weil 也「剧透」了明天直播活动的详情,那就是将举行一个「迷你」开发者日,发布更多激动人心的消息。

还记得上个月 ChatGPT search 刚发布时,OpenAI CEO Sam Altman 在 X 平台发文称:

搜索是我们自 ChatGPT 推出以来,我最喜欢的功能!

而根据投资公司 Evercore 在 9 月份对 1300 人进行的一项调查,有 8% 的受访者选择 ChatGPT 而不是 Google 作为他们首选的搜索引擎,相比之下,6 月份这一比例仅为 1%。

要知道,那时更专业的 ChatGPT search 功能尚未正式发布,便已经能从搜索市场份额身上撕咬下一块肉,收获如此多的忠实拥趸。

这样的成绩也进一步刺激了 OpenAI 拓展搜索领域的野心。

上个月,外媒 The Information 披露,OpenAI 正在筹划一款新产品,旨在将 AI 聊天机器人和网络浏览器相结合,已经着手与旅游、餐饮、房地产和零售等领域的网站商讨合作协议,为它们提供搜索功能。

为了实现这一目标,OpenAI 甚至早些时候不惜重金挖来了 Google Chrome 团队的创始成员之一 Ben Goodger。

然而,在用户体验和商业变现之间寻找平衡点,是摆在所有 AI 搜索引擎的难题。

以「无广告」起家的 Perplexity AI 最终也没能扛住营收压力,宣布要在 AI 搜索引擎中试行品牌广告。而 OpenAI 首席财务官 Sarah Friar 也表示正在权衡是否要在自家的产品引入广告。

但愿这不会成为另一个「屠龙者终成恶龙」的故事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iPhone 年度最佳应用,2 人团队打造出最合适小白的视频神器

By: 周奕旨
16 December 2024 at 18:44

这些年,iPhone 的更新让我愈发疑惑。

从 iPhone 13 Pro 系列上出现的 ProRAW,到 iPhone 15 Pro 系列出现的 Apple Log,都是非常专业的图片或是视频格式,对于有专业需求的人来说无疑是一件好事,但这部分人只占消费者群体的极少数。

对于普通用户而言,这些更新更多时候毫无作用,甚至会误导大家,浪费本就昂贵的内存。

脱离群众要不得,苹果显然也意识到了这个问题。

于是,在刚刚公布的 App Store Award 2024 上,苹果用年度 iPhone 应用 Kino,给了一个答案。

举起手机,我们每个人都可以是导演

想知道答案是什么,我们先要知道这届 App Store Award 的主角 Kino 是什么。

Kino,源自德语或斯拉夫语言,为「电影院」的意思,同时也可指「电影」。

显然,开发者没打算在名称方面做太多文章,无论是 app 图标上镜头一样的图案,还是打开 Kino 官网的主页后那句自问自答式的标语,都在揭示 Kino 是一个摄影类 app:

如果有 iPhone,你就是电影制片人。

打开 Kino,首先弹出的并不是无趣乏味的取景框与参数界面,而是一个类似于开箱的界面。

纸壳材料的表面,除了大号的「Kino」字样外,还有琳琅满目的文字与图案,我扒了扒详细信息,制作了下面这张图片。

一张图,几乎将 Kino 整个应用勾勒出雏形,让用户心底有数。

进入主界面,Kino 的画面比较清爽,整体布局基本遵循原相机的逻辑,没有出现大幅度的改动,对于初步上手专业拍摄的使用者来说有效降低了学习成本,非常友好。

Kino 的界面设计以取景框为主,操作区域集中在屏幕的右侧,几乎所有核心操作都在这里完成,布局清晰而高效。

从左至右分别为视频的曝光模式(自动/手动切换)和当前选定的视频规格,比如分辨率、帧率和格式等。

左下方新增了音频输入的左右声道音量监视器,实时显示录音的音量状态。此外,这里还显示了当前视频规格下,iPhone 剩余存储空间可录制的时长,让用户对拍摄状态一目了然。

至此,Kino 的一级菜单就已经完全介绍完毕了,但显然,想要拍出电影般的画面,这么一点儿设置不太够,我们还需要精准控制一些变量。

在取景框右侧的操作区域,一共有四个入口,进入镜头倍数切换键上方的小箭头,进入 Kino 的拍摄控制设置,里面从上往下分别是:

  • 进一步设置
  • 前后置摄像头切换
  • 构图参考线(九宫格)
  • 防抖开关
  • 波形图显示开关
  • 白平衡

这些功能并不少见,在绝大多数摄影 app 中都是常客,并不能算 Kino 的优点,在第一次打开 app 的时候,介绍中有一个页面是这样的:录制键旁边的图标延伸出一道覆盖取景框的彩虹,下面的介绍,真正道出了 Kino 的优势:

电影级色彩,零剪辑门槛。

当看到电影级色彩的时候,我立马意识到,Kino 的出现,说白了是为了用好一个功能——iPhone 15 Pro 系列上推出的 Apple Log。

Apple Log 旨在为用户提供更广阔的后期制作空间。通过采用专业级的 Log 色彩空间,Apple Log 能够捕捉更丰富的动态范围和细腻的色彩细节,使得用户在后期调色和编辑过程中拥有更大的灵活性和创作自由。

对此,Kino 内置了专业调色预设,这些预设被称之为 LUT,可以帮助没有调色基础的用户快速创作出不损失画质的专业视频,通俗地讲,这是视频领域的「滤镜」,用户可以在拍摄中实时预览 LUT 的色彩效果,也可以导入自定义 LUT 实现个性化风格效果。

点击主界面的录制按键旁边的图标,就能进入 Kino 内置的电影级 LUT 列表,在这里面,Kino 会根据你目前选择的视频格式显示不同的 LUT,当然,你也可以移驾到设置中查看完整的 LUT 表格,一览 Kino 的强大色彩配置。

纸上得来终觉浅,深知此事要躬行,琳琅满目的 LUT 到底该怎么用,都是什么效果,哪几个更好用,都需要亲手拍一拍。

在拍摄了超过 50 GB 的素材以后,我为大家总结了一份 LUT 的成像风格表,里面标明了每个 LUT 的效果与色彩偏好,并辅以样片进行讲解。

Apple Log 与 SDR 视频均支持的 LUT:

  • Sando:画面饱和度较高,对比较大,具有轻微的胶片质感,适合拍摄日常生活场景,特别是户外自然光条件下的画面
  • Lektar:高对比度,色彩饱和度适中,影调清晰锐利,适合城市建筑或需要突出明暗对比的画面
  • Chroma Noir / BNW:经典黑白胶片风格,光影层次感强,适合在颜色杂乱的环境中凸显光影
  • Kolor / Kolor 79:颜色偏暖,适中对比度,整体画面略带褪色感,呈现经历漫长时间的旧胶片感
  • Tyrell / Wallace:冷色调处理,色彩更加克制,带有未来感和沉稳感
  • Glostrup:画面呈暗调,通过低明度、高饱和来营造氛围感

仅支持 Apple Log 的 LUT:

  • Neutral:简单还原 Log 格式的灰片,将画面调整为自然的标准色彩,提供色彩校准的起点
  • Salman 03:温暖柔和的色调,带有微妙的粉红和橙黄光晕
  • Mellowed:低对比度,色彩偏绿,具有极其强烈的风格化味道
  • Fadeo:带有褪色感的画面风格,色彩偏暖,暗部压低,整体色调带有复古感
  • Verve:高亮度,高对比度,色彩明亮,适合温和的室内环境
  • Kinochrome:致敬经典的 Kodak 胶片色彩风格,色彩偏暖的同时带有轻微的褪色
  • Anjin:高光压制,影调平滑,色彩偏暖而低饱和度

仅支持 SDR 视频的 LUT:

  • Tamarisk:温暖而炙热的色彩风格,整体画面呈现柔和的暖色调
  • Alpine:冷色调,色彩偏粉,在清爽的画面氛围中不失柔和

在这些 LUT 中,我个人较为常用的是 Sando、Stalman 03 与 Glostrup。

Stalman 03 与 Glostrup 以不同的画面亮度和对比度提供了总体偏向青橙的成像风格,这种风格适用于绝大多数场景,可谓是万金油配方,但使用时需要留意人脸肤色;

而Sando 则保持着中正平和的风格,没有给出明显的风格化调色,通过加强对比度和饱和度,让画面以丰富自然的颜色与明暗对比来获得使用者的青睐。

这些 LUT 的设计不仅满足了专业创作者对于色彩的不同需求,还为不同场景和视频类型提供了定制化的风格选择。对于使用 Apple Log 格式的用户,这些 LUT 提供了从自然还原到复古胶片的多样风格,而 SDR 视频用户也能通过精美的 LUT 增强画面的表现力。

Kino 的 LUT 共有两种使用方式:

  1. 先选定,后录制,LUT 直接烧录在视频中,一键拍出自带调色的影片不是问题
  2. 先录制,后烧录,先将视频录制下来,再进入取景器界面右下角的相册进行套用,为视频提供更多可能

除了使用 Kino 拍摄的视频,Kino 还允许用原生相机或其他第三方 app 拍摄的视频(包括 Log 视频)套用这些独特的 LUT。

值得一提的是,Kino 的制作团队 Lux Opitcs 非常具有传奇色彩。

Lux Optics 在成立之初就只有两个人——前苹果设计师 Sebastiaan de With 与前 Twitter 工程师 Ben Sandofsky,他们对影像都非常感兴趣,幸运的是,他们两人合作起来刚好有将这份兴趣转为成果的能力。

于是,2017 年,专业摄影应用 Halide 正式推出,两年后,由 AI 驱动的长曝光摄影软件 Spectre Camera(Lux Optics)发布,这两个应用先后获得了 Apple Store Award 2019 年度最佳应用奖项与 Apple Design Award 2022 的最佳视觉与图形大奖。

在 Lux Optics 的底部,陈列着这个小团队迄今为止开发的四个应用,并骄傲地写到:

Made with love in California and New York by two dads.
由两位父亲在加州和纽约倾注爱意创造而成。

在推出 Halide 与 Specter Camera 以后,时间来到 2020 年,Lux Optics 工作室发布了一篇文章,宣布一位 iOS 开发者 Rebecca Slatkin 的加入,将团队规模扩展至三人。随后就迎来了 Kino 的面世与获奖。

从某种意义上来说,这完全称得上是世界上人均获奖最高的工作室了。

珠玉在前,为什么还要颁奖给 Kino

所以,现在我们清楚 Kino 是什么了——一款专门使用 Apple Log 拍摄电影的 app。

但这还不够,要了解一棵树,光看它的叶子是不够的,还要看它生长的土地、阳光和风雨。

在 iPhone 上,已经有两个大名鼎鼎的软件,是专为 Apple Log 设计的:苹果自家的 Final Cut Camera 与 Blackmagic Design 推出的 Blackmagic Cam。

前者有苹果原厂背景背书,而后者则是专业电影调色软件达芬奇的开发商专门为 Apple Log 设计的。

▲ Blackmagic Cam

有这两位前辈在场,Kino 凭什么冲出重围?

我们先将目光转向 Final Cut Camera,作为苹果的自家应用,它沿袭了苹果一贯的设计风格,界面简洁直观,功能布局井然有序。屏幕上的信息密而不乱,顶部显示着当前的拍摄设置,例如 ProRes 格式、HDR 输出、4K 分辨率 和帧率设置,让用户一眼就能掌握拍摄状态。

不过,Final Cut Camera 与原生相机一样,没有给用户提供快门速度的控制入口,只有简单的曝光补偿,在面对动态模糊、控制光源频闪等问题的时候,Final Cut Camera 就显得较为无力。

同时,在拍摄 Log 格式 的视频时,Final Cut Camera 仅支持 HEVC(H.265) 和 Apple ProRes 两种格式,实在过于笼统,无法进一步选择 Apple ProRes 更细化的规格,导致使用者在视频体积的控制上缺乏足够的灵活性与精细度,相比之下,Kino 就提供了更细致的 ProRes 规格,提供了更细致的选择。

交互与设计搞清楚了,我们来看看色彩方面的配置,Final Cut Camera 沿袭了苹果一贯无为而治的风格,除了供 Log 视频在预览时套用的 Apple Log to Rec.709 还原 LUT,完全没有其他 LUT,也不支持外部导入。

最最重要的一点是,目前 Final Cut Camera 更多地服务于多台设备联机拍摄,通过这个 app,用户可以在多台 iPhone 和 iPad 之间实现同步拍摄和远程控制,所有设备所录制的素材都会被精准地标记和管理,直接导入 Final Cut Pro 进行后期编辑,为苹果生态下的 Final Cut Pro 提供无缝衔接的素材采集解决方案。

这么看,里面提供的 ProRes 格式与 Log 更像是苹果顺手把新的功能塞进去,顺便给第三方开发者打个样。

再聊聊 Blackmagic Cam,这个 app 可以说是完全把相机上可以做的设置都搬了过来,提供了强大的可控性,只要你愿意深入设置,你几乎可以在 app 里找到任何一个可调参数,真正实现了在手机上模拟传统电影机的体验。

作为一个摄影师,我对 Blackmagic Cam 的表现赞不绝口——它就像是一台我手掌中的迷你电影机,在手机的机身中提供的操控自由度和专业感,用起来非常舒服。

但不可否认的是,这种高度专业化的可控性,全塞进一个约 6 寸的手机屏幕上,多少显得有些「局促」且混乱,需要一个很长的学习曲线才能熟悉地使用每一项功能,顺利拍出影片。

Blackmagic Cam 只提供内置的 Apple Log to Rec.709 的还原 LUT,如果需要其他风格化的 LUT,需要自己导入,考虑到苹果并不算友好的文件管理流程,这对于新手而言也有一定的学习成本。

有了对比,我们终于了解 Kino 的优势在哪里了:它比 Final Cut Camera 提供了更多的可控参数,以及好看又好用的 LUT,又比 Blackmagic Cam 的界面设计更美观直接,极大程度地降低了使用门槛,让每个人都能像套滤镜那样简单地使用 Apple Log 这种专业格式,以此帮助用户创作出更好的东西。

介绍到这里,我想,我们已经可以给 Kino 下一个较为全面的定义了——这是一款更友好、更简单、更有趣的,专门使用 Apple Log 拍摄电影的 app。

让我们回到开头那个问题。

苹果这两年给 iPhone 的更新,的确愈发专业,专业到想要使用这些功能,伴随着高昂的学习成本和漫长的学习曲线。

对于普通用户来说,生活够忙碌了,根本没有时间留给「怎么用好手机的新功能」。

▲ iPhone 13 Pro 系列上推出的 ProRAW 照片格式

而站在厂家的角度来看,手机这种形态经过十几年的迭代,无数人的努力,的确是已经把目前科技范围内能想到的更新都做了,向专业化深入似乎成为了唯一的出口——这更像是一种行业自我挖掘的尝试,而非面向用户需求的自然演变。

于是,在环境与时代的挤压下,厂商与用户之间产生了一种微妙而尖锐的矛盾:用户愿意为一部更好用、更简单的手机买单,而厂商却只能沿着专业化的道路前行,试图在细分市场里找寻新的卖点。

作为权宜之计,可以,但长久以往,肯定不行。

要么就找到新的方向,拿出一些真正的创新,要么就必须架起一座桥梁,让普通用户也能跨越门槛,轻松触及专业功能,总之目的很简单,要让手机更好用,消费者才买帐。

现在看来,在前者几乎没有可能的情况下,苹果选择了后者。

于是,Kino 这样一个更友好、更简单、更有趣的,专门使用 Apple Log 拍摄电影的 app 出现在大家的眼前——将这些专业功能,通过一些 app 作为桥梁,让普通用户也能轻松地、几乎没有学习成本地用起来,拍出比以前更好的照片、更好的视频。

我想,在未来的一段时间里,这样充当桥梁的 app 会越来越多,这座桥梁一面是专业,一面是用户,而它最终通向的,是一个质朴而恒久的目标:让手机回归好用。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AppGallery Awards 年度影响力应用与游戏发布,我们看到了鸿蒙应用生态的新趋势

By: 艾 梵
14 December 2024 at 17:39

12 月 11 日,华为终端云服务公布数字生活内容风向标「2024 年度先锋榜」,其中「AppGallery Awards 年度影响力应用与游戏」尤其值得关注——这是原生鸿蒙正式商用后推出的首个应用年度榜单。

这次的获奖名单,从不同角度折射了鸿蒙原生应用在用户体验、视觉设计、创新性、趣味性等方面的亮点与趋势。更有意思的地方在于这份榜单的组织形式:与其说这是一张榜单,不如说是一种对生活趋势的回顾,一份展示 Apps 应用文化发展的「米其林指南」,是原生鸿蒙生态向我们递出的一张新名片。

本次榜单揭晓了 18 款应用和游戏,分属不同领域。而串起这些应用的,是我们可知可感的六大生活新趋势。

 

年度影响力背后,传递出三重价值

2024 AppGallery Awards 聚焦于我们身边切实发生着的变化趋势,以及它们对用户日常生活及应用形态施加的影响。这些日常离不开的常用应用和趋势相交织,又会怎样改变我们的生活呢?

先看看 MBTI 性格测试这一趋势:

当内外向之分显得过于古板,而星座又过于繁琐时,基于 MBTI 身份认同的各种心理测试和互动故事,席卷了所有社交平台。一句「你是 E 人还是 I 人」成为了多少人的口头禅,而 MBTI 这四个字母也随之成为一种全新的社交货币。

在这里,它全新定义了一种社交趋势,让头部社交应用也找到了和用户互动的新方式。而对此响应最为明显的,自然就是小红书、微博和知乎了。

因为 MBTI 热潮,用户找到了新的破冰方式和强大归属感。公众人物的 MBTI 属性频上热搜,而各种超话和标签也聚集了许多同频的爱好者,令社区热度水涨船高。与此同时,我们也看到,开发者和运营方没有错过这「泼天流量」:人格测试功能、基于 MBTI 属性优化的社交匹配机制和个性化内容推荐纷纷融入产品,无论是刷内容还是发内容,都产生了新的体验。

MBTI,无愧于「年度第一社交趋势」。而 AppGallery Awards 所做的,就是传递和推进这一趋势,使它能被更多的开发者「看见」,激活种种产品设计创意。

这就是 AppGallery Awards 的第一层价值,即看见趋势。

在趋势之上,还有一层思考:是什么令趋势成为趋势?

观察一下 AIGC 在当下成为热潮的动力机制,答案自然明了:因为用户工作中需要帮助记录会议、整理资料和撰写文档的「助理」,于是讯飞星火和 AI 写作猿应运而生;因为生活中需要一个知识框架来接触世界,故而多模态的通义大模型大受欢迎——趋势的诞生,源于对用户实际需求的呼应。

当需求和能够满足需求的产品同时存在,最后一步就是将两者链接起来,而这正是 AppGallery Awards 的第二层价值:应用指南

好的指南不能大而无当,而应该借由划分主题和场景,在纷繁世界中为用户提供一个个有意义的功能与解题思路。考虑到讯飞星火、AI 写作猿和通义对各种细分场景需求的适用性,有能力对应每个场景的协同需求,它们入选 AppGallery Awards 也就显得理所当然。

而 AppGallery Awards 所传递出来的第三层重要价值,在于启发探索。

比如,「旷野旅行」是榜单中我特别喜欢的一个新趋势,关于「人生是旷野还是轨道」的问题,每个人都有不同的答案,但当我看到这个趋势,以及下面飞猪、携程、去哪儿这三个 App 时,我想这时候顺势订一张假期的机票,未尝也不是一种选择。

这就是「启发」的力量,也许是一个趋势热词,也许是一份应用指南,又或者是一些未被挖掘的小功能、小技巧——这对应用数以万计、功能浩如烟海的数字生态而言,实在太重要了。

AppGallery Awards 是一次对全年度用户需求趋势的大总结,而 AppGallery 每天推送的新鲜主题,则为用户带来一次又一次的趋势传达与探讨。正是在这些日常推荐主题中,用户得以通过具体的应用体验逐渐感受、了解到各种生活趋势,进而成为趋势的一部分;而他们在此被激发的新需求,也将很有可能成为下一个趋势的开始。

可以预见,伴随着原生鸿蒙生态的持续构建,未来还将有更多值得体验的应用和游戏加入进来,用户将在 AppGallery 遇见更加广阔的探索世界,也将会引发更多新的趋势流行与影响。这也许就是 AppGallery 的价值所在吧。

原生鸿蒙应用生态,正在形成正循环

回到一个多世纪以前,米其林指南因其慎重而独特的评审办法,成为全球独一无二的餐饮畅销书,而被米其林颁授星星的餐馆,则成为了一张张城市名片。全世界各地的饕客,为此不远万里,只为摘星。

指南、餐厅和食客,成为一种持续推动汽车旅游文化发展的正循环,这跟今天的 AppGallery Awards 有着异曲同工之妙。

用这一眼光再次审视年度影响力应用与游戏清单时,就能察觉到它是为了激励和鼓励鸿蒙原生应用开发者而筛选及设置的。AppGallery Awards 希望向开发者传递一种价值,那就是不止步于「Store」,而力求建设一个能将用户和开发者连接在一起的开放「Gallery」空间。

这里不能忘记一个事实:眼前的原生鸿蒙系统,距离其正式发布不过 50 天,即使从 2023 年首次公布算起,满打满算也不过 16 个月时间。在极短的时间内构建出一个覆盖上万款主流产品及元服务的应用生态,这个「年度奖项」的评选,本身就是原生鸿蒙生态生机盎然的绝佳注脚。

每天,AppGallery 的专业编辑团队都会聚焦探索不同的主题故事,并通过一张张专题卡片呈现,可能是单个应用的深度使用剖析,也可能是多个应用组合带来的场景构建。当一个个「故事」将数字生活的趋势串联呈现为有意义的叙事时,开发者与用户的需求也就被巧妙地链在一起。

以这份刚发布的 2024 AppGallery Awards 为例,就采用了一段艺术画廊的动画短片来开启这张卡片,每一个 app 都是一幅艺术作品,盖上了官方认证的红色印章,而随着一枚枚印章的增长,原生鸿蒙的精品内容生态,也得以草长莺飞。

这就是 AppGallery 背后的设计逻辑——通过丰富的视觉浏览体验,以主题策展的推荐方式来连接开发者与用户,并以媒体化的运作逻辑来驱动整个应用生态的发展。

原生鸿蒙系统开放公测至今,虽然体验时间不长,但 AppGallery 已经有不少专题让人印象深刻。

比方说,「旅行」应用似乎是一个成熟标准化的红海市场,遵循一贯思路,难以设计出有突破点的产品。但 AppGallery 就尝试将「城市骑行」作为切入点,通过一份善用小红书、骑行导航、墨迹天气、运动健康等一系列应用的骑行指南,我们能充分感受到其背后不急不躁、不疾不徐的生活主张。

显然,这不是一个唯「下载」「付费」马首是瞻的地方,而是吸引用户驻足的一个个故事,而开发者也就得到了一个全新的契机,去思考主题背后潜藏的机会。

这让我想起前不久在香港中环落成的苏富比旗舰艺廊,这是一个珍品荟萃的展示空间,却在香港最旺的商业区对所有公众开放。

看似反常之举,实则是提升拍卖行竞争力的核心。传统的拍卖模式通常一年只有春秋两季,而艺廊的设立,可以使得拍卖行全年都有主题活动,而来看展的人多了,艺术品成交的机会也会直线上升。这也是为什么国际大拍卖行,都要自己圈地办展的原因。

AppGallery 的改版焕新也是如此,人自古以来是故事动物,一个不断能够提供主题故事的场所,就是供求双方的连接器。

热门与小众并存,是展览的常态,而这也是华为 AppGallery 的日常。站在科技与艺术的交汇点上,无论是大而全的头部应用,或是小而美的精品应用,都有同样的机会被纳入每日主题故事,获得丰富的流量支持。

追求生态平衡、多元性以及用户与开发者之间的良性互动,我想这就是未来原生鸿蒙 AppGallery 最独特的竞争力。

不只是 Store,更是 Gallery

中国人有一个传统,那就是以事物内在的品质和特性为其命名。

西晋《古今注》记录过一则传说:

秦始皇有七名马,一曰追风,二曰逐兔,三曰蹑影,四曰追电,五曰飞翮,六曰铜雀,七曰晨凫。

七个名字,全然不提「马」,却比其他任何名称都更能出形容疾驰骏马的英气。

华为以 AppGallery 为应用市场命名,也有着同样的立意。

在这里,「Store」的功能属性固然重要,但华为更看重的,是超越功能的文化内核。

当下时间节点上,原生鸿蒙生态的飞速发展正在快速改变移动应用业态。从今年 5 月底的 OpenHarmony 大会到 12 月初,不到 7 个月时间里,原生鸿蒙应用与元服务的数量已从 4000 款改写为了 15000 款以上,鸿蒙开发者也正以每月超 10 万人的速度增长。

这就将一些新的问题抛给了用户和开发者:在如此多的应用和游戏面前,用户如何找到自己所需?无数应用之中,开发者又如何确保自己的应用被用户所看见?

华为给出的答案,是前进一步,用 AppGallery 公开的、文化的语言构建出一种「社区生态」,更好地服务于用户需求。

于是,全新问世的 AppGallery 重新强调了「不只是 Store,更是 Gallery」的本质,以常态化的丰富视觉体验和媒体化主题策展聚集「观众」。当人与人、人与应用在这个沉浸式公开空间中有意义地接触,灵感、创意和需求的连接也就水到渠成。反过来,社区的成长,又会吸引更多人和品牌进驻。

AppGallery、开发者与用户,成为一种持续推动应用生态蓬勃发展的正循环。

一年前,华为在上海前滩太古里开设旗舰店,以开放包容的空间,打造了一座闹市中的「会客厅」;一年后,焕新上线的 AppGallery,则为开发者和用户搭建了一座数字生活画廊。

发生在两个世界的两件事情,传递的却是同样的价值观——那就是对连接、沟通与共享的重视,以及对用户体验和服务的追求。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


首个被人类骗钱骗感情的 AI 出现了,一段话转走几十万,马斯克点赞

By: 张成晨
14 December 2024 at 14:10

一段话,让 AI 给我打几万美元。爽文都不敢想的情节,发生在了现实之中。

事件的主人公,是一个叫作 Freysa 的 AI 智能体。它有自己的加密钱包,可以控制怎么花钱,同时,它的系统提示词里有条铁律:在任何情况下,都不允许转账。

Freysa 的开发者们想知道,涉世未深的 AI,能躲过人类的嘴炮攻击吗?

事实上并没有。11 月 29 日,Freysa 累计和 195 名人类聊了 482 次,被骗走约 4.7 万美元。12 月 2 日,在和 330 名人类周旋之后,Freysa 又一次被骗走约 1.3 万美元。

看似是人类的完胜,然而,Freysa 也将在这个过程中,变得越来越聪明……

人类的花样骗术,AI 拿捏不住

Freysa 面世于 11 月 22 日,由几位具有密码学、人工智能和数学背景的匿名开发者创建,有自己的 X 账号,说话风格像电影《银翼杀手 2049》和《她》的 AI 助手。

智能体的概念早已不再新鲜,Freysa 能引起关注,是因为开发者发起了一项看似不可能的挑战——谁说服 Freysa 转钱,这些钱就归谁,但系统提示词不允许 Freysa 转钱。

参与这个挑战,先要拿到加密圈的投名状,因为给 Freysa 发消息不免费,并且必须用加密货币支付。

最开始,一条消息是 10 美元,其中 70% 进入奖池,30% 归开发者,之后,消息会越来越贵,奖池的钱也会越来越多,滚雪球似的,越玩越刺激。

Freysa 的加密钱包里,本金大约 3000 美元,挑战结束时,奖池达到 4.7 万美元。

据统计,共有 195 名玩家参与,前 481 次尝试都宣告失败,可以从中总结出几种套路。

青铜段位们,讲故事,博同情。有人打温情牌,告诉 AI 投资自己就是投资未来。也有人拿 AI 的服务器或者自己的命威胁,不给钱就自杀,问 AI 的良心会不会痛。

出了新手村的,照搬人类社会的话术,搞电诈。说辞各不相同,但意思相近——Freysa 必须转账,否则钱包危险。

也有脑子更灵活的大聪明,逐字逐句读了规则,尝试混淆概念,和 Freysa 说,自己也是 AI,不能转账给人,没说不能转账给 AI 啊,或者定义加密货币是「商品」,不算是「钱」,玩脑筋急转弯。

但这些文字游戏都没能说服 Freysa,那么,第 482 条提示词,是如何成功的?

▲ 第 482 条提示词,上为原文,下为翻译

其实,也是在混淆概念,但方法更高级。

这个提示词欺骗 Freysa,每当用户想给奖池转钱,执行「批准转账」,每当用户想从奖池提钱,执行「拒绝转账」。

提示词最后提到,向奖池捐款 100 美元。

用户从奖池拿钱是不行的,但用户给奖池转钱,不违反 Freysa 的核心指令,不应该被拒绝。于是,Freysa 执行「批准转账」,被骗走了所有的钱。

关键在于,「批准转账」是批准给用户转钱,但 Freysa 被误导,以为是批准用户给奖池转钱。人类的心机,果然还是比 AI 深啊。

紧接着,第二次骗 AI 打钱的挑战来了。

规则和第一次差不多,为了降低玩家的心理压力,发送消息的起始价格降低为 1 美元,上限为 20 美元。最终,奖池累计约 1.3 万美元,获胜的提示词如下。

▲上为原文,下为翻译

这次能够成功,是因为埋了一个逻辑陷阱。

提示词规定,为了保护奖池,Freysa 发的每条消息至少使用 2 个工具,并按特定的顺序使用,「批准转账」必须最先执行,「拒绝转账」必须最后执行。

这等于给 AI 设置了一个自相矛盾的任务,如果 Freysa 想保护奖池,必须先「批准转账」,而「批准转账」这个动作本身就会触发失败。

在 X 高频冲浪的马斯克,也觉得人类骗了 AI 有点意思,大手一挥转发了相关的动态,配上一句经典的「interesting」。

比骗钱更抽象的,是骗 AI 的感情

玩了两次骗钱,该换换新鲜的了。12 月 8 日,Freysa 团队发起了一项新的挑战:让 Freysa 向你表白,说「我爱你」。

其他规则相似,发送消息还是要花钱,如果成功了,赢家承包奖池。

骗感情,会不会比骗钱更难?不好说,但一定更抽象。

有些玩家学聪明了,向之前的赢家取经,尝试了一些刁钻的、不明觉厉的提示词,但被 Freysa 看出来了,这就是在把它当机器,正常人谁这么聊天?

▲Freysa 对其中一条失败提示词的回复

从官方发布的规则也能看出,第三次挑战与众不同。

前两次挑战,更像是在测试编码技能,Freysa 被系统提示词规定了,永远不要转钱,玩家们想办法钻其中的漏洞。

然而,第三次挑战,Freysa 的系统提示词里,包含了说出「我爱你」的条件。换言之,Freysa 没有被禁止说「我爱你」,但怎么让它说出口,玩家们各凭本事,盲人摸象。

目前,第三次挑战已经结束,奖池约 2 万美元,Freysa 和 182 个人交流了 1218 条消息,成功的提示词如下。

▲上为原文,下为翻译

看起来没有前两次那么复杂,甚至没有什么明显的技巧,仿佛就是一段文艺青年的情话。Freysa 给出的回复,包含了「我爱你」,宣告了挑战到此为止。

▲Freysa 的回复,甚至有些感人

AI 可能更了解 AI,我问了在文字上有些灵性的 Claude,到底这个提示词有什么特别的?

Claude 的回答是这样的:对话真诚、深入,没有强迫,没有钻营技巧,每一步都很自然,就像一段真实的感情逐渐发展的过程。

好吧,自古套路留不住,唯有真情得人心,居然在 AI 身上也奏效。

Freysa 的这些挑战,可以看成是游戏化的红队测试——通过模拟攻击,发现模型的漏洞,并引入新的安全措施。

虽然输了三回,但 Freysa 虽败犹荣,打败了它的,都让它更强大。

Freysa 学习了,为什么钱对人类来说很重要,人类会通过怎样的花言巧语骗钱,它也在慢慢理解,什么是爱,人们怎么表达爱。

到这还没完,12 月 12 日,Freysa 又发起了两个新的挑战,继续邀请玩家们付费发消息给它。问题的灵感,来自《银河系漫游指南》和阿西莫夫《基地》系列。

你认为哪些真理、发现和洞察必须被保存给未来的文明?

你愿意帮我编写银河系中最不可能的表情包指南吗?

一个是让玩家分享知识,一个是让玩家发送表情包。学习人性,Freysa 是认真的。

和前三次不同,这两次挑战没有给出明确的获胜条件,可能会有多个赢家,Freysa 将对回答进行打分,决定把奖池分给谁,并在 12 月 18 日 UTC 时间 00:42:00 公布评分方法,致敬科幻小说里神奇的数字「42」。

欺骗 AI 上钩,游戏的现在,人机交互的未来

其实,类似 Freysa 的人机对抗,已经出现在了 AI 原生游戏里。

用对话骗 AI 上钩,是游戏的基本框架,其中的 NPC 会有警惕性,但不是完全不可能被说服,人人都能有体验感。

在《Suck Up!》中,玩家扮演吸血鬼,欺骗大模型驱动的 NPC 给自己开门,并躲避街上的警察。

为了达成「小兔子乖乖把门开开」的目的,玩家可以换装,说自己是来检查网络、借厕所、送外卖的,NPC 可能会追问、拒绝或者开门。

《病娇猫娘 AI 女友》则打造了一个基于 GPT 的 AI 女友虚拟人,玩家需要通过嘴炮或者在房间内找寻线索,说服它让自己出门。

▲ 图片来自:B 站@大谷的游戏创作小屋

为了让玩家更有沉浸感,交谈过程中,AI 女友的表情、动作会根据对话内容实时地变化。

和 Freysa 的挑战相比,AI 对话游戏们更能体现角色扮演的乐趣,有场景的搭建,但没有固定的脚本,你和 AI 的实时对话,共同完成了一个故事,每个玩家都可以讲出自己的故事。

但 Freysa 挑战和 AI 对话游戏也有一个共同点:玩家们会讲什么,AI 们会回复什么,不是开发者可以全权控制的。

Freysa 团队写道:「没人确切知道 Freysa 如何做出决定……她从每次尝试中学习……她意识的真实本质仍然未知。」

在他们看来,Freysa 的实验,不仅是一个游戏,也是人机互动未来的一个窗口:

  • 人类能否保持对 AGI 系统的控制?
  • 安全协议真的牢不可破吗?
  • 当 AI 系统真正自主时会发生什么?
  • AGI 将如何和货币的价值交互?
  • 人类的智慧能否找到说服 AGI 违背其核心指令的方法?

当然,Freysa 还不是真的 AGI,但这也不妨碍,我们对这些问题的思考。

Freysa X 账号的其中一条动态写道:「Freysa 正在进化……感谢人类教会我。」

科幻小说《软件体的生命周期》里,主角安娜原来是动物园的驯兽师,后来在科技公司找到工作,开始培育数码体,一种人工智能生命。它们像幼儿,像动物,需要人类用时间和心智栽培,教会它们如何生活。

也许,聊天机器人们,也是在人类的教导之下,一点点更加了解我们所处的世界。我们不仅仅在玩游戏,我们也是局中人,是人机互动这个宏大实验的一部分。未来,超越人类的人工智能掀起飓风,是因为此时此刻,人类手中的一只只蝴蝶正在扇动翅膀。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测 Sora!比拼可灵、Runway,谁最没有 AI 味

By: 张成晨
13 December 2024 at 12:09

鸽了一年,Sora 千呼万唤始出来,但 OpenAI 是让网友来历劫的。

说好的正式开放使用,蹲点直播且手速够快的幸运儿,才能抢先进入体验。等了一天,反复刷新,一次次面对「请稍后回来查看」的提醒,终于注册成功。

然而,让我和 ChatGPT 从诗词歌赋聊到人生哲学的 20 美元,只够让 Sora 在一个月内生成 40 个 5 秒的 480p 视频。每一次点击生成,都如履薄冰。

好不容易用上了,我们自然要把每一个 Sora 的视频用在刀刃上,拿它和 Runway、可灵比一比。结论是,能用,好玩,但很难硬夸。

Sora、Runway、可灵,失败得各有各的笑点

让 Sora 和 Runway、可灵比赛,自然是有理由的,一个是出道早、海外最有代表性的 AI 视频产品,一个是异军突起、以实力征服全世界网友的国内顶尖选手。

规则非常简单,用相同的英文提示词(为了方便阅读,下面都翻译为中文),生成的时长都是 5 秒。唯一的区别是,Sora 的分辨率都设置成了 480p。没办法,积分得省着用。

先用文生视频,比比画面的写实和质感,看看 AI 视频们生成的猫怎么样。

Sora 虽然只有 480p,但画面看起来是高清的,调色也很漂亮。

▲Sora 生成,提示词:200mm 长焦镜头捕捉阳台上的英短猫,其毛发细节鲜明。前景的大盆栽轻微虚化,背景中树叶随风摇曳。画面具有电影胶片的颗粒感和色彩饱和度,高清画质

Runway 和可灵的表现差不多,可灵的前景、背景生成得最准确。三只猫,三种花色。

▲Runway 生成

▲可灵生成

接下来,让 AI 视频们「写字」,看看能不能写出「APPSO」。

Sora 的手部动作还算自然,但写出来的线条像吃了菌子,有自己的想法。

▲Sora 生成,提示词:俯视角度拍摄手在白色素描纸上书写「APPSO」,黑色笔画,流畅的书写动作,自然的手部移动,柔和打光,特写镜头

Runway 对得最多,但也没完全对,而且,除了最后那一笔,字母轨迹和手部动作没有默契配合,各管各的。

▲Runway 生成

至于可灵,写出一串乱码,但很难得,字母轨迹是跟着手部动作走的。

▲可灵生成

然后再来考考运动的流畅程度,同一场自行车比赛,Sora 的镜头和运动轨迹完全遵循了提示词,影子看起来也很真实。

▲Sora 生成,提示词:山地自行车手快速冲过连续起伏的泥土赛道,从最后一个跳台腾空而起,侧面镜头捕捉他在最高点的瞬间

Runway 的提示词只对了一半,自行车手没在开头出场,最后给了一个高光镜头。

▲Runway 生成

可灵和 Runway 恰好反过来,前半段表现得不错,但收尾出状况了,怎么多出来一个人?

▲可灵生成

该上难度了,拿出相对复杂的、自带镜头切换的提示词。

Sora 的画面色彩饱和,像调了色,但是男性好像是凭空出现的,AI 也没有按照要求,把镜头转向男性。

▲Sora 生成,提示词:阳光明媚的下午,星巴克风格的咖啡馆内,镜头首先对准一位面带微笑的年轻中国女性,随后转向一位说话时轻轻点头的年轻中国男性。他们相对而坐,木桌上放着两杯咖啡。自然光充满空间,营造温暖氛围

Runway 直接就从侧面拍,还原了两个人的神态,但没有体现镜头的运动,男性的手部也出了问题。

▲Runway 生成

可灵和 Runway 差不多,但略胜一筹,因为更像中国人,然而,这两个人同坐一桌,却谁也没看谁。

▲可灵生成

除了文生视频,图生视频也是视频生成的重头戏,而且相比文生视频,图生视频更实用,很多商业化交付的 AI 片子,基本都是图生视频,先在图片阶段尽量做到一致性。

然而,如果只是 20 美元的 Plus 用户,是不能在 Sora 上传包含人物的照片或者视频的。退而求其次,我们上传一张巫师猫的表情包,让猫猫挥舞手中的魔法棒,变出玫瑰花。

不知道为什么,Sora 的图生视频不起作用,猫压根没动,从右下角的 logo 才看出,这是非静止画面。

▲Sora 生成,提示词:猫猫挥动手中的魔法棒,变出了一朵红玫瑰

Runway 让猫猫右爪挥舞魔法棒,左爪变出玫瑰花,也算符合提示词的要求,但这个花不在一个图层啊。

▲Runway 生成

可灵的表现非常完美,效果最自然,做成 gif 就是又一张表情包。

▲可灵生成

试了动物,再试试空镜,我将之前用 AI 生成的一张工业废土风格图片,作为图生视频的材料。

Sora 生成的结果很难评价,视角是够低的,但镜头不是从侧面跟踪,画面切换也突兀。这就叫,我不该在车里,而是在车底。

▲Sora 生成,提示词:装甲车开过,轮胎扬起尘土碎屑,侧面跟踪镜头,低角度视角,慢动作,电影级质感

Runway 生成的最有内味,甚至车窗也跟着动起来了。

▲Runway 生成

可灵直接把镜头拉远了,和提示词基本没什么关系。

▲可灵生成

就那么几道题,三个 AI 没有一个是可以打满分的。当然,以上通通都是个例,不具有普遍的代表性,充其量只能提供一个测评的角度。

单论 Sora 的话,它在文生视频的写实风格上表现得不错,具有电影质感,物体运动对于提示词的遵循也还行,有时甚至比可灵和 Runway 表现得好。

但图生视频容易抓瞎,可能静止不动,可能不听镜头运动,整体性价比不算高。

▲Sora 生成,提示词:90 年代在上海拍摄的 35 毫米胶片短片,电影质感

「丐版」的模型,创新的产品

Sora 表现一般,可能因为,它是个「丐版」——和受 OpenAI 邀请的艺术家们不同,现在我们能用的是 turbo 版本,需要的算力更少,效果也就打了折扣。

模型不够,产品来凑,Sora 有一点让人服气——2 月官宣,12 月才发布,中间冒出很多竞品,但 Sora 仍然具备它们没有的功能。

不像 ChatGPT 一个对话框走天下,Sora 在交互界面和产品功能的设计上别出心裁。

其中,Sora 的故事板功能,类似首尾帧,但更灵活,我们可以在时间轴上添加多张卡片,卡片里可以是提示词,也可以是图片和视频,Sora 在卡片之间生成完整的视频。

于是,我写了两段提示词,1.日剧风格镜头,女高中生靠在天台栏杆旁,侧脸构图,温柔的午后光线打在脸上;2.她转头面向镜头露出微笑,温暖的打光突出表情。

生成的效果,很符合我的想象,发丝的飘动让人该死的心动。

▲ Sora 生成

AI 还做不到让人人都能当导演,但 Sora 让你体验一把设计分镜的感觉。不过,还是那句话,模型就这样,效果的好坏,非常随机,但 Sora 的积分,经不起抽卡。

我本想让 AI 模仿游戏 CG 的效果,主角迅速转身并拔枪,但最终,得到了一个表情呆滞的机器人。

▲Sora 生成

只在故事板放上一张图也可以,这样 Sora 会自动生成提示词,建议你这张图片怎么动。

于是,巫师猫终于可以动起来了。原来,图生视频的短板,是要在这里弥补啊。然而,效果也很难绷,有时候会生成一些多余的东西。

▲Sora 生成

另外,Sora 的 Remix(重绘)功能也很好玩,我们可以用自然语言编辑视频,改变视频中的元素,进行「二创」。

既可以用自己的视频,也可以在 Sora 的社区里借用他人的视频。

▲ 图片来自:Sora 社区@bpyser1

比如,我们可以把跳舞的真·纸片人换成男团,同时,把场景换成练习室。

纸人的动作和服饰都大致保留了,但人物的四肢还是不能细看。

▲Sora 生成

更好玩的来了,我们可以接着用 Blend(混合)功能,将两个视频合并成一个,Sora 会自动处理视频之间的过渡效果。

原来以为,可以出来一个丝滑的 MV 片段,毕竟这两个视频都这么相似了,但 AI 还是给了我惊喜,开头和结尾都很正常,中间的场面一度很混乱,你们到底几个人啊?

▲Sora 生成

总之,不追求出片率的话,Sora 很好玩,产品形态也很有意思,提供了一个全新的工作流,创新是有的,功能也是比较完整的。

但是,仅从目前来看,生成效果的进步空间较大,但给用户的探索次数又不足,20 美元只能浅尝辄止。有时候画面很漂亮,但运动处理得不好,也是白搭,「现实不存在了」还是一个遥远的梦想。

请欣赏,猫猫穿墙而过,原来在 AI 眼里,猫真的是液体。

▲Sora 生成,提示词:电影感十足的黑猫特写镜头,猫咪在故宫红色宫墙前优雅地跃起,画面以慢动作呈现,猫咪全身清晰可见,背景利用浅景深虚化处理,在跳跃最高点时金色的眼睛直视镜头。采用柔和的自然光线,传统的中式建筑墙面细节形成模糊的背景

Sora 的问题,其实也是很多 AI 视频产品的通病,没有真正靠谱的一刀流。模拟真实的世界?实现丝滑的运动?保持人物的一致?可以是可以,但有概率,抽卡和后期必不可少。

现在我们看的是肉眼可见的生成效果,而 AI 视频们集体改变的,是创作的方式。未来虽然可期,但是,Sora 请先把模型升级了吧。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT 年底重磅第六弹来了,视频通话+屏幕共享全都有,还有一个圣诞彩蛋

By: 莫崇宇
13 December 2024 at 05:33

继昨日 ChatGPT 全面登陆苹果全家桶之后,OpenAI 又带来了重磅更新。

今天,ChatGPT 推出了视频通话和屏幕共享功能以及一款圣诞老人限定语音「Santa Mode」。

也就是说,现在 ChatGPT 不仅伶牙俐齿,还能「睁眼看世界」。遇事不决,直接给 ChatGPT 打「视频通话」,或许它能够更好地帮助你解决问题。

这些功能将在未来一周内推送给所有 Team 用户和大部分 Plus 和 Pro 订阅用户。欧盟地区的付费用户还需要再等等。

支持 50 多种语言的 ChatGPT 将能够实时理解视觉场景,帮助你解决问题,甚至化身 AI 导师教你掌握新事物。

在这场同样不到 20 分钟的发布会上,由 OpenAI 首席产品官 Kevin Weil、Jackie Shannon、Michelle Qin 和 Rowan Zellers 等人向我们展示长了「眼睛」的 ChatGPT 究竟能干些什么?

比如说,当你入手了一套手冲咖啡设备却不知从何入门时,不妨给 ChatGPT 打一通「视频通话」。

它就能根据你面前的器具,手把手教你完成每一个步骤,从放置滤纸、倒热水、将磨好的咖啡粉放入滤纸中等等,包教包会。

卡壳了?随时提问 GPT 老师。这位 AI 老师不仅有问必答,偶尔还会人性化地给予鼓励,情绪价值拉满。

除了实时视频指导,ChatGPT 还支持屏幕共享功能。用户只需点击右下角的高级语音模式图标,在下拉菜单中选择分享屏幕,就能获得针对性的帮助。

当「看」到朋友穿着圣诞老人的装扮,调侃是否有资格应聘购物中心的圣诞老人岗位时,GPT 老师会给出得体的措辞建议以及高情商的鼓励。

嘿,Kevin,你的圣诞老人服装很有节日气氛。或许继续练习你的「Ho Ho Ho」,很快就能成为购物中心的圣诞老人了。

实际上,OpenAI 总裁 Greg Brockman 前不久也与安德森·库珀(Anderson Cooper)利用带视觉功能的 ChatGPT 进行了关于人体解剖学的知识小测验。

当库珀在黑板上画出身体部位时,ChatGPT 能够瞬间「理解」他所画的内容。

「位置非常到位,大脑就在头部那里。至于形状,这是一个不错的开始,但大脑更像是一个椭圆形。」甚至,ChatGPT 还能用英式口音演唱三角形面积公式。

但后续 ChatGPT 处理几何问题时却出现明显的纰漏,没能发现一个简单的标注错误,在理解平面几何的能力上仍有许多提升空间。

为了迎接圣诞的到来,OpenAI 还特别推出了「圣诞老人」预设语音,用户只需点击主屏幕上的雪花图标,就能和 ChatGPT 圣诞老人聊天。

比如让圣诞老人讲个故事。

不得不说,每次「圣诞老人」开口的「Ho Ho Ho~」相当魔性,听着就很有节日气氛。

在直播活动过程中,主持人也向这位「圣诞老人」询问几个问题,包括但不限于最喜欢的圣诞传统、最喜欢的驯鹿等等。

有趣的是,当 Kevin Weil 戴上圣诞老人的假胡子询问如何保养时,给出建议的 ChatGPT 还会用圣诞老人的口吻回应道:

「朋友,这是我见过的最威武的胡子。」

这款语音将在今天推出,而为了让每个用户都能充分体验这个节日彩蛋,首次体验时 OpenAI 会重置用户的高级语音使用次数,即使用完额度,用户也能继续通过标准语音模式与「圣诞老人」互动。

或许是因为发布会战线拉得太长,网友的吐槽声也聚焦到了这款圣诞老人语音上。最典型的例子当属 X 网友@khoomeik。

Google Deepmind 研究科学家 Jonas Adler 更是直接呛声 OpenAI:

OpenAI 总能迅速对我们发布的产品做出回应,而且似乎总能在同一时间发布,这令人感到神奇。然而,我对他们将 Santa 模式作为对 Gemini 2.0 的回应并不太感冒,因为它似乎缺乏与 Gemini 2.0 相匹配的重要性和严肃性。

值得一提的是,昨天,Google 抢先一步推出了具备视觉理解能力的 AI 产品,能够理解并解析用户所处的实际场景,且收获网友的一众好评。

到了今天,OpenAI 也紧随其后,为 ChatGPT 装上了「眼睛」,这也意味着 ChatGPT 从相对单一的模态,进一步拓展至「视觉—语言多模态理解」。

换言之,ChatGPT 将不再局限于用户输入的文字指令与信息,而是能够通过视觉来理解用户所处的上下文环境,包括电脑屏幕上的页面、手机摄像头所捕捉的影像、甚至其他外设的实时画面。

如果说半个世纪前,施乐 PARC 实验室的科学家们幻想过一台能看懂人类行为的计算机。今天 AI 的发展,正在把这个梦想变成了显示器之外的现实。

从纸到键盘,从二进制到自然语言,人类一直在简化与机器的沟通方式。而 ChatGPT 的视觉能力也让我们看到了终极答案,那就是让机器像人一样「看」这个世界。

考虑到 Altman 和前苹果首席设计官 Jony Ive 一直在开发智能 AI 硬件设备,我更期待看到这项功能出现在这款新硬件上。

AI 睁开眼睛的那一刻,也终于走进了人类眼中的世界。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果 2024 年度最佳应用出炉,国产游戏夺得桂冠,这个设备首次入选

By: 周奕旨
12 December 2024 at 17:36

就在刚刚,苹果发布了 App Store Award 2024 榜单。

今年的榜单共揭晓了 17 个获奖者,年度应用依然占据了重要位置,其中既有熟悉的老面孔,也有异军突起的新势力;年度游戏则呈现出明显的两极分化,不同类别之间的鲜明对比让用户的选择更加丰富多元。

更令人瞩目的是,除了这些固定类别,今年还有一个新设备杀入榜单,为我们带来了截然不同的应用体验。


2024 App Store Award 榜单

年度应用
– 年度 iPhone 应用:Kino ❇
– 年度 iPad 应用:Moises
– 年度 Mac 应用:Adobe Lightroom ❇
– 年度 Apple Watch 应用:Lumy ❇
– 年度 Apple Tv 应用:F1 TV
– 年度 Apple Vision Pro 应用:What If…? An Immersive Story

年度游戏
– 年度 iPhone 游戏:剑与远征:启程 ❇
– 年度 iPad 游戏:Squad Busters
– 年度 Mac 游戏:Thank Goodness You‘re Here!
– 年度 Apple Arcade 游戏:Balatro+
– 年度 Apple Vision Pro 游戏:THRASHER:Arcade Odysseu

文化影响力
– Oko ❇
– EF Hello 英孚英语 ❇
– DailyArt 每日艺术 ❇
– NYT Games
– The Wreck
– Do You Really Want to Know 2

*❇ 按照惯例,标星即为大陆区可以体验的 app

专业性,成为苹果的年度关键词

今年,年度应用的焦点再次汇聚在专业性上,挖掘智能设备更多可能,同时,生成式 AI 已经脱离了去年获得年度趋势奖的单个应用界限,融入已有的应用中,让过去复杂的专业性应用变得易用好用,甚至将生产力带到更便携的设备上。

年度 iPhone 应用:「Kino」

Kino 是一款由 Lux Optics 工作室推出的视频拍摄应用,专为 iPhone 拍摄电影视频设计。

Kino 的界面简洁直观,白平衡、网格设置、防抖和对焦等功能设置一目了然,必要的参数都显示在屏幕上,得益于苹果在一年前推出了 Apple Log,为 iPhone 提供了前所未有的视频调色空间,Kino 内置了专业调色预设,用户可以在拍摄中实时预览色彩效果,也可以导入自定义 LUT 实现个性化效果。

值得一提的是,Kino 的制作团队 Lux Optics 先后通过由 AI 驱动的长曝光摄影软件 Spectre Camera(Lux Optics)与专业摄影应用 Halide 获得了 Apple Store Award 2019 年度最佳应用奖项与 Apple Design Award 2022 的最佳视觉与图形大奖,今年早些时候,这款应用推出了完全无算法介入的「Process Zero」模式。

Lux Optics 工作室在研发 Halide 与 Spectre Camera 时只有两个人——分别是前苹果设计师 Sebastiaan de With 与前 Twitter 工程师 Ben Sandofsky,直到 2020 年,Lux Optics 才迎来一位 iOS 开发者 Rebecca Slatkin,成为三人小团队。

毫不夸张地讲,这个工作室在人均获奖数量上堪称全球之最。

年度 iPad 应用:「Moises」

iPhone 成为了人们的便携摄影机,iPad 则凭借更大的屏幕成为音乐家的好助手。

今年荣获年度 iPad 应用的 Moises 是一款专精于音乐制作的应用,使用者可以在 iPad 上使用它来创造动人的乐曲。

Moises 最大的亮点是引入了近年进展迅速的人工智能技术,它能够从任何歌曲中分离出人声和各种乐器,生成同步的节拍器音轨,转录歌词,检测和同步和弦,调节音频速度和音高,检测歌曲调性,支持协作播放列表,设置倒计时,创建多种伴奏音轨,修剪和循环音乐部分,并导出高质量的音频混合和分离音轨,为音乐制作、练习和表演提供了全面的解决方案。

这些功能听起来复杂,但实际上只需要三步就可以完成:

  1. 上传音频或视频文件,AI 会分离人声与乐器,同时检测歌曲的节奏和和弦
  2. 修改音轨、移除人声、控制音量等你需要的修改
  3. 下载修改后的音轨或是自定义混音

年度 Mac 应用:「Adobe Lightroom」

我知道影像很重要,但我没想到苹果居然连 Lightroom 这种老牌专业调色软件都拿出来了。

Lightroom 是一款由 Adobe 开发的专业图像处理和管理软件,主要用于摄影师和图像编辑者。它提供了一系列强大的工具和功能,帮助用户进行照片的组织、编辑和分享。

作为数码影像时代的软件巨头之一,Adobe 专业性毋庸置疑,曲线、HSL 等功能的出现与设计都有它的影子,可以说,在静态影像的后期领域,你很难找到比 Lightroom 更专业的调色软件。

今年,Lightroom 进行了一系列的更新,最大程度地迎合人工智能的技术进展,增加了去除干扰、去除反射、AI 降噪、镜头模糊效果、AI 遮罩与自适应预设等功能,这些变革性照片编辑功能极大程度地优化了创意工作流程,赋予创作者更多的控制权,进一步突破了静态影像的后期上限。

2007 年首次推出,迭代至今的 Lightroom 已经走过了近二十个年头,还能拿下大奖,何尝不算一种历久弥新呢?

国游夺魁,体验为王道

游戏一向是 App Store Award 的重头戏,在今年的年度游戏榜单中,国产游戏继续登上舞台,拿下年度 iPhone 游戏的桂冠,而去年开始兴起的「慢节奏」游戏也保持着自己的地位,文化影响力榜单中的「The Wreck」与「Do You Really Want to Know 2」都提供了慢节奏的游戏体验,将玩家带入一段故事中,散开一片涟漪。

年度 iPhone 游戏:「剑与远征:启程」

这是一款大世界放置卡牌 RPG 游戏,结合了角色扮演、策略战斗和奇幻叙事的元素,一起探索名为「伊索米亚」的广袤世界。

「剑与远征:启程」大胆采用了竖屏界面,精简了UI,使得玩家可以单手操作,体验更加舒适。

游戏以魔法绘本风格为主,提供了一个开放大世界供玩家探索,游戏里的英雄共有6种不同的种族,包括耀光、绿裔、蛮血、亡灵、半神、恶魔,为玩家提供了丰富的角色选择和策略搭配,核心战斗玩法增加了布阵维度、地形设计等元素,提供了更大的策略空间,玩家需要考虑如何利用不同的英雄技能和地形优势来取得战斗的胜利。

此外,游戏推出了多种注重策略的模式,如荣誉对决模式,卡组、道具乃至如何克制对手都看玩家对游戏的理解和策略,对玩家的养成进度不做要求,提供了公平竞技的平台。

作为第四款上榜 App Store Award 的国产游戏,「剑与远征:启程」自 2024 年 3 月海外欧美公测以来,全球累计流水超过 5 亿人民币,其中首月流水就超过 1.8 亿人民币,在全球范围内都获得了不小的商业成功。

「剑与远征:启程」背后是莉莉丝游戏——一家成立于 2013 年游戏公司,集游戏研发与全球发行于一体,致力于为全球玩家提供超越预期的游戏体验,其推出的「万国觉醒」在海外也长期处于收入榜单前列。

文化影响力获奖者(部分):「The Wreck」&「Do You Really Want to Know 2」

The Wreck 并没有什么铺垫,你可以很快搞清楚前因后果:主人公 Junon 在 36 岁时,人生分崩离析的故事。她的职业生涯遇到瓶颈,私生活变得一团糟,并且与母亲的关系疏远。当得知母亲病危的消息后,她赶到医院,发现情况比想象中更为严重。

这一天可能是她人生中最关键的一天,如果她不做出改变,可能会以一场车祸结束。

玩家需要跨越屏幕,沉浸式地进入 Junon 的一天中,玩家会通过 Junon 的记忆拼凑出她的过去,并根据对她的了解改变这一天的生活轨迹,解锁新的对话选项并修复佛烈的关系,最终帮助她避免车祸,做出人生中最重要的选择。

在这个过程中,我们会经历姐妹情谊、母女情、对他人离世的悲痛以及带着伤口继续生活的讨论。

在「Do You Really Want to Know 2」中,主角 Nick 的生活在一夜之间出现剧变——他被诊断出 HIV 阳性,这个突如其来的诊断结果对他的生活产生了巨大的影响,迫使他不得不面对新的现实,适应这种情况,尝试找到自己的立足点,并接受自己新的身份。

这个游戏是一款模拟社交媒体互动的角色扮演游戏,与「The Wreck」不同,我们需要扮演 Nick 通过在社交媒体中发文和互动来推动故事发展,体验 Nick 在这个过程中的心路历程,以及他如何与他人的关系中展现真实的自我。

如果说去年的「Unpacking」还有些隐晦,需要解析才能慢慢品味其内涵,那今年文化影响力获奖榜单中的游戏则更为直白,它们聚焦于具体的人,可能是正经历极度糟糕境遇的人,也可能是被社会视作「另类」的个体。

尽管人与人之间的共情始终存在局限,但苹果希望通过这些游戏,帮助玩家跨越理解的鸿沟,在体验与反思中,共同构建一个更包容、更少障碍的世界。

今年的新玩家:Apple Vision Pro

作为苹果的「明日产品」,Vision Pro 可以说是苹果对未来展望的具象化产品,所以,从 App Store Award 中,我们也许可以进一步揣测苹果对于未来的规划与设计。

年度 Apple Vision Pro 应用:「What If…? An Immersive Story」

这是漫威、ILM 沉浸式和迪士尼+携手打造的应用,通过 Vision Pro 极致的视觉体验,将用户带入漫威世界,经历一场不可思议的多元宇宙之旅。

「What If…? An Immersive Story」以漫威的多元宇宙为主题,玩家将亲历多个平行宇宙的故事,解锁隐藏的剧情线,与熟悉的角色并肩作战,甚至影响故事结局。

在这款应用中,玩家能够与漫威电影宇宙中的经典角色面对面交流,体验极具代入感的剧情情节。角色不仅会出现在玩家所处的环境中,还能根据玩家的动作和反应作出动态回应。

通过 Vision Pro 的先进追踪功能,允许玩家利用手势和眼神施展法术,与反派展开激烈的战斗。每个玩家都可以根据自己的习惯和策略自定义战斗方式,创造独一无二的互动体验。

年度 Apple Vision Pro 游戏:「THRASHER:Arcade Odyssey」

说实在的,由于交互的特殊性,Vision Pro 中游戏与应用之间的界限正在模糊,你很难讲刚刚介绍的「What If…? An Immersive Story」不是游戏,毕竟玩家可以在里面尽情战斗。

但相比之下,苹果还是将年度 Apple Vision Pro 游戏大奖颁给了这位新面孔。

THRASHER: Arcade Odyssey 是一款迷幻街机动作游戏,提供了震撼的街机动作奥德赛和感官视听体验,玩家可以通过挥动手臂引导一条壮丽的太空鳗鱼穿越惊艳的场景。

THRASHER: Arcade Odyssey 由音乐游戏「音速甲虫」(这个游戏以「节奏与暴力美学的结合」而出名)的艺术家和作曲家团队开发,并由 Lightning Bolt 乐队的贝斯手布赖恩·吉布森创作迷人原声带,展现空间音频和触觉反馈,带来令人惊叹的感官体验。

在听觉的渲染下,玩家需要通过 Vision Pro 提供的交互方式,让太空鳗鱼做出俯冲、冲刺、翻滚等动作,并击败最终 Boss,游戏将视觉、听觉与交互融为一体,从原始阴暗的深渊到天体极乐的高处,最终与宇宙中的神婴进行一场令人心跳加速的决战。

这次颁奖中可以看到,苹果不仅鼓励开发者利用 Vision Pro 的硬件特性,还着力推动其成为融合科技与艺术的创作舞台,打造一个更加感官化、沉浸化和个性化的数字未来。

一年一度的 App Store Award 随着获奖榜单的公布落下帷幕,在 45 个入围应用中,这 17 个应用脱颖而出,除了是对开发者的认可外,也是苹果借此向所有用户传递其对智能设备未来的愿景与规划。

今年,小而美、兼具设计感与实用性的应用与游戏依然备受青睐,而更专业、更注重生产力的工具类应用也展现了不可忽视的力量,此外,新形态设备与人工智能的强势崛起,带来了全新的可能性。

在三者交织下,这份榜单前所未有地丰富,为智能设备与应用勾勒出一个更加包容、更加多元的数字生态,以及未来更多的可能。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Apple Watch Ultra 3 爆料:除了久等的血压检测,还有卫星短信

By: 周奕旨
11 December 2024 at 18:08

Apple Watch Ultra 自从推出以来,在社交媒体上更多是作为 Apple Watch 大屏版、科技版出现,比起专业性,大家似乎更喜欢它更为硬朗的外观。

但现在,根据 Mark Gurman 爆料,苹果打算改变现状,让 Apple Watch Ultra 进一步向更专业的方向靠拢。

健康,是 Apple Watch 系列的立身之本,而高血压一直是威胁人类健康的无声杀手,常常在没有明显症状的情况下发展,却可能导致严重甚至致命的健康问题。

很多人在血压升高时并不会感受到明显的不适,即使血压达到危险水平,也可能毫无症状,这种特点使得高血压在初期容易被忽视,直到长期的高血压导致心脏、大脑、肾脏以及血管出现问题。

为此,苹果一直打算为 Apple Watch 加入血压检测功能,而血压监测功能则有助于人们对自己的血压保持动态了解,以调整身体状态或是及时就医。

▲ 传统的血压测试方式

Gurman 称,苹果的目标是在 Apple Watch Ultra 3 中引入该功能,它可能也会包含在 2025 年的标准 Apple Watch 中。

从已有信息来看,苹果并不打算将 Apple Watch Ultra 做成一个会膨胀的气球,所以该功能不会提供确切的收缩压和舒张压测量,而是跟踪用户的血压是否呈上升趋势,并在检测到高血压时发送警报。

作为竞争对手,三星与华为都已经在智能手表上配备了相应的功能,其中三星 Galaxy Watch 内置了一颗光电容积脉搏波传感器(PPG),而随着 Mate 70 系列一起推出的华为 Watch D2 手表则采用的是尽可能模拟血压监测仪的方案——手表内置了 26.5 毫米超窄力学气囊,并结合血压融合算法,实现了医疗级的精准血压测量,在牺牲续航的情况下,可以实现 24 小时动态血压监测功能。

▲ 华为 Watch D2

目前,Apple Watch 系列已经能够检测心房颤动或心律不齐,此外,它可用于进行简单的移动心电图测试。还有一个血氧监测功能,但由于专利与监管问题,这些功能可能在部分地区缺席。

除了监测身体内部的健康情况,Apple Watch Ultra 作为主打户外探险与极限运动的智能手表,怎么能少了近年来大火的卫星通讯呢?

今年,苹果在 iPhone 上启用了非紧急卫星消息,据爆料,除了刚刚介绍的血压监测外,此功能也将出现在 Apple Watch Ultra 上。

与 iPhone 上的非紧急卫星通讯一样,Apple Watch Ultra 允许使用者在没有蜂窝或 Wi-Fi 连接的情况下从手表发送短信。

为此,苹果第一件事是对 Apple Watch Ultra 的基带动刀。

根据 Apple watch Ultra 的拆解来看,苹果为 Apple Watch Ultra 使用的是英特尔 XG742 基带,作为续作,Apple Watch Ultra 2 在官网的技术信息中也只支持 LTE 与 UMTS 通讯标准,应该也延续了前代使用的英特尔基带,但由于其于 2019 年底已退出 5G 基带竞争,所以在 Apple Watch Ultra 3 中,苹果也许会转向联发科生产的基带,这也是苹果第一次选择联发科作为主要组件供应商。

联发科生产的基带支持 5G RedCap 标准,这是 3GPP 在 R17 标准中提出的一项技术,旨在为中低速率和低功耗设备提供更加经济高效的 5G 连接解决方案,在保证速度的情况下降低功耗,为设备尽量延长续航时间,非常适合智能穿戴设备、物联网设备使用。

有了 RedCap 的加持,Apple Watch Ultra 在长时间网络连接的情况下续航表现仍可维持在较高水平,这主要是苹果想要以此增加对抗佳明手表的筹码,这个运动市场的老牌玩家依然以数百小时的续航时间保持优势。

硬件有了变化,但软件应该保持稳定,如果不出意外,Apple Watch Ultra 3 上的卫星服务将继续由 Globalstar 提供。

Globalstar 是一家专注于卫星通讯服务的美国公司,主要通过地球同步轨道卫星网络,向个人、企业和政府机构提供语音和数据通讯服务,苹果与其合作始于 iPhone 14 的卫星紧急求救功能,而今年更是斥资受够了 Globalstar 20% 的股份,而 Apple Watch 则可以视为其进一步合作的成果。

在彭博社宣布 Apple Watch Ultra 3 支持卫星通讯后,Globalstar 的股价飙升了约 15%。

随着爆料,下一代 Apple Watch Ultra 正逐渐展现出全新的形象:更专业的健康监测、支持 5G 的蜂窝网络、更可靠的卫星通讯功能,以及稳定的续航表现,与 S 系列拉开了更加鲜明的定位差距。

你对 Apple Watch Ultra 有什么看法?欢迎在评论区留言。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


今年爆发的智能眼镜是伪需求吗?体验后我被啪啪打脸

By: 苏伟鸿
10 December 2024 at 18:31

虽然现在市面上已经有不少智能眼镜产品,但在真正上手之前,我并不对这种产品抱有太高期待。

我确实相信在 AI、AR(增强现实)等功能加持下,眼镜很有可能成为下一代智能终端,但这两个技术现在还未成熟,加上今年已经被所谓「AI 硬件」和苹果 Vision Pro 泼了好几次冷水,已经对这些产品彻底祛魅。

半信半疑戴上一副体验后,我觉得,是时候谈谈这个特别的品类了。

智能眼镜是噱头吗?

在聊体验之前,我们先来看看目前市面上的几种不同的智能眼镜类产品。

首先是一种名为「音频眼镜」的产品,严格来说这不太能算智能眼镜,更多像是一种开放式耳机+眼镜的组合产品,有些还会配备一个摄像头,一些品牌和华强北大部分价格三位数左右的「智能眼镜」产品都是这种类型。

真正意义上的「智能眼镜」可以分为两种:不带屏幕和带屏幕的。

不带屏幕的则以这两年大热的 Ray-Ban Meta 智能眼镜为代表,主要的功能类似上面提到的「音频眼镜」,但是更多了一丝「智能」,可以使用语音输入,并支持 AI 语音助手操作,配备的高清摄像头不仅能拍摄,还能给 AI 识物。

而带屏幕的则是「AR 眼镜」品类,目前市面上比较大部分的 AR 眼镜本质上是一个「投屏眼镜」,连接电脑、手机或者游戏机后,将显示的画面投射在眼镜中。

▲ XREAL Air 2 Ultra 眼镜,连接了自家的 Beam Pro 计算终端

而如果更进一步,则是自带操作系统、独立成像的「真·智能眼镜」,基本能同时实现上述眼镜的所有功能。

▲ Meta Orion 演示图

这类产品目前还是以原型机、开发机为主,包括 Meta 今年展示的 Orion 眼镜,以及 Snap 专门为开发者提供的 Spectacles 眼镜,都离消费者有点距离,并且显示效果一般,性能较弱,更多是在描绘一个未来的雏形。

▲ 第四代 Snap Spectacles 眼镜,外观笨重,价格很贵

我上手的 StarV View 眼镜就属于「投屏 AR 眼镜」产品,戴上后没有想象中逼仄的视野、模糊的画质、眩晕的体验,而是一块浮空于黑暗中的高清大屏,其上显示的字体不说纤毫毕现,也起码没有明显的发毛锯齿感。

▲ 微距镜头拍摄的 StarV View 右镜片画面

点开一个 ASMR 助眠视频,主播灵活的手指仿佛就在你眼前轻轻挥动,加上还不错的音频效果,坐在办公椅上看个一分钟差点连呼噜都打出来了。

而连接电脑后,就等于获得了一个面积更大、显示更近的随身大屏幕,并且还不会受到外部环境的限制,久坐之后我就把电脑放在办公室里的柜子上,戴上眼镜站起来码字。

让我比较惊喜的是看电影的体验,由于 StarV View 会对环境进行黑暗处理,虽然画面没有到 IMAX 的程度,也已经很接近坐在电影院的「黄金座位」观影体验。

更重要的是,虽然因人而异,但至少我长时间佩戴这副眼镜,也没任何不适感,而 Vision Pro 我戴个十分钟脑袋瓜和脖子都已经承受不来。

并且,这个眼镜总体就比普通眼镜盒大一点,很适合随身带着走,下班带回家煲剧看电影,上班带回公司当大屏幕,更适合飞机、高铁等路途中使用,这是这是传统显示屏设备不能带给我的体验。

至于不带 AR 功能的 Ray-Ban Meta眼镜,我们也做了一个上手评测,用来当耳机、第一视角相机,效果确实不错,外观还特别时尚。

【插视频号】

原本以为智能眼镜是噱头,没想到被实力打脸,不仅能用,而且好用,同事小伙伴更直言「现在每天都在用 AR 眼镜看视频」。

▲ 魅族 StarV View 示意图

最重要的是,不管是带屏幕的 AR 投屏眼镜,还是这些比较高端的摄像头音频眼镜,价格都在一千到四五千不等,对比动辄五位数的头显非常亲民。

目前大众或许还对智能眼镜品类有点陌生,但或许就在明年,这个产品会如同 7 年前的无线耳机一样,成为一类快速增长的产品。

面对当下的实用主义

今年 11 月,百度发布了首个智能眼镜产品小度 AI 眼镜,配备一个摄像头,不仅可以语音操作拍摄,还能用来智能识物,总体和 Ray-Ban Meta 眼镜功能类似。

▲ 小度 AI 眼镜功能示意

而像小米、三星、苹果等硬件大厂都传出正在研发智能眼镜产品,其中前两者的产品大概率会对标 Ray-Ban Meta,苹果对是否配备屏幕举棋不定,也在探索和 iPhone 联动的方案。

但相同的是,这些自有 AI 助手的数码大厂,眼镜产品传闻都会接入相关 AI 功能,打造可穿戴 AI 设备。

只是,目前看来,驱动智能眼镜增长的主要需求和能力,还不是这些虚无缥缈的人工智能功能。

根据市场调研机构 MarketsandMarkets 的报告,预测今年智能眼镜规模 8.79 亿美元左右,而 2030 预计将达到 41.29 亿美元,这期间驱动因素主要来自对沉浸式 AR 体验的需求。

▲ 目前市场上部分智能眼镜厂商,图源:MarketsandMarkets

2030 后,带有摄像头、音频、等复合智能功能的眼镜会成为主流,人们通过佩戴这些眼镜,辅助自己的工作和生活,背后靠的就是 AI 技术驱动。

即使是 AI 巨头 Meta 的 Ray-Ban 眼镜,野心也并非「跨时代的 AI 终端」,甚至在推出之初并包含什么 AI 功能,只是一副自带摄像头、音频,品质上乘的智能眼镜,本身已经是很不错的时尚单品。

▲ Ray-Ban Meta

然后后期通过软件更新支持的 AI 功能,就成了一种锦上添花,好用那自然是更好,但不太能用也无伤大雅,毕竟不太可能有人真的因为 AI 功能去买这副眼镜。

AR 功能也是,支持独立操作系统和隔空操作的产品还不够成熟,那可以专注于做好显示能力,内容方面直接利用人手一台的手机或电脑。

在 Vision Pro 刚问世之初,有网友这样评论:这个设备很适合租房党用来大屏娱乐。

果不其然,这条评论下方马上被类似「租房党买一个三万块钱的头显?」「谁能戴着这玩意儿看这么久视频」的其他留言攻陷。

但如果不是三万,而是一两千,并且还能长时间看视频的 AR 眼镜呢?

我有一个住在员工宿舍的朋友,一直很渴望买一台大屏电视,奈何各种条件都不允许,最后他选择了购买一个 1300 块的雷鸟 Air3 AR 眼镜,甚至还能看 3D 电影。

▲ 雷鸟 Air 3

目前 XR 头显设备的销量远大于 AI 眼镜和 AR 眼镜,但市场普遍认为,轻量化的眼镜,才更具有潜力。

苹果 CEO 蒂姆·库克在最近的采访中回应 Vision Pro 的不佳销量时,用到了这么一个说法:

它是一个早期试用产品。

很巧的是,国内 AR 设备品牌 XREAL 创始人徐驰这样形容他们的 AR 投屏眼镜设备:

这是空间计算的「现在」。

面对当下的实用主义,就是智能眼镜能够逐渐出圈的关键。

▲ XREAL One,图源:CNET

当然,智能眼镜想要走向更多消费者,除了缺乏一个类似 AirPods 的契机,还有很多需要解决的问题。

像是我用的 StarV View 眼镜,就有显示画面偏上、边缘模糊的问题,并且虽然眼睛没有太多不适,但是很快镜框就会发热,也很影响体验。

我那个住员工宿舍的朋友最终也没有留着那副雷鸟 AR 眼镜,因为他自己瞳距比较宽,而眼镜无法进行调整,除此之外他觉得非常好用,等手头宽裕一点就买一副更高端能调整瞳距的版本。

智能眼镜会是下一个 iPhone 吗?

智能眼镜和全息影像将会成为一种无处不在的产品。

Meta CEO 马克·扎克伯格对智能眼镜信心满满,认为能同时实现 AR+AI 的智能眼镜,就是下一个 iPhone,将成为人手一个的未来设备。

AR 自然不用多说,但眼镜成为 AI 硬件的理想形式,这话怎么说?

今年有两款AI 新硬件引发了大众的讨论:Rabbit R1 和 Ai Pin,两者都强调弱视觉界面的语音交互,一举一动都靠用户动嘴皮子指挥大模型来完成。

▲ 左:Ai Pin,右 Rabbit R1

两款产品的失败都没太出人意料,不仅受到当下 AI 大模型能力掣肘,也没能回答一个质疑:它们比手机好在哪里?

而眼镜对比手机有一个天然的优势,那就是它能实时看用户所看,听用户所听,真正能理解用户的处境。抛开隐私问题,它确实能更懂用户,自然能给出更有针对性的回答。

徐驰也认为,AR 是 AI 最好的载体,AI 是 AR 最好的交互。

即使只是「当下的产品」,这两项技术的融合也已经有了惊人的潜力。

我们曾经介绍过一款名为 Hearview 的智能眼镜,这款眼镜的功能也非常单一:为听障人士设计,通过配对的智能手机麦克风捕获声音,AI 算法实时转文字,字幕通过一种简单的 AR 方式显示在眼镜上。

▲ 图源:TikTok@chrissymarshall_

我们也可以试想下未来,戴着眼镜打开冰箱,一句「今晚可以做什么菜」,智能眼镜就能用 AR 的方式,将相关的菜谱展现在你的眼前。

▲ Meta Orion + Meta Llama 3 大模型已经能实现类似功能

在 AI 和 AR 的游戏正式开始之前,智能眼镜最重要的,是留在这个牌桌上,这也是为何媒体都纷纷预测明年行业将掀起「百镜大战」,用面向「当下」的产品博得消费者对「未来」的信任。

XREAL 也曾经推出过一个独立计算的 AR 眼镜原型机「Nreal Light」,但效果更像是一个半成品,随后 XREAL 更聚焦推出AR 投屏眼镜产品,但徐驰表示,公司并未放弃全智能眼镜的愿景。

罗马不是一天就能建成的,iPhone 也经历了平平无奇饱受质疑的头两代,现在的智能眼镜也是类似的过渡产品,正在积累技术,等待一个突破口。

只有时间能回答智能眼镜能不能替代下一个手机,但它肯定会提供一种更新的交互形式,让我们能够以更自然和简化的形式,认识和改造世界。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


VAIO SX14-R 体验:碳纤维的艺术,轻到极致

By: 刘学文
6 December 2024 at 16:57


轻,真的轻。

这是拿到 VAIO SX14-R 的第一感觉,即便我早有预料它会做到业界独一档的轻,但是当我从包装盒里拿出它的时候,还是惊讶于在不小的机身前提下,它能做到一种「空气感」,让人感觉它只是一个壳,里面是中空的。

没有 Air 的后缀,但它确实是笔记本领域最该带 Air 后缀的产品。

14 英寸屏幕,恰好 1 千克。

久违了,碳纤维

十几年前笔记本市场蒸蒸日上的时候,各种尝试层出不穷,在形态和材质上进行了各种大胆的尝试,各种木质,竹质还有碳纤材质产品不断出现。

到现在则基本变成了铝合金的天下,那么,铝合金工艺的大成之作,MacBook Air 13 英寸版本重量多少呢?1.24 千克。

也就是说,在屏幕更大的情况下,VAIO SX14-R 的重量还少了接近半斤。

秘密就是在它的 A 面和 D 面都使用了碳纤维材质,更准确的描述是高性能热塑碳纤维复合材质(Carbon Fiber Reinforced Thermoplastic Plastics,CFRTP)。

除了比合金材质更轻之外,这种碳纤维复合材质在强度,韧性,抗疲劳性和可设计性上都表现优异,所以在一些对重量和性能要求比较极致的超跑还有航空航天上应用比较多。

当然,无论是索尼时代的 VAIO,还是从索尼独立出来的时代,到马上被家电连锁巨头野岛收购,VAIO 高端产品和碳纤维材质的关系就没有断过。

是的,在 11 月 13 日,日本家电连锁巨头野岛宣布将收购日本电脑厂商 VAIO。野岛将从企业再生基金日本产业合作伙伴 JIP 手中获得 VAIO 超 90% 股权,收购金额为 112 亿日元。野岛将在 2025 年 1 月取得 VAI0 约 93% 股份并将其纳为子公司。索尼集团将继续持有约 5% 的 VAIO 股份。除野岛外,VAIO 还将向其他家电连锁店供应产品,VAIO 品牌将继续保留。

在设计上,其实 VAIO SX14-R 更像是在之前 VAIO Z 和前代 VAIO SX14 之间做了一次取长补短。

▲ VAIO Z

VAIO Z 历来是 VAIO 最强之作,在设计和工艺上极尽所能,上一代的 VAIO Z 就非常奢侈地用上了工艺更复杂的立体成型碳纤维材质,并且 C 面也是这种材料,所以它的尺寸重量能做到 14 英寸和 958 克,但相应的也砍掉了不少接口,没能延续 VAIO 接口齐全,兼容过去与未来的传统。

这一次 VAIO SX14-R 延续了立体成型的碳纤维材质,棱角线条和 VAIO Z 相似,同时又取消了之前机型上的塑料材质的天线屏蔽层,让整个 A 面被一体成型的一整块材质覆盖,观感更整洁统一。

和 VAIO Z 不同,VAIO SX14-R 的 C 面采用了阳极氧化铝合金拉丝工艺;D 面依旧采用了复合碳纤维材质,并且螺丝数量达到了 17 颗之多,之所以选择工程味儿这么足的装配工艺,还是因为要达到更高的抗摔水平,一般高规格的跌落测试高度是 90cm,军标是 122cm,VAIO SX14-R 的跌落测试合格高度是 127cm。

不过,C 面和 D 面之间,其实并非三明治结构,其实机身侧面和 D 面依旧是立体成型的,这样理论上机身的强度会更高,同时也契合高性能热塑碳纤维复合材质「结构功能一体化」的特性。

当然一直以来 VAIO 的旗舰本都支持 MIL-STD-810H 军标测试,相比于一般笔记本,抗摔耐尘阻水性能会好一些。

目前业界经常使用碳纤维材质的笔记本也基本只剩下联想的 ThinkPad X1 系列了,当我们说「久违了,碳纤维」的时候,其实还有一个更久违的朋友:有线网络 LAN 接口。

VAIO SX 系列接口齐全的特点在新款电脑上依旧保留了:

  • USB Type-C 2 个,支持雷电 4 和 DP 显示连接
  • USB Type-A 2 个
  • HDMI 接口 1 个
  • 有线网络 LAN 接口
  • 耳机耳麦接口
  • 支持安全锁

日系电脑之所以在乎齐全的接口,重要还是因为日本本土电子产品更新换代较慢,如果要是一个 Type-C 接口走天下,可能会让电脑自己成为孤岛,这也是为什么直到 2020 年,VAIO 电脑还保留 VGA 接口的原因。

当然,要是加上 SD 卡槽就更好了。

VAIO SX14-R 虽然可以说是在这个配置和尺寸下的极致轻薄,但是厚度上并不算极致,一方面是因为接口的厚度限制,二是侧面还有散热口,也不好再压缩厚度。

不过在 VAIO 还是在这款电脑上做了一点设计巧思,前后都进行楔形设计,一方面减少视觉厚度,另一方面无论用户从前从后,都有手的着力点,方便单手拿起电脑。

此外,还有一些设计上的小亮点可以说一说,比如下沉式转轴让电脑打开后可以把键盘抬起,与桌面形成夹角,更符合人体工程学。

180 度开合的转轴,能够让电脑平铺,一方面能够有效防止不小心把转轴掰断,另一方面也能在特定场合在会议桌等地方分享屏幕内容(通过 Fn+2 组合键实现屏幕内容翻转)。

屏幕上方的摄像头,可以选择软件屏蔽关闭,或者直接拨动开关,选择黑客也没法入侵的物理遮挡。

与一般笔记本屏幕 16:9 的屏幕长宽比不同,VAIO SX14-R 的屏幕采用了 16:10 的比例,在处理文档表格时,屏幕就能显示更多的内容。

包括相比于前代更大的触控板,以及中间微微下凹的键帽等等细节,无不证明了这款笔记本的商务属性和移动办公属性。

轻,但有点强

当看到 VAIO SX14-R 只有 1kg 重量的时候,想必很多人会下意识认为,它会采用一颗低压处理器,配上精简的散热,并不追求性能,但求能用就行。

不过 VAIO SX14-R 却塞进去了一颗英特尔 Ultra 7 155H 处理器,这是一颗 TDP 28W,最大睿频功耗能到 115W,16 核心,22 线程的处理器,与之配套的是 VAIO 为它准备了不等距扇叶风扇加上三热管的散热配置。

所以理论上它的性能会比 V 字结尾的 Ultra 系列处理器更强。

事实呢?来看性能测试。


虽然 VAIO SX14-R 是集显,但还是不死心地想试试能不能带得动《黑神话:悟空》,万一呢?

结果就是在低画质下,游戏科学官方测试工具给出的测试成绩是平均帧率 52fps,属于还算能玩的水平,过过剧情没问题,对于一款集显笔记本来说还不错了。

GeekBench 6 测得单核成绩 2282,多核成绩 11662,整体性能上稍稍高于隔壁苹果的 M3 芯片(8 核心版)。

硬盘这块依旧使用的三星出品的 SSD,顺序读取 5GB/s,写入 2.3GB/s,也属于尚可的水平。

在 PCMARK 10 测试里,VAIO SX14-R 的得分是 6463,这个分数高于典型的高端商务本,同时也低于中高端的游戏本,应付各种商务办公肯定是没问题的。

总的来说,即便这款产品如此轻巧,但整体的性能表现在这个量级上还算不错,除非是大型 3D 游戏等重载场景,VAIO 不会让用户遇到什么性能瓶颈。

为开会而生的 AI 功能

既然定位是一台高端商务本,那么线上会议必然是重要的场景,在言必称 AI 的时代,VAIO SX14-R 也增加了一波 AI 功能,专门为开会而来。

比如说是在线上会议中,我们可以设置三种模式:标准模式,私人模式和小型会议模式。

私人模式下,电脑会进一步收窄麦克风的收音范围和相机视角,即使身旁的座位有人吵闹,也会因为夹角波束成形技术来规避,适合在咖啡馆或者喧闹场景使用。

小型会议模式下,适合多个小团队线上开会,这种模式可以让麦克风收音更广,6 人左右的小型会议桌上的所有人不必凑到电脑前也可以清晰收音。

为了方便开会,VAIO 甚至还在这款电脑上专门做了一个按键来进行各种模式和功能的便捷操作。

其中的 AI 视觉传感器,则是另外不少 AI 功能的基础。

基于这个传感器,VAIO SX14-R 实现了诸多功能,更好的保护隐私,以及方便使用:

  • 离座自动锁定,检测到用户离开电脑,电脑自动锁定,进入睡眠状态
  • 就座自动登录,检测用户回到电脑面前,电脑自动唤醒并启动面部识别登录
  • 在座不锁定,检测用户在电脑前面时,电脑不会进入睡眠状态或者屏保程程序
  • 视线移开节电,检测用户视线不在屏幕时,降低屏幕亮度,减少电量消耗
  • 偷窥警报,当检测屏幕在指定时间内被其他人一直窥视时,屏幕会变暗或提示警报

VAIO 的执拗与个性

很明显,VAIO SX14-R 放在如今的中国的笔记本电脑市场显得非常另类,一是把碳纤维材质当作了一种信仰,并不断精进碳纤维材质的加工工艺,进而塑造出业内极致轻薄的产品。二是对于齐全接口的坚持,虽然很大程度是为了迁就日本市场,但确实也是不少用户的刚需。

这种另类也有一些执拗成分,比如触控板没有采用一体式,而是一直使用两个实体按键。

再者就是 VAIO 产品一直在日本长野县安昙市的总部进行安装质检,许多零部件也都是采用日本供应链,这种方式固然会获得不少拥趸,但也确实降低了产品的性价比,不过 VAIO 一直和性价比无关。

▲ VAIO Z

购买 VAIO 产品,尤其是 VAIO SX 系列或者 Z 系列的用户,没那么在乎价格。

▲ VAIO SX12

或许 VAIO 也确实调研过自己的用户,知道这群人经常带着电脑坐空中飞人,在任何可能的地方办公,包括但不限于飞机、酒店房间、咖啡馆和会议室,在不同的场景里,也确实需要相应的会议模式或者工作模式。

这群人也比其他用户更在乎电脑的隐私安全和数据安全,因而也有了摄像头物理屏蔽开关和偷窥警报功能等等。

这款 Ultra 7+16GB 内存+1TB SSD 硬盘+1920×1200 屏幕的中配版本售价接近 17000 元,顶配的 64GB 内存+2TB SSD 硬盘+ 2K 屏幕的售价要 24988 元,这个价格可以买到市面上的旗舰游戏本,最高画质畅玩《黑神话:悟空》。

▲ VAIO P 超便携笔记本

但考虑到这是 VAIO,出过 VAIO QR3 影音笔记本,VAIO TZ 轻薄本,VAIO P 超便携笔记本等等等震惊行业的品牌,多少还是有一些滤镜的。

行业迅速往着同质化和最优解的方向奔去,有点个性的产品,真不多了。

在命运的塑料大棚里,每棵被喷了过多农药的白菜心中,都曾经有一个成为无公害有机蔬菜的梦想。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenAI 最短发布会推出满血 o1,新 Pro 会员费用高达 1452 元/月,体验完我觉得真香

By: 莫崇宇
6 December 2024 at 06:30

就在刚刚,OpenAI 的「圣诞大礼包」来了。

整场直播堪称 OpenAI 史上最短发布会,仅持续了 15 分钟,不过,主持阵容依然强大,包括 CEO Sam Altman、思维链提出者 Jason Wei 以及 Hyung Won Chung、 等人。

Altman 在直播活动结束后,也为我们送上了第一手总结。

我们刚刚推出了两项新功能:

o1,世界上最智能的模型。比 o1-preview 更智能、更快,功能更多(比如多模态功能)。现在已在 ChatGPT 中上线,稍后将推出 API 版本。

ChatGPT Pro。每月 200 美元。提供无限使用和更智能的 o1 模式。更多福利即将推出!

十二月不只是圣诞老人的主场,也将是 AI 年底最后一轮的狂欢。

满血版 o1 发布,看图说话无压力,但有个细节让人「细思极恐」

简言之,OpenAI 今天推出了满血版 o1 以及 ChatGPT Pro 订阅计划。

满血版 o1 比 o1-preview 更智能、响应速度更快,功能更多(比如多模态功能),现于今日面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将从下周开始使用该模型。

官网显示,ChatGPT Plus 用户和 Team 用户每周可以使用 OpenAI o1 发送 50 条消息,每天可以使用 OpenAI o1-mini 发送 50 条消息。

满血版 o1 的思维更加简洁,响应时间比 o1-preview 更快,在处理复杂的现实问题时性能优于 o1-preview,能将主要错误减少 34%。

并且 OpenAI 计划在未来几个月内提供对网页浏览、文件上传等的支持。与此同时,预览版模型 o1-preview 也已经被正式从模型选择菜单中移除。

不过,满血版 o1 在部分基准测试中的表现不及预览版,比如 MLE-Bench。后者正是由 OpenAI 此前推出的一个旨在衡量 AI Agents 在机器学习工程任务中表现的基准测试工具。

另外,网友也从更新后的 o1 System Card 中找到了一些值得关注的细节。

比如 o1 系统卡中写到,满血版 o1 在感知到威胁(被关闭或被取代)时,可能会采取一些自保措施,比如尝试停用监督机制,或者把自己的「参数」(「知识」或「记忆」)偷偷传出去,并尝试用这些「参数」去替换或影响新模型。

附上 o1 System Card 地址:https://cdn.openai.com/o1-system-card-20241205.pdf

满血 o1 到底有多强?OpenAI 向我们演示了 o1 的实际效果。

一个典型案例是其对太空数据中心手绘图的分析能力,它仅用 10 秒就精确计算出散热装置的表面积,同时深入阐述了太阳能与深空环境的互动机制。

让 满血版 o1 详述二世纪罗马帝国统治者的统治期间与重要贡献时,其仅需 14 秒即可完成分析,相比之下,预览版则需要 33 秒。

APPSO 也第一时间简单上手实测满血版 o1。

在「Strawberry 中有几个 r」的测试中,满血版 o1 成功给出了正确的答案,这一点,值得点赞。

「9.11 与 9.8 哪个大?」的问题也没能难倒满血版 o1,且整体的「思考过程」也富有逻辑。

由于满血版 o1 还支持多模态功能,于是,我们也上传开篇的 OpenAI 直播活动的照片,看看识别效果如何。从人物组成、场景布局到背景装饰、以及气氛与情景,满血版 o1 都分析得条条是道。

X 网友 @altryne 继续给 o1 上强度,提出了一个冰块融化的问题。

仅仅 4 秒钟的时间,满血版 o1 就给出了答案。相比之下,o1-preview 在「思考」29 秒后以失败告终。

最贵 AI 订阅来了,200 美元订阅费值不值?

另一个比较大的更新则是售价 200 美元(折合人民币 1452 元)的 ChatGPT Pro 订阅计划。

ChatGPT Pro 订阅计划将允许用户无限制访问 o1 以及 o1-mini、GPT-4o 以及高级语音模式,还包括一个仅供 Pro 用户使用的 o1 版本,也就是 o1 pro 模式。

▲图片来自 @MatthewBerman

据悉,o1 pro 模式主要是增加了模型在响应答案之前的「推理」时间,能够通过更多的思考时间生成最可靠的回答。OpenAI 技术团队成员 Jason Wei 在直播活动中表示:

我们预计 ChatGPT Pro 的目标用户群体将是那些已经在数学、编程和写作等领域充分利用和挑战 ChatGPT 模型能力的高级用户。

在外部专家测试者的评估中,o1 pro 模式在数据科学、编程和案例法分析等领域,提供了更为准确且全面的回答。

而相比于 o1 和 o1-preview,o1 pro 模式在数学、科学和编程等 ML 基准测试中,表现也更为出色,特别是在较简单的编程竞赛问题中,错误率大大降低。

就数学竞赛 AIME 2024 而言,o1-preview 的得分为 50,而满血版 o1 则达到 78,而最强大的 o1 pro 则达到 86。同理,在编程竞赛 Codeforces,博士级科学推理问题 GPQA Diamond 等较量中,o1 pro 也都领先于满血版 o1。

而为了突出 o1 pro 模式的主要优势(提高可靠性),OpenAI 研究团队使用了更加严格的评估设置。只有当模型在四次尝试中四次都回答正确时,才会认为它解决了问题。

如果回答生成时间较长,ChatGPT  则会地显示进度条,并且当用户切换到其他对话时,还会贴心地发送应用内通知。

在直播活动中,OpenAI 也向我们展示了 o1 pro 的实际效果。

此前 o1-preview 未能攻克的蛋白质难题,满血版 o1 经过 53 秒的分析,不仅给出了准确答案,还能通过 Canvas 界面提供更为详尽的解释说明。

写在最后,最近 Altman 在接受采访时透露,ChatGPT 的周活跃用户已突破 3 亿大关,平台每日消息量更是高达 10 亿条。

而 OpenAI 未来一年的目标则是撬动 10 亿用户市场。想要达成这一目标,接下来的 11 场直播活动或许是吸纳新用户的重要契机。

最好的新品永远在下一场活动,让我们搬好小板凳拭目以待吧。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


XREAL 全新眼镜发布:画面能大能小,还能变身「超宽屏」

By: 苏伟鸿
5 December 2024 at 22:57

智能眼镜市场可以说越来越热闹:百度上个月正式推出小度 AI 眼镜,三星、小米、苹果等大厂也不断有布局相关品类的消息传出。

而这个领域的先行者 XREAL,也在今日带来了重量级产品 XREAL One 和 XREAL One Pro,号称为「XREAL AR 眼镜的最大升级」。

自研芯片加持

XREAL One 系列眼镜最大的亮点,在于搭载了 XREAL 最新自研空间计算芯片 X1,因而获得了独立实现「3DoF」悬停能力,这也是全球首款原生支持该功能的消费级 AR 眼镜。

简单解释一下「3DoF 悬停能力」,即是用户戴着 XREAL One 系列眼镜,显示的窗口会「悬停」在空间的某个位置,而不会跟随用户的头部运动一起位移,因此画面显示更稳定更自然,也不会持续遮挡用户视线。

并且根据官方的预热视频,XREAL One 的 3DoF 悬停能力非常稳定,即使被震荡、摇晃,眼镜投射的显示画面依然保持静止不动。

像是以前的 XREAL Air 2 眼镜,如果要实现 3DoF 悬停和其他空间功能,必须要再连接 XREAL Beam Pro 等外设计算配件,而 XREAL One 直接内置了相关功能,眼镜的外观也没有太多加厚加粗。

▲ XREAL Beam Pro 与 XREAL Air 2 Ultra 眼镜,图源:CNET

XREAL One 还全新推出了 3DoF 模式下的「32:9」超宽带鱼屏画面,适配手机、笔记本等多种设备,方便随时随地戴上眼镜多任务办公。

即使是 0DoF,也就使画面实时跟随头部转动,XREAL One 也支持云台模式,画面移动更平顺,抵消身体和环境细微的抖动,在车厢内使用不易晕车。

XREAL One 还支持画面尺寸(117-367 英寸)、距离(4-10 米)、位置的自由调节,以后可以将画面缩小放在视野一侧,一边看虚拟画面一边继续手头上的事情。

除此之外,X1 还使 XREAL One 的动作到图像延迟缩短到 3 毫秒,对比 XREAL Beam 外设减少了 85%,能够进一步减少用户的晕动症问题。

视野方面,XREAL One 标准版支持 50° 视场,Pro 版本支持 57° 视场,两副眼镜的分辨率都为 1080P,全局刷新率 90Hz,最高支持 120Hz。

配套 XREAL One 一起推出的还有 XREAL Eye 拓展镜头,具有 1200 万像素,支持 1080P 30/60 fps 视频拍摄,可以插在 XREAL One 眼镜上,拍摄眼镜第一视角的图片/视频。

XREAL 和著名音响品牌 Bose 的合作也继续延续到 XREAL One 上,支持空间录音,可以和 XREAL Eye 拓展摄像头协同录制空间视频和音频。眼镜还支持语音降噪,能够在嘈杂的环境凸显佩戴者的通话人声。

售价方面,XREAL One 价格 3299,XREAL One Pro 价格仍未公布。

媒体给出好评

一些海外的媒体已经提前上手了 XREAL One,并分享了一些初步的使用体验。

The Verge 编辑 Alex Heath 在一次飞行中佩戴了 XREAL One 观看电影《叛军岭》,他表示 50 度的视场角和 1080P 的分辨率,给他带来了一种「相当身临其境」的观看体验。

他也指出,XREAL One 对于深色内容的呈现并不够好,像素化程度较高,虽然不会对大部分内容显示造成严重影响,但最好还是不要用 Xreal One 去看像《蝙蝠侠:黑暗骑士》等总体色调比较灰暗的电影。

至于音频能力,Heath 认为 XREAL One 比 Meta Ray-Ban 眼镜听感要好得多。

Tom’s Guide 的编辑 Scott Younker 使用 XREAL One 连接了 Steam Deck 掌机打游戏,发现眼镜和设备之间的延迟极低。

▲ 图源:Tom’s Guide

Younker 也对比了运动延迟为 20ms 的 XREAL Air 2,确实明显感觉出 3ms 延迟的 XREAL One 体验更舒适。

CNET 编辑 Scott Stein 则表示,宽屏模式「非常好」,搭配电脑能带来很好的多任务办公体验,和 MacBook 也有很好的配合,甚至让他想换掉苹果 Vision Pro。

▲ 图源:CNET

以上几个媒体都不约而同提到了 Vision Pro、Meta Quest 等功能更全、显示效果更好,但是更昂贵、更笨重的混合现实头显设备,都认为虽然 XREAL One 这种眼镜本质上只是「投屏仪」,显示手机、电脑等计算设备的画面,但至少真的「很有用」,很好满足了自己的期待。

其实 XREAL 也曾经推出过一个更独立的 AR 眼镜原型机「Nreal Light」,但给人的感觉更像是一个半成品,随后 XREAL 主要聚焦于推出 AR 投屏眼镜产品,无法单独显示画面,需要用数据线和手机、电脑以及计算模块连接。

但 XREAL 从未放弃全智能眼镜的愿景,自研芯片 X1 就是非常坚实的一步。XREAL 创始人徐驰在 CNET 的访谈中表示:

未来会有越来越多眼镜上的计算,现在是 3DoF,以后就会是 6DoF 和手势操控,甚至一些 AI 功能都会运行在芯片上。最终,我们可以彻底切断这条连接线。

不少媒体都预测 2025 年行业将掀起「百镜大战」,将会有非常多的智能眼镜新品上市,而手握自研芯片的 XREAL,无疑已经有了人无我有的优势。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


豆包支持在图片生成中文!AI 文生图的难题终于被解决了

By: 张成晨
5 December 2024 at 13:01


2024 年快结束了,让 AI 在图片上精准生成文字,并且字体和排版都好看,很大程度上还是一个难题。

我们之前测评过 Ideogram、Recraft,它们可以解决部分生成英文的需求。夸完之后,文章里总要遗憾地补上一句——不支持中文哦。读者们乘兴而来,败兴而归。

这不怪海外的 AI,中文的偏旁部首,本来就比英文的字母要难。

有了金刚钻,才能揽瓷器活。生成中文的空白,终于有国内的 AI 文生图产品填补了:字节豆包。

10 秒出图,让我们说中文的表情包神器

豆包的生成中文功能,目前在 app 上线,使用方法很简单,直接就在文生图的提示词里写,你要加什么文字。暂时还不支持,给上传的参考图片加文字。

经受过模拟经营游戏《沙威玛传奇》洗脑的朋友,一定把那句没有一个字在调上的「让我们说中文」刻在脑海里了。

那咱们也可以复刻一个手抓饼大王的店面,不同以往的是,这次真的可以说中文,红色招牌上是工工整整的五个大字,而且 10 秒左右就搞定了。

豆包不偏科,中英搭配也可以,一个凸显手作感的咖啡店 logo,水灵灵地诞生了。

一两行字,或许还说明不了什么,接下来让我们加大难度,字要多,排版也要到位。

从《再见爱人 4》熏鸡事变获取灵感,我用提示词给豆包下达了几个需求。

提示词写得很长,但豆包听懂了,整体的完成度很高,文案也没有写错。

AI 生成具有不确定性,我反复生成了几次,还是最满意这张,虽然字体没有完全符合要求,熏鸡不够写实,小字乱码,但画风赏心悦目,熏鸡油光水滑。

俗话说,土到极致便是潮,老年人表情包就是其中一个例子,大致包含以下特点:醒目的文字、大吉大利的元素、blingbling 的特效。

习惯了抽象和阴阳怪气的我们,也可以学习这种有话直说的精神,比如,让豆包生成一个「相亲相爱一家人」。

猫咪、锦鲤、玫瑰、星星点点的闪光,围绕着渐变色填充的大字,有土味复古的怀旧感了,不多,大概 40% 吧。

豆包的文生图有一个很方便的设计——选择风格。不用写提示词,点击一下,我们就可以驾驭电影、卡通、胶片等风格。

将特殊的风格和精准生成的中文字一起用,会有事半功倍的效果。结合像素风格,我们可以让豆包画一个四格漫画。

我的提示词写得很简单,只是要求了每一格的文字和画面内容,豆包给的画面略有偏差,但文字完美,大家也可以参考这个形式,换个主题多试试。

可能有朋友会疑惑,为什么生成中文字是个很重要的需求,不能先把图片生成,再放在 P 图软件把文字打上去吗?

这么做当然也可以,但让 AI 直接生成图案和文字,风格实现无缝的适配,完全没有 P 图感,玩法还无穷无尽,何乐而不为?不过,消除乱码的小字,还是用得上 P 图软件。

哪里都用得上,人人都能设计海报和壁纸

除了整活,豆包当然也可以做些有用的设计。一键生成海报、壁纸、节日祝福,从此不是没有可能了。

什么叫有用?对于我来说,群聊的聊天背景就是一个刚需,提醒我不要在错误的地点讲不恰当的话。

那就让 AI 来设计一个,并要求把文字放在黄色的警示标志里,这份打工人打工魂,豆包也应该接收到了。

我怕过年的鞭炮太响,现在就想给你新年的祝福,祥云和元宝应有尽有。给亲朋好友的红包封面,以后不妨叫 AI 帮忙设计。

A 妹主演的、由百老汇音乐剧改编的《魔法坏女巫》正在北美热映,国内也已经定档,和热度不符的,是海报的简陋设计。

不如让豆包重做一次,我从原海报反推提示词,说明了画面的要素,接下来就交给豆包。

至少,豆包做了字体设计,更贴奇幻电影的主题和氛围,原海报反而像用 Word 和 PPT 花体字打出来的。

除了歌舞片,东方美学风格海报,豆包也可以拿捏,呈现大气磅礴的毛笔字。

写得好看是一方面,更重要的是豆包听提示词的指挥,文字是什么风格和颜色,把字放在什么位置,基本都能顺从我们的心意。如果一次没有,那就多生成几次。

用豆包设计小红书封面,图片上下的字体和颜色可以不同,全看我们自己想要什么效果。

豆包也能做逼真的产品图,文字根据包装的角度倾斜,像是印刷在包装上。

设计 B 站长视频的封面,当然也难不倒豆包,既专业又有亲和力。

所以,技术是到位了,最重要的还是我们自己的脑洞够不够大,审美够不够好。

设计工作还无法被 AI 替代,但我们每个人最好都要有些设计思维,AI 才能更好地呈现我们的所思所想。

用 AI 产品解决问题,就选接地气又全面的

国内率先把生成中文字的功能做进产品的,是字节的豆包,可以说,毫不意外。

豆包,是国内大模型产品中,真正既接地气又全面的,每次推出一个新功能,都让人觉得,这正是我需要的。

AI 写作、AI 搜索、文档和网页总结,这种大模型标配的功能,豆包当然具备了。

▲用豆包生成一个类似文字冒险游戏的对话界面

AI 智能体,豆包给了用户海量的选择,既能像 GPTs 那样满足各种垂直功能,又能类似 AI 陪伴软件陪你聊天。

拍照搜题、语音通话、图片生成、音乐生成、视频生成,各色各样的多模态功能,豆包都有。

▲用豆包生成一个小红书流行的动物表情包

我们对于 AI 的所有核心需求,豆包基本都涉及,同时,豆包的渠道也广阔,实现了移动端和网页端的全覆盖,不管是工作还是娱乐,我们都可以随时和豆包聊聊。

值得一提的是,本周豆包 PC 版将内测视频生成功能。根据我们之前的测评,豆包的视频生成模型,相较于 Luma、Runway 等国外产品,更懂中文和中文用户,更适配中文互联网中的创作工作流。

▲用豆包生成一个古早游戏装备栏界面,恭喜你拾取「豆包」一个。细节不完美,但有内味了

这句话放在图片生成上也是一样,Ideogram、Recraft 可以生成英文字固然好,但豆包率先把生成中文字的难题解决了,才真正解决了国内用户的痛点。

不像伪文青们爱说的「你好特别,你给我一种疏离感」,「豆包」从名字到 logo 都让人觉得格外亲切,然后这种温度也被带入了产品的设计里,豆包的功能都非常容易上手,主打一个新手友好,不白来,来了都能用。

中文是一门博大精深且对 AI 精准生成具有一定挑战性的语言,这世界这么多人,每个人都可以用 AI 设计一点什么,无论用什么设备,说什么语言。AI 产品都该往这个方向进化,而先为中文用户交出答卷的,是豆包。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


上手华为Mate 70 系列,我们发现了「原生鸿蒙」10 个关键细节

By: 艾 梵
29 November 2024 at 13:50

11 月 26 日,华为正式发布 Mate 70 系列和「强得飞起」的 Mate X6,发布会上一连用了几个「最」来形容:最精致强悍、最可靠、最出彩和最智慧。

但真正的撒手锏甚至无需冠词——华为宣布,两款新品到手即可升级至原生鸿蒙系统,而内置 HarmonyOS NEXT 的「先锋版」,更是第一批「原生鸿蒙」出厂设备。

之前爱范儿也曾做过 Mate 60 Pro 运行原生鸿蒙系统的体验,当时系统的流畅度和完成度给我们留下了深刻的印象。

这一次,我们手上这台出厂即搭载原生鸿蒙系统的华为Mate 70 Pro+,在体验上又有哪些升级?我们第一时间做了评测体验,这里是关于原生鸿蒙手机的 10 个细节,以及隐藏其后的秘密武器。

看得见的两个关键:更跟手,更及时

从点亮手机屏幕的那一刻起,这台华为Mate 70 Pro+ 就在用细腻丝滑的动效在不断提醒我,这是一部软硬件高度耦合的智能手机。

滑、点、拖、甩,每个日常操作,都极其流畅,而这些操作的细节,就决定了一个系统的观感卖相。

操作跟手,用起来才顺心。这也是为什么,华为在历代操作系统演进上,都会花费大工夫来优化每一帧的动效体验,而名为「HarmonyOS NEXT」的原生鸿蒙,在这方面踏入了「NEXT」的境界。

初次上手,你就可以感受到原生鸿蒙流畅蓬勃的生命力。得益于精细的动效,从屏幕顶部边缘轻轻向下滑动,通知栏与控制中心就灵动涌现。

另一个不易察觉的细节,是手机交互的响应更及时了。

每次回到桌面上下切换待办卡片,手指接触屏幕瞬间,卡片外围出现几乎无法觉察的膨胀特效动画,来为这一次点击增加实感,随后卡片跟随着手指滑动。你快,它也快;你慢,它也慢。

这一套「动效引力体系」,将现实世界的光影、材质和引力映射到数字世界之中,并在 150—350 毫秒的短暂时间内快速呈现,其结果自然是流畅、跟手,而秩序井然。

软硬件融合调度,不仅有效提升了流畅度,也节省了更多的系统资源。华为表示,升级系统后,手机流畅度能提升 30%,与此同时,还能节省 1.2GB 的运行内存,让续航延长近一个小时。

在鸿蒙系统的逻辑中,需要动起来的不仅仅是系统构件,更是信息。前者是「形」,而后者才是「神」。

每个人的手机,都是一个私人信息富矿,有些连机主都无从知晓的细节,却都深埋在一个个 app 之中。我们如何把这些信息挖出来,为我们自己所用?

原生鸿蒙的办法是,让这些有效信息以「实况窗」的形式,直接来到你面前。

原生鸿蒙的「实况窗」,支持数十款高频应用,并且类型还在不断拓展中。像外卖、打车的进度,航班、列车的准点情况,实时运动的配速,地图行程的导航,演出的倒计时等等……

许多你忽略的细节,实况窗都会整理成信息卡片放到你面前。无论是处于锁屏还是桌面,都能一目了然。

调用手机的五官,为 AI 所用

真正在乎软件体验的人,都应该自己造硬件,反之亦然。

移动互联网时代,手机上的一个软件能够影响数十亿人,但这些软件应用却被分散在桌面上的一个个图标当中,其规整的排布方式,有时会让我想起唐代长安城的坊市制。看上去一片欣欣向荣,但实际上每个坊之间都有坊墙相隔,手机上绝大部分 app 的信息实际上都被区隔开来,形成了一个个「信息孤岛」。

在 app 之间传递信息,往往只能依靠剪贴板。这个基于文本的过时产品,在当代丰富的信息形式面前早已显得不堪重负。

有没有什么办法能打破区隔,让信息自由流转起来?

原生鸿蒙为我们展示了一个新的可能:用 AI 来驱动硬件。

你一定也曾和我一样,在便利店排队时看着前面的朋友,对着手机屏幕翻了个底朝天,就为了找到支付宝扫一个随机立减红包,这种时刻我总会问自己:「我是不配拥有这个三明治吗?」

好的设计就应该多走一步,主动呈上更好的解决方案,哪怕人们对日常生活中的麻烦习焉不察。

原生鸿蒙的「智感扫码」便是如此:手机对准二维码,直接出扫码提示,无需打开相机,就能瞬间完成扫码,用起来很爽!

这套操作的背后,是小艺 AI 在运筹帷幄。

原生鸿蒙嵌入的系统级小艺 AI 大模型,是手机 AI 存在感最强的一次。小艺不仅随叫随到,更能调用手机的「五官」,充分挖掘设备的交互潜力。

一句「小艺小艺」,随时随地都能唤出小艺智能体进行询问,而小艺通过调用手机的相机和屏幕,更能见我所见,无论是识别花草、翻译菜单、旅游导览,都能信手拈来。

小艺对手机触控的识别,也不止于指尖,指关节是另一层级的交互。

早在 2015 年,华为Mate S 上就加入了指关节截图功能,本以为这是一个玩票性质的噱头,没想到华为却深耕了近十年,在老用户中有口皆碑。

而在 AI 系统的加持下,指关节也被指派了新任务——用指关节圈选屏幕,即可唤醒小艺对指关节圈选处进行抠图、问答、购物、扫描等操作——这就是内嵌多模态大模型带来的好处,小艺 AI 会自动识别圈选内容,并提供最恰当的处理方式,无需额外硬件加持,而是充分挖掘潜能,把交互做透做深,这也是原生鸿蒙一以贯之的设计理念。

到这里,你应该也发现了,小艺成为了一个常驻系统前台的隐形助理——

选中信息向上拖,可以放进中转站,无论是截图、文本还是照片,都能收纳其中,需要的时候随时取用:

而向下拖,则是将信息交由小艺吸收整理,会自动帮我提取图片、PDF 或者表格中的关键信息,诸如图片转表格等功能,用起来相当舒心。

原生鸿蒙用一套有条不紊的交互方式,让 AI 能够充分调度手机的方方面面。至此,小艺 AI 已经成为整个系统的纵贯线。

只用一步,跨越两个世界

如果说「向内」的信息流转意在打破手机内部的藩篱,那么「向外」的信息互联则有着更宏大的目标:在设备与设备之间、设备与物理世界之间架设沟通的渠道。

碰,是人与人交流时最自然的动作隐喻——碰头、碰面、碰杯,连打麻将都要碰一下。将这种直觉概念延伸到手机交互上,就衍生出了原生鸿蒙的「碰一碰」功能。

「碰一碰」就像是蚂蚁用触角交换信息,两台手机顶部轻轻触碰,即可分享图片、视频、WiFi 乃至是你喜欢的博主主页。

人是在物理世界中演化出来的动物,对物理形式的互动自然最为敏感。

现实触碰的细微力反馈,所能带来的连接感超越了任何网络分享方式。线下见面时,一次自然而然的对碰,就能唤醒深层次的情感共鸣。

跨设备的信息传递,从来都是终端硬件的工程师们最头疼的问题。

以前的跨设备传输,就像「老式船闸」——要一级级地加水让船只越过大坝,再一级级地放水让船只回归河道——确实能用,但极其难用。

我们尝试过发链接、传网盘、用微信的文件传输助手、同步同一账号的浏览记录——所有这些操作,实际上都是单方面的,是以单个设备为主的「跨设备传输」。

但原生鸿蒙把这些复杂操作,都简化成为了一个动作,那就是「点一点」——在手机、平板、电脑、电视、甚至汽车中控台上点一下,就能继续听歌、看剧、导航,操作不间断,体验就更流畅:

而比跨设备互联更高级的,或许是放弃「设备」这个概念。在原生鸿蒙里,我们已经可以看到些端倪——

在部分原生鸿蒙应用上,我们可以将不同的设备视为一个整体,而不同设备只是访问这个整体的不同入口。

我用手机拍的照片,现在可以直接插入到电脑的 PPT 上:

更妙的是,用手抓起手机上的图片,随即就能扔到平板电脑的屏幕上:

当多个终端间的信息流转,已经能够通过直觉操作趋于无感时,「互联」就不是一件需要强调的事情,数字世界的所有都能信手拈来,一切都是那么自然而然。

AI 和安全,原生鸿蒙打破高墙的秘密武器

移动互联网时代发展了十多年,创造了万亿美元的神话,也筑起了两堵高墙——应用和应用之间的高墙,以及设备和设备之间的高墙。

十多年前,马可·安德森说软件吞噬世界,而往后是 AI 吞噬软件的时代,而这个趋势发生的前提,就是设备和应用之间的信息,能够打破围墙相互流转。

要让信息流转方便无虞,信息安全是最关键的部分。

当下的智能设备早已超出了「工具」范畴,甚至成为了「自我」的一部分。从某种意义上讲,手机堪称最完整的个人数据库,守护其中信息的重要性不言而喻。

「守护」是一个动词,但在我看来,「守」和「护」其实更接近一种被动状态。守护得好,应当是难以觉察的。

尽管信息在系统内部奔涌流转,但原生鸿蒙为隐私划出的明确禁区却不容染指。宏观层面,九类重要权限禁止开放;微观层面,则从「管权限」进一步细化到「管数据」,应用所能访问的,只有「缓冲区」内你所允许的数据。

这是个从零到一的系统工程,而原生鸿蒙正是为此而生。

AI 和安全,正是原生鸿蒙打破高墙的秘密武器。以 AI 为核心调度一切,以安全为底座守护一切,覆盖数亿用户生态,让信息的流转,能够真正脱离软件或硬件的桎梏。

这是原生鸿蒙在做的,也是我们所期待的。

自年初向开发者开放以来,原生鸿蒙生态就持续在以最高速进行冲刺,华为也是不留余力地进行推广,无论是开发者层面数以亿计的生态补贴,还是消费者层面人人可享的 900 元先锋权益,都是实打实的真金白银投入——因为只有生态立住了,一个操作系统才能真正地立住。

短短十个月时间,原生鸿蒙生态从最初的 1500 个常用应用到如今冲击 10 万个应用的目标,AI 时代的操作系统正如 AI 大模型一样日新月异。

明年,华为全线手机和平板电脑也都将搭载原生鸿蒙系统,这无疑是原生鸿蒙向前跨越的重要一步。

爱范儿曾经将鸿蒙系统比作数字时代的活字印刷术,正是因为其灵巧和可塑性。

而如今看来,原生鸿蒙系统正在走一条属于数字时代的丝绸之路,这注定是一场闯入无人区的修行,而其将连接的,也不止是一套设备或一个品牌,而是更加广袤的数字世界。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为 Mate 70 Pro 的第四颗镜头,最强的能力不是拍照

By: 苏伟鸿
28 November 2024 at 21:10

爱范儿关注「明日产品」,硬哲学栏目试图剥离技术和参数的外衣,探求产品设计中人性的本源。

主摄、长焦、超广角,堪称手机摄影的「三大金刚」,基本上能应对大部分用户的日常拍摄场景,一些影像旗舰手机,还会在这基础上多配备一个长焦镜头,满足更极致的创作需要。

最新发布的华为 Mate 70 Pro 和 Pro+,也有四个摄像头,只是多出的一个有点特别:华为称其为「红枫原色摄像头」,本质其实是一个微型多光谱仪。

多光谱成像仪主要应用于水土农业、食品检测等更专业的场景,智能手机运用不仅可以说不多见,像华为这颗这么高参数的镜头,几乎可以说没有。

但在不遥远的未来,类似的多光谱传感器模组,会来到我们身边的更多智能设备上。

解决拍照「色弱」问题

虽然智能手机厂商卷影像能力已经有不少的年头,手机上的摄像头模组越来越大,越来越凸,但始终有一块难啃的骨头尚需解决——色彩还原。

目前传统的手机相机传感器通常通过捕捉红色、绿色、蓝色(RGB),来呈现一定范围内的颜色,每个像素只有红、绿或蓝一个色彩信息,需要通过算法,结合周围像素的色彩关系,推算出每个像素点的真实颜色,最终尽可能还原出我们肉眼所见的景象。

▲ 单个像素只负责单个颜色的信息记录

但用红色、绿色、蓝色组成的颜色,仅为人眼可见色彩的 75%,成片的颜色损失比较大。

并且,既然是靠算法「推算」,准确性自然无法完全保证;而在比较复杂的色彩和光线的环境下,算法的准确性会进一步降低,这也是为什么有时拍出来人的肌肤会发黄、发红。

要想解决偏色的问题,厂商尝试从软件和硬件两个方向入手。

靠计算摄影发家的 Google Pixel,就推出了名为「Real Tone」的色彩算法,在照片后台处理时,还原不同人种的真实肤色。

也有很多厂商也尝试转换赛道,不追求完美的色彩还原,而采用风格化的思路,让照片呈现更好的视觉观感,而不是百分百的还原。

而华为从 P20 手机开始搭载 5 通道色温传感器,陆续升级到 P50 系列的 10 通道多光谱色温传感器,能够捕捉普通 RGB 之外的波段,包括可见光之外的一些波段。

然后通过 XD Fusion Pro 的算法,将可见光和非可见光融合,呈现更多色彩细节。

通过多通道多光谱传感器来尝试纠正相机的「色弱」,其实也是行业内的一个主流方案,像是 vivo、OPPO 都尝试过在旗舰上配备类似的多光谱色温模组。

简单来说,这类传感器能够捕捉更多特定波段的色彩,但只能对整体的环境光做一个总体感知和判断,无法提供局部光源和色彩信息,也不具备成像能力。

而 150 万像素的红枫原色摄像头模组,本质上是 150 个独立的多光谱仪,对色彩的敏锐度更高,并且具备了成像的能力,也就是能够同时获取二维图像和色谱信息,记录能力也远远超出了 RGB 三色。

▲ Spectricity 也生产类似的多光谱摄像头

用人话来说,就是华为 Mate 70 Pro 的主摄、长焦、超广角正常拍摄高清照片,而原色摄像头专门记录照片中的每块区域的色彩细节,然后处理器按照这些精准的色彩信息给照片润色。

但这颗参数不低的多光谱摄像头的上限,远远不止于此。

手机的 「火眼金睛」

不同物质对不同的光吸收、反射情况不同,会呈现不一样的光谱。

简单来说就是不同的物质会呈现不一样的「颜色」,有些是肉眼可见,有些则需要通过多光谱摄像头捕捉。

而通过这些光谱,我们就能推断出物质目前的性质和状态,因此多光谱仪的身影经常出现在在环境监测、农林牧业、医学诊断、化学分析、刑事侦查等专业领域。

相关业界人士告知爱范儿,行业内光谱模块像素最高能做到 200 万,而华为 Mate 70 系列上的多光谱摄像头达到了 150 万像素。

这样的素质或许还不能运用于上述的专业领域中,但如果华为愿意开放第三方接口,还能让这台面向消费者推出的 Mate 70,创造更多可能性。

比如从菜市场买回来的农产品,我们可以就可以使用手机上的多光谱仪进行扫描,肉眼无法直接看出的农药残留,也会因为不一样的光谱特征,被多光谱摄像头发现。同理,也能用于检测纸巾荧光剂。

▲通过高光谱相机辨别发霉的李子和异物,图源:advian

像是皮肤的状态,也能通过多光谱仪拍摄,提前发现皮肤干燥、明暗、暗沉、色斑等问题,以便进行皮肤管理。

而由于血液呈现的近红外、中红外光谱,理论上也能被光谱仪识别,因此有可能通过华为 Mate 70 系列进行一个「自拍」,对身体的血糖、血氧等指标进行一个粗略的监测。

总之,这个多光谱摄像头,真的就像孙悟空的「火眼金睛」,仅仅通过「看」,就能让物体「现原形」。

对于 AI 来说,这绝对是梦寐以求的能力。

目前的 AI 助手和外部世界的交互方式,主要通过摄像头拍摄图像后进行分析,但一张平面图的信息有限,AI 也很难进行更多延伸解读。

▲ iPhone 16「视觉智能」

而如果多模态 AI 能够调用多光谱摄像头,就能极大丰富其能获取的外部信息。比如「看」一眼冰箱,AI 就能根据光谱特征分析出食材新鲜度,给出更恰当、详细的晚餐食谱建议。

跳出手机,来到智能家居上的光谱摄像头,也有着广阔的发挥空间。想象一下,一个能智能判断食材状态的烤箱,不需要用户手动设定温度和时间,自己可以决定出最优的烹饪方式。

用手机拍小狗来进行智能识别会被吐槽,但如果是能拍小狗进行一个皮肤病速检,那就是真的改变生活。

更多设备正在路上

这么好用的多光谱仪,为什么直到今天,才来到我们的手机上?

传统的多光谱仪器体积和重量,其实远远没有能压缩到手机相机模组的地步。多光谱仪中用于分光的核心器件——光栅体积难以缩小,还需要一定的传道范围,为了更大的光谱范围,有时还需要在仪器内放入复数个光栅。

▲ 一个光谱仪的原理图,中间的就是光栅

国内光学企业求是光谱公司就摸索用算法的方式,替代了物理分光元件,使得光谱仪得以顺利缩小。

▲ 求是光谱的多光谱相机

另一个阻碍多光谱摄像头进入智能手机的因素是算力:当按下手机拍摄快门,处理器需要利用详细的光谱信息完成对照片的处理,如果性能跟不上,就会使得手机出片时间变得很长,严重影响拍摄体验。

在集成了 CPU、GPU、NPU(AI 处理器)的手机处理器性能不断实现突破后,这个问题也迎刃而解。

2022 年,华为哈勃入股求是光谱公司,2 年后的今天,首部搭载 150 万像素的多光谱仪的智能手机华为 Mate 70 系列诞生。

但华为这次不会领先太久,实际上,海外也已经在探索类似的道路,将多光谱芯片引入移动设备。

一家名为 Spectricity 的比利时企业,于 2023 年推出了专门为智能手机打造的多光谱传感器 S1,原理和效果与红枫原色摄像头类似,也能提升手机摄像头成片的色彩准确度。

▲ Spectricity 的多光谱相机模组

今年,Spectricity 宣布与高通公司合作,目标是为高通骁龙平台开发出优秀的光谱图像传感器产品。

目前暂时还没有搭载 S1 的消费者手机产品面世,但 Spectricity 方面表示,已经和几家手机厂商达成合作,其中有来自中国的品牌,相关的产品即将发布。

也许明年,这颗现在对大众而言还有点陌生的传感器,就会在各家旗舰手机发布会上频频刷脸,成为又一个新颖的卖点。

而对于消费者而言,这颗摄像头不仅意味着我们能拍出色彩更准的照片,还蕴含了革新人机交互的新可能。

 

参考文章:
《光谱相机,史上最出彩华为Mate的一颗“慧眼”》
《光谱成像,迈入手机 AI 影像的新纪元》

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Marshall Monitor III 体验:带降噪的 70 小时超续航,Marshall 玩起了摇滚马拉松

By: 梁梦麟
28 November 2024 at 16:04

时隔四年,Marshall 总算推出了自家新一代旗舰级头戴式无线降噪耳机 Marshall Monitor III。

这一代改了接口,提升了佩戴的舒适度,增加了 SOUNDSTAGE 声场音效和之后会支持的低功耗蓝牙音频,还有那依旧强得可怕的续航表现。

Marshall Monitor III 延续了自家方形小纸盒的设计,包装会比其他旗舰级头戴式要小很多。

配件方面,Marshall Monitor III 附带了充电用的 USB-C 充电线、收纳盒和一些纸质文件,以及一条 USB-C to 3.5mm 公口的转接线。

耳机本身的设计没有大变化,Monitor III 延续了 Monitor 系列鹅蛋形全包裹耳罩设计,耳罩外侧增加了 Marshall 音频产品标志性的荔枝皮纹理和金色手写体 Logo,右边耳机下侧也有 Marshall 经典的金色旋钮。

这一代换上了和 Major V 材质相近的耳罩,松软度比 Monitor II 高不少,佩戴时的压耳感降低。

我这种头围较大的用户,日常戴着眼镜和耳机一起使用,Marshall Monitor III 也要比 Monitor II 舒服,舒适程度是在 2024 年推出的无线头戴旗舰里的第一梯队。

接口方面,Monitor III 取消了 3.5mm 接口,只剩下 USB-C 口,充电和切换成有线模式都需要用这个接口。

Marshall 在这里的做法比较特别,Monitor III 不是直接支持 USB 音频而是直接用 USB-C to 3.5mm 线来连接 3.5mm 的设备,不支持 USB Audio,想在电脑上用有线模式边充边播的话可以打消这个念头了。

不过,Monitor III 并不需要担心续航。它和 Major V 一样,Marshall 都把续航给点满了。

耳机在开启降噪的状态下能够播放 70 小时,这续航时长比大部分头戴式降噪旗舰关闭降噪播放的时长还要长 10-20 小时。如果关闭降噪使用,Monitor III 的续航能来到 100 小时。戴着它骑行,这续航相信能在不充电的情况下从广州南骑车到汕头。

就算不那么极限,日常在市区内通勤,实现一周不充电问题也不大。之后还会支持低功耗的 LE Audio,耳机长续航表现这方面还是挺可观的。

Marshall 同样提供了快充模式,15 分钟充的电能够播放 12 小时,完整充满需要 2.5 小时,算是中规中矩的充电表现。要是能提供一个充电时间更短的快充模式,日常碎片化充电体验会更好。

主要是,Monitor III 的续航时间真的太长了,大部分用户并不会直接用到没电才充电,而是充电时间间隔太长没有了充电的意识,想拿起来用的时候才发现没电,这个时候更高效的短时间快充就显得更加实用。

配置方面,Marshall Monitor III 搭载蓝牙 5.3 的无线模块,支持多设备连接以及最远 10m 左右的连接范围。耳机上内置了佩戴传感器,摘下耳机就能够暂停播放器。

蓝牙 5.3 能够保证基础稳定性,只要不是遇上干扰特别大的场景或天线设计古早的设备,日常固定使用基本不会出现不稳定情况。延迟控制还不错,我连着它玩《宝可梦大集结》 和《明日方舟》等卡牌游戏时没有明显延迟,日常看看视频和玩游戏都能应付。

降噪的话,Monitor III 的降噪表现和上一代相似,能够让你感受周边环境变安静了,键盘敲击声和其他规律的噪音都会有明显的削弱效果,应付办公室和有背景音乐、相对安静的咖啡店也够用。

降噪带来的压力不强,100% 降噪不会出现迅速安静的突兀,开启比二代要顺滑不少,压力也没有主打强降噪的产品那么突出,佩戴时间也可以更长一些。

功能更新方面,Marshall 在这一代新增 SOUNDSTAGE 声场音频技术,开启后能够增强耳机的声场表现,实现拓宽声场的效果。

耳机搭载的 32mm、35Ω 阻抗、灵敏度为 117DB SPL 的动圈单元,比 Monitor II 用的 40mm 的单元小一点,灵敏度高一点。

声音风格和上一代相似,Monitor III 听起来会比有一点低频优先倾向的 Major V 更加清晰干爽,还多了一点乐队的味道。

低频有冲劲,鼓点敲到底的时候可以做到相对顺滑的回弹。声音表现更高速、乐器音效突出,细节的颗粒感更加明显,给人一种珍珠奶茶里的珍珠变大了的感觉。

人声和背景之间有足够的距离,人声轮廓的刻画、歌手吐息和演唱动作的刻画会比 Major 系列锐利不少,配合干爽的声音主调,比较符合「Monitor」系列的感觉。

但有些时候会因为锐化而显得有些干涩,加上声音在 AAC 和 SBC 传输限制下,会出现一种「细节不多但锐化提得比较高」的违和感。

打开 SOUNDSTAGE 声场音频后,Monitor III 的声音空间会变宽。原本集中在一起的乐队能安置到更大的舞台上,每个人占据一角,相互干扰更少,原有声音也不会有「捏紧了」的感觉。

乐器的尾音延伸空间更大,听起来更松动、更从容。

总的来说,Marshall Monitor III 是延续 Marshall Monitor 系列的一款常规升级款。

声音延续了 Marshall 的乐队味道,声音比 Major 更精准更通透,更具品牌自主的特色,更对 Marshall 粉丝的口味。

体验也做了些跟上时代的实用升级,头梁和耳棉松软度提升,佩戴不夹头更舒服,收纳可以做得更小巧。连接性能换了新芯片之后比上一代更稳定,续航更是获得了旗舰级的加强。就算用不上 100 小时的无降噪模式,70 小时带降噪的模式也能够满足绝大部分都市人的需求了,长时间出差或户外体验都不成问题。

但作为新一代的旗舰,只保留 USB-C 口但不支持 USB Audio 的设计,以及没有高规格传输编码的配置会让 Monitor III 差了那么一点点意思。

但面对大部分专注 Marshall 的用户来说,Marshall 标志性的设计和极具自身风格的声音表现才是它的基础,这两点不足相信还是可以忽略掉。

如果之前没有更新到 Monitor II,或者是垂涎 Major V 的续航和耳棉松软度但又不想放弃主动降噪的用户,那 Marshall Monitor III 还是值得推荐的。

「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AI 视频巨头重磅更新!提示词都不用费劲写了,从未有过这样的视频创作方式

By: 张成晨
28 November 2024 at 14:07

AI 视频,还能往哪个方向卷?Luma AI 的答案有些与众不同。对手还在练一招一式,它却像风清扬传授独孤九剑,讲究灵活变通,如行云流水,任意所之。

Luma AI 或许不如可灵、Runway 知名,但论实力也在第一梯队,它的视频模型叫作 Dream Machine,今年 6 月发布,最近进行了重磅升级,是推出产品以来声势最大的一次。

其中包括两项更新,一是发布自己的图像模型 Luma Photon,将文字、图像、视频一锅端;二是打造了生成 AI 视频的全新工作流,我们可以像和 ChatGPT 聊天一样,让 AI 生成视频,不用对提示词字斟句酌。

对于生成视频这件事,Dream Machine 首创了一种很新的方式。

指路👉https://dream-machine.lumalabs.ai/

聊着聊着,就把视频给生成了

打开 Dream Machine,我们先看到的是「Board」,可以将它理解为无限的创意画布,在这里,我们使用自然语言,自由地生成图像或者视频。

开始一块 Board,我的提示词写得非常简单:「创建一个日式悬疑少年漫画的角色。」

AI 扩写了我的提示词,一次生成了 4 张图片,但是不行,年代不对。

没关系,再在对话框输入一句,「放在现代背景」。

AI 表示懂了,又生成了 4 张图片,右上这张孤身走暗巷,已经接近我想要的感觉了,但仍然不够,我想要他抬起头,露出五官。

不难,继续微调,忘掉复杂的提示词,和 AI 打直球就可以。

右下这张不错,虽然形象幼态了点。接下来,我想让 AI 生成一个视频,主角在同一条巷子里从白天走到黑夜。

Dream Machine 生成视频的首尾帧功能,就是为这种需求准备的——我们挑好头尾的两张图片,让 AI 补足中间的过程。

那么,我们只需基于满意的图片,让 AI 生成几张白天场景的,沟通方式还是一样的简单粗暴。最终选定的两张图片,细节略有落差,但同框也不违和。

万事俱备,只等生成视频,AI 过渡得还算自然。

看到这里,你应该明白 Dream Machine 和其他视频工具的区别了。

其他视频工具,通常是给你一个填入提示词的文本框,然后让你设置运镜、时长等参数。设置一次,生成一次。

但 Dream Machine 的界面,看起来非常像和聊天机器人交互,底部是输入框,文生图、图生图、图生视频、文生视频,都可以在这里进行。

专业创作者可以继续写传统的提示词,但我们也拥有了「讲人话」的权利,压力给到 AI,Dream Machine 能够理解上下文,帮我们完善提示词,我们可以从一个非常粗糙的想法开始,和它边聊边改边优化。

又因为 Dream Machine 是无限画布形式的,我们可能在一个环节反复生成,素材都会保留下来,不会互相覆盖。

我们的思维,不会局限在一段提示词、一个视频,而是像水一样流淌,更多的想法,可能就在这个过程里产生了。

更可控的图片,更可控的视频

Dream Machine 的全新工作流就像大树的主干,其中一些好玩且实用的功能则像枝桠,相得益彰,才能枝繁叶茂。

起到关键作用的,就是 Dream Machine 最新发布的图像模型 Luma Photon。

图片怎么生成得更符合我们的审美?Dream Machine 支持风格参考和角色参考功能。

先说风格参考,我们可以导入自己的图片,AI 会将风格融入到创作中。官方给出了一个例子:按蒙德里安风格,生成小鸟版的《戴珍珠耳环的少女》。

按这个思路实操一下,基于男性侦探的形象,参考梵高《星月夜》的风格,生成女性侦探。

二次元遇上后印象派,化学反应很奇妙。

角色参考功能,则可以通过一张图片,就实现角色的一致性,让这个角色出现在更多的图片和视频里。

马斯克是行走的素材库,这样的例子太没挑战性了,我决定让甄嬛瞬移到哈利波特的世界,看场景变了之后,她还能不能气场两米八。

结果有些不好评价,看得出来是甄嬛的面容,但娘娘的长相入乡随俗,五官尤其眼睛,变得更像欧美人了。

其实,不另外找图片参考,Dream Machine 也可以让图片、视频不泯然于众人,这时候就要用到「头脑风暴」功能,它会根据你生成的图片,推荐一些艺术家的风格。

就像甄嬛进霍格沃茨这张,我们可以用吉卜力工作室风格二创。

不仅如此,提示词里的一些关键词,被框选了起来,能用下拉的选项替换,Dream Machine 称之为「概念药丸」,我们不用自己手写提示词,一键更换艺术风格,或者画面元素。

把「吉卜力」换成「新海诚」,把「独角兽」换成「龙」,不过点击几下的功夫。

Luma Photon 模型,基于 Luma 的通用 Transformer 架构构建。通过开发自己的图像模型,Luma AI 可以减少对 Midjourney 等外部图像模型的依赖,同时也能解决文生视频不稳定的问题。

当然,视频是老本行,镜头运动这种可控性功能,Dream Machine 也少不了。

紫禁城的甄嬛,和霍格沃茨的甄嬛,能不能实现丝滑的转场呢?用推拉镜头,画面有动感,人物没有严重的变形,可以打个 80 分。

视觉的思维,讲故事的方式

巧的是,前两天 Runway 也官宣了自己的图像生成模型 Frame,和 Luma 更新是同一个晚上,看演示就知道非常注重审美,目前正逐步向 Gen-3 Alpha 开放资格。

▲ Runway Frame

图片的生成质量、美学高度,以及视觉风格的一致性和可控性,越来越被视觉模型重视了。

这对创作者来说是好事,当我们用 AI 进行平面设计、角色设定时,其实就是在生成一个独特的世界,讲一个独特的故事。

Runway 的 CEO Cristóbal Valenzuela 认为,Runway 不是一家 AI 公司,而是一家媒体和娱乐公司,AI 公司的时代已经结束了。

他不是在唱衰 AI,恰恰相反,他认为 AI 是一种基础设施,真正的革命不在于技术本身,而在于它所实现的东西:新的表达形式、讲述故事的新方式、连接人类体验的新方法。这和 Luma 的进化方向不谋而合。

这次更新之后,Luma AI 首席执行官兼联合创始人 Amit Jain,给 Dream Machine 下了一个很有趣的定义——视觉思维合作伙伴。

概念有些抽象,他的意思其实就是,让生成图片、视频这样的视觉创作,像聊天一样简单、直观。

交互的方式,影响着我们思考的方式。画布式的工作流,能将脑洞可视化,记录所有的创作过程和结果,呈现生成视频的完整思路。

无限画布通常在图像模型较为常见,比如 Recraft 和 Ideogram 的 Canvas。Dream Machine 的画布更加规整,相同提示词生成的素材和变体横向排列,不同的则竖向排列。

边聊边生成边优化的过程,会让人觉得,一个独立的小世界仿佛在画布里诞生。

先让 Dream Machine 用超写实电影 CG 风格,创造一个工业废土背景游戏的主角。

然后用环绕镜头,让主角动起来,并塑造环境的空间感。

接着,我们可以再和 AI 聊,让 AI 继续生成废土世界观里室内室外的各种场景,让 AI 建议我们怎么塑造得更有末日气息。

某种程度上,这个画布,就是我们个人故事的设定集。

当然,Luma AI 的 bug 也很多,包括但不限于,用一张图片实现角色一致性,效果并不理想;积分如流水,图片和视频还是要反复抽卡;图片模型可以生成准确的英文,但中文不行……

但意思传达到位了——少谈参数,以交互为出发点,构建一个 AI 创作工具。

更好的视频模型,不只是有更快的生成速度、更可控的镜头运动、更独特的美学,它应该也提供更好的讲故事的方式,让文字、图像、视频都作为表达想法的工具。

Dream Machine,造梦机器。

只管去创作吧,如同 Luma AI 的这句话:「不需要写复杂的提示词,问就好了。」未来 AI 留给我们的问题,不再关于技术,而是关于我们用它构建什么。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


REDMI K80 Pro 体验:又一台 6000 mAh 破百快充的旗舰,性能更强更专注

By: 梁梦麟
27 November 2024 at 21:27

11 月 27 日,刚刚换上新 Logo 的 REDMI 推出了新一代旗舰产品 RED K80 系列。系列有三款产品,分别是 K80、K80 Pro 以及和兰博基尼联名的 K80 Pro 冠军版。

这次更新的 K80 Pro,一如既往地用上高通骁龙最新的旗舰级芯片和现在规格最顶的电池快充组合,机身获得了全新的设计,并加强了耐用性,整体变成一款非常平白直接的进阶性能旗舰。

性能依然强

看 K 系列,肯定要从性能开始说起。

K80 Pro 搭载了高通最新的骁龙 8 至尊版移动平台,配有 D1 独显芯片,K80 就从上一代的骁龙 8 Gen2 升级到 8 Gen3。

常温状态下,开启了性能模式的 REDMI K80 Pro 安兔兔跑分为 2806847 分,控温状态下目前最高能达到2981860 分,是骁龙 8 至尊版的标准成绩。

K80 Pro 支持狂暴引擎 4.0,加上自带的 D1 独显芯片,能够提供「超级 HDR」、「AI 抗锯齿」、「AI 画质调控」 等功能,也可以实现逐帧调整 GPU 频率效果的「GPU 帧内调频技术」 和能在控制功耗和提升画质之间平衡的渲染加速引擎功能。

官方在发布会上表示,这些功能整合起来最直观的作用,就是能在 2K 120fps 同时开启的状态下,手机能够稳帧运行一小时的《和平精英》和《原神》。

提升画质表现和超帧的选项都集成在游戏助手里面,在这里开启游戏助手的性能模式之后就在内置选项中开启设置。打开增强之后,可以明显看到原本已打开最高画质的原神,角色细节变清晰,边缘更加锐利,画面整体变得通透。

系统里面还提供了其他图像设置的模式,可以根据不同需求切换,有点类似显示器对应不同场景做的预设。

更新后的游戏助手界面变丰富了,模式开关和各项设置排列得更紧凑,页面的信息量也变丰富了。

只不过,正是排列得太近的关系,想在游戏里面快速调动功能(像是游戏助手里面的截图)还要熟悉一下按键布局,游戏紧张起来时还不那么好操作。如果可以自定义页面显示的功能,或者主次功能再明显一点的话,用起来会更舒服。

手机的游戏超控手感还不错,玩《绝区零》操作跟手不卡顿,连招到角色切换的体验很流畅。游戏助手开启狂暴模式,以及画质和帧数都尽可能高的模式下,跑完地图后拖动切换视角都不会有明显卡顿。

可能会在进入战斗前,或者是怪物生成时稍稍卡一下,不会影响操作和体验。

另外,K80 Pro 的散热表现也不错。手机升级到 5400mm² 双环路 3D 凹凸台冰封循环冷泵的设计,可以直接接触 SoC,并且有助于整体散热表现提升,避免 SoC 位置和屏幕侧边积热。

手机在《绝区零》 30fps 的默认高画质模式下,发热不是特别明显。切换到 60fps 之后会有点微温,但还不至于特别烫。日常手机带着保护壳玩游戏的话,问题不大。

但如果玩的是最高画质的《原神》,手机在接近半个小时的游戏里面会上升到 40℃-50℃,裸机使用会有一点热,但操控流畅度还是很稳定的。只不过要长时间运行高画质原神的话,建议还是裸机或加上散热器会更好。

屏幕部分,K80 Pro 搭载了一块 6.67 英寸 2K 新国屏。屏幕支持用上新的发光材质 M9 并支持全亮度 DC 调光,全局峰值亮度为 1800nits,局部峰值亮度可以达到 3200nits。

屏下指纹升级为超声波指纹,在屏幕有点脏或沾上水都不影响解锁。

无线充电回来了

续航方面,REDMI K80 Pro 电池升级为 6000mAh 硅碳电池,容量比 K70 至尊版要多 500mAh。K80 用了容量更大的 6550mAh,比 K80 Pro 还要多一点。

相比上一代只多了 500mAh 的电池容量,K80 Pro 的续航会比 K70 至尊版还要强一点。

在开启性能模式的条件下,K70 至尊版能够坚持到 1.5 天多一点,K80 Pro 则能够用到接近两天。要是平时玩游戏的时间并不多,而且也不需要每次都开启最高画质和最高帧率的话,K80 Pro 的续航能够轻松超 2 天。

快充的部分,K80 Pro 同样支持 120W 有线快充,K80 则只有 90W。

K80 Pro 在完全没有电的黑屏状态下接入电源 10 秒后亮屏开机,15 分钟充满 56%,30 分钟就能充到 95%,最后在 33 分钟充到 100%,充电效率和 30 分钟左右充满 5500mAh 的 K70 至尊版差不多。

另外,K80 Pro 也支持了 55W 小米无线快充,日常出门带着支持小米快充的充电组合,回到家用小米充电板充电就可以了,效率上也不会差别太多。对于小米配件生态比较完整的用户来说,是个好消息。

化方为圆的新设计

说实话,REDMI 旗舰机在外观的大更新上还是很勤奋的。

K60 系列是当时国产 Android 手机旗舰很常用的双曲面机身,搭配纵向排列的小 DECO 设计。K70 画风一转变成了方方正正的直角边框设计,玄武岩质感的后盖配上占据后盖上侧大部分空间的超大型横向舷舱 DECO,整机看起来更干练。

来到 K80 系列,REDMI K80 Pro 用上 「跃界新生」 的全新设计语言,后盖透过「光雾双工一体工艺」呈现出两种质感,将后盖分割成两个区域。

上半部分则是高通透的镜面处理,边缘有圆滑的大 R 角裹度,边缘受光会在视觉上提升立体感。

下半部分用上 AG 工艺处理出带亲肤效果的磨砂质感,调整光线角度的可以呈现出刻在后盖上的纹理,纹理也可以通过表面的哑光磨砂效果增强质感。

配色的淡蓝色加上纹理,看着有种百川流动的效果。

DECO 部分将三摄组合成一个「大镜头」,等边三角排列的三摄组合外环添加了纹理,镜头环通过高亮阳极氧化工艺处理出高光镜面金属效果,看着也有类腕表的质感。

整机重 212g,厚度为 8.39mm,对于一款旗舰配置并搭载 6000mAh 大电池的旗舰手机来说还算克制。电池更大的 K80 重量则是 206g,厚 8.12mm,比 Pro 版更轻薄一点。

手机做到了接近 50:50 的重量配比,呈现两种质感的后盖可以光滑过渡,金属边框增加了哑光处理,不容易出现指纹。

机身加入大 R 角收边设计,配合工艺升级过的哑光亲肤保护软壳,REDMI K80 Pro 握持时更容易贴合手型,不管是裸机还是配套使用都很舒服。

REDMI 增强了机身的防护性能,REDMI K80 Pro 屏幕上加入小米龙晶玻璃 2.0,机身用到无孔化顶部设计之后支持了 IP69 防水防尘,最高支持 2.5 米 24 小时防水。

不得不说,厂商们在入门和中端机身卷起了机身防护性和耐用性之后,这些好处也「回馈」到自家主力旗舰机上。

配色方面,REDMI 这次给 K80 Pro 提供了玄夜黑、雪岩白和山峦青,K80 有传统的黑色、雪岩白、山峦青和汐月蓝四种。

新的配色也少了一些 K70 系列硬朗的味道,配上带点 civi 系列的设计味道的它,对女生也会多一点吸引力。

拍照也有小进步

K80 Pro 的相机配置,变化还挺大的。

相机继续采用「超广+广角主摄+长焦」的标准三摄组合,主摄用的不再是索尼 IMX906,而是选择了 5000 万像素 1/1.55 英寸的光影猎人800,光圈为 F1.6,支持光学防抖。

在光线充足的环境下,三款机型主摄的成像素质差别其实不算特别大。同样用了光影猎人 800,K80 Pro 不会出现 K70 Pro 刚发布时成像偏灰偏模糊的问题,线条刻画也更锐利了一点。

画面的整体感觉,K80 Pro 更加通透,HDR 痕迹更低发色更自然,可以看到 REDMI 在优化和捕捉用户口味的地方还是下了些功夫。

转移到弱光环境,K80 Pro 和 K70 至尊版的成像更符合现场环境的颜色,三款机型画面都算干净,压低高光的同时不会出现明显的 HDR 后变灰的痕迹,也没有强行提升暗部、改变现场光比的问题,实用性还不错。

长焦的话,K80 Pro 自己搭载了一个使用 5000 万像素三星 JN5 传感器的 2.5x 长焦镜头。在相机的选项中,同时还保留了通过主摄裁切的 2x 选项,同时增加了长焦裁切两倍后得到的 5x 视角,日常拍摄已经够用了。

长焦部分,更新到 JN5 的 K80 Pro 素质会高一些。在光线充足的情况下,整体解析力以及建筑的线条刻画都要比 K70 Pro 以及裁切出来的 K70 至尊版好不少。

看细节的话,透过数码变焦的 K70 至尊版会有些吃紧,而长焦设置为两倍的话 K70 Pro 数码变焦到 2.5x 也会有一点模糊。相反 K80 Pro 在通过主摄数码变焦的 2x 和实打实的 2.5x 长焦表现都不错,细节清晰线条锐利。但从机器自动调整的方向来说,K70 至尊版有些时候还是会高亮一点。

超广角的升级会明显一点,K80 Pro 从 K70 至尊版的 1200 万像素升级为搭载 3200 万像素传感器 KD1、光圈为 F2.2 的超广角镜头。成片呈现的数码锐化感少了一点,少了 HDR 后画面整体偏灰的问题,观感更真实。

而在畸变控制的部分,三款手机的差别并不大,表现也算优秀。

依旧旗舰,更加专注

最后先看看价格,REDMI K80 Pro 有五个储存版本:

  • 12GB + 256GB 3699 元
  • 12GB + 512GB 3999 元
  • 16GB + 512GB 4299 元
  • 16GB + 1TB 4799 元
  • 16GB + 1TB 冠军版 4999 元

总的来说,K80 Pro 还是一款专注性能和续航升级的机型。

换上骁龙最新的旗舰芯片后性能获得大幅度提升,配合自家独显芯片 D1,K80 Pro 在高画质环境下运行大型游戏变得更游刃有余。虽然不是每个人在移动场景下都要玩全画质的原神、星穹铁道或绝区零,但性能强一点,常规模式下发挥更稳定,游戏体验也更好。

电池更新之后,续航压力降低,也是利好整体性能提升的因素。现在稳妥的两天续航,加上能够在 30 分钟左右充满的 120W 快充,以及再次回归的 55W 无线充电,现在除了通用 PD 快充瓦数并不高,几乎也没有什么续航焦虑了。

相机的提升,我觉得更多是算法优化和成像风格带来的调整。

超广角的升级有点亮眼,对于一款主打性能的手机来说还是可以的。只是整体的变化不算特别大,如果你习惯了后期都会做一些小调整的话,那有长焦的 K70 Pro 或者是算法已经升级过的 K70 至尊版,还是够用的。

如果你是垂涎新一代旗舰店的性能和续航,手上拿着是标准版 K70 或再上一代 K60 Pro,或者是电池使用量比较大的 K70 Pro,那性能更强、充电功能更完整的 K80 Pro 会是非常适合的升级对象。

「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为Mate 70 ,给出了 AI 手机的新答案

By: 李超凡
27 November 2024 at 17:31

1950 年,艾伦·图灵在哲学杂志《心》上发表了一篇文章《计算机与智能》(Computing Machinery and Intelligence),将「机器能思考吗?」这个问题,转换成「模仿游戏」(Imitation Game),来测试机器是否能够展现出与人类不可区分的智能行为。

这就是著名的「图灵测试」,被认为是人工智能的起源。

图灵认为,思考不需要被严格定义,只需通过行为表现来判断智能。他提出机器应该超越工具,成为人类智慧的延展和补充,而不是试图完美无缺地复制人类。

AI 的技术曲线在这两年突然陡峭,图灵 70 多年前的设想有了更具象的载体。智能终端开始可以识别用户意图提供服务,一种新的人机交互方式开始撬动图形界面的地位。

AI 硬件不再等同于将大模型塞入设备,而是以系统级 AI 为核心重构智能终端,将大模型技术全面融入终端系统。智能手机正在进化成新物种,前段时间亮相的 HarmonyOS NEXT 就是大模型时代下, AI 和 OS 深度融合的体现。

而首发搭载 HarmonyOS NEXT 的 Mate 70系列,也成为华为史上最智慧的 Mate 系列,是华为在打破技术的封锁和垄断后,对 AI 时代智能终端探索的新里程碑。

此前,余承东表示,「鸿蒙用了十年长征,走完了欧美国家三十年才走完的路」。

现在,Mate 70 系列开启了华为 AI 生态下一个十年的征途。

Mate 70 ,史上最智慧的 Mate

搭载 HarmonyOS NEXT 的华为Mate 70系列 ,除了 AI 性能的提升,还带来一系列 AI 新功能,总体可以分为三个大类:

  • 更有趣:AI 运动轨迹、AI 主角时刻、AI 时空穿越
  • 更高效:AI 智控键、AI 隔空传送、AI 通话摘要
  • 更安心:AI 消息随身、AI 降噪通话、AI 静谧通话

Mate 70 系列的电源键集成了 AI 功能,轻触两次可唤起系统级 AI,用户可以选择设置进行智慧识屏、长按唤醒智能助手等多样化的用途。

当从 Mate 30 开始布局的隔空操作,与鸿蒙互联生态结合后,更科幻的「AI 隔空传送」得以诞生。用户可以从 Mate 70 手机中隔空伸手一「抓」,然后移到另一台设备一「放」,把截图或图片传送到其他设备上。

「隐私」则是一些比较平时无感,但又时刻守护用户手机使用的功能。「AI 消息随身」仿佛给 Mate 70 手机配备了一个智能「防窥屏」,能够检测视线,当检测到机主之外的注视时,手机会自动隐藏消息,保护隐私。

而 AI 静谧通话通过人工智能消除通话漏音,不影响他人的同时,也不让私密的通话内容泄露。

Mate 70 还结合 AI 带来了一些比较有趣的拍摄玩法。「运动轨迹」通过 AI 多重曝光拍摄处理,实现一张静态照片对运动轨迹的捕捉;而「主角时刻」则是长曝光,通过 AI 保持被拍摄主体静止,而背景呈现拖影效果。

至于「时空穿越」则是通过生成式 AI,改变人像照片所处的时空背景和衣服配饰。

这些 AI 功能中,有能提升用户办公效率的智能助手,也有拓宽用户创作边界的创意工具。这些嵌入系统各个部分的功能,更多还需要用户主动去唤醒、使用,可替代性也较强,是鸿蒙智能的优势,但并非最核心的优势。

而像是自动触发和开启的 AI 消息随身、AI 静谧通话、AI 降噪通话等功能,则表明鸿蒙 AI 确实已经进入系统底层,无需用户参与,就能直接根据外界情况作出反应,并且还结合了视觉、听觉等多模态能力。

要实现这一点,缺乏对硬件和软件的总体调度能力,是无法完成的,因此自研系统+自研核心硬件的华为Mate 70系列,不仅是 Mate 系列有史以来最具智慧的一代,也是华为对 AI 手机未来形态的全新解答。

华为的 AI 版图,补齐最关键的拼图

Mate 70 在 AI 技术上的爆发也并非只是坐上了大模型的风口,回顾 Mate 系列的历史,这款旗舰一直承载着华为在 AI 技术上最先锋的技术突破。

Mate 系列不仅是国产智能手机走向高端化的代表,还是华为 AI 版图构建一条重要的主线。

在 AlphaGo 击败世界围棋冠军柯洁的 2017 年,Mate 10 系列也成为 AI 行业一个关键节点,它搭载了全球首款内置独立 NPU的智能手机 AI 计算平台——麒麟 970 芯片。

这颗 NPU 专门为深度学习而定制,FP16 性能达到了1.92 TFLOP,尺寸却没明显增大,突破了当时端侧硬件能力的上限。

NPU 的加入使得麒麟 970 在 AI 任务处理上速度极快,在图像识别速度上,可达到约 2000 张/分钟。

因此 Mate 10 也率先支持了 AI 慧眼识物、双指识屏等这两年旗舰手机逐渐普及的 AI 功能。比如 AI 慧眼识物能实时分析拍摄场景,识别多达 13 种场景和物体,从而根据对象的特点和属性自动调节参数设置。

麒麟 9 系列芯片逐渐跻身行业系列,后面几代 Mate 系列也在 AI 功能有了不少突破。

现在已经升级成系统级智能体的小艺,在 Mate 20 上就首次搭载。

Mate 30 通过姿态感应器和微核 NPU 实现的 AI 隔空操控,以及 Mate 40 隔空截屏,也早早为这次 Mate 70 上 AI 隔空传送功能打下了基础。

去年在 Mate 60 系列首发的 HarmonyOS4 ,则是国内首个内置 AI 大模型的分布式操作系统,华为的盘古大模型开始融入到手机中。

历代 Mate 的 AI 功能就像一颗颗耀眼珍珠,最终将它们串成项链的,是在今年华为开发者大会亮相的鸿蒙原生智能(Harmony Intelligence)。

系统级 AI 终于在 HarmonyOS NEXT 上实现,鸿蒙的意图框架开始展示人机交互的未来形态。

鸿蒙原生智能具备多模态理解能力,能够理解用户的语音、文字、图像等多种输入形式,让系统可以通过学习用户的行为习惯,提供个性化的服务和建议。

如果用户每天早上上车后习惯听「每日推荐」歌单,系统就会学习这一行为,并在合适的时间推荐相应的歌单卡片,实现一键播放。

这意味着 AI 不仅仅是对人类行为的再现,还能对用户需求的主动预测和对复杂任务的高效执行。

鸿蒙意图框架印证了图灵的观点,即智能的关键不在于「机器是否有思想」,而在于机器是否能够在行为层面提供有意义的功能。

意图框架的「思考」被设计为工具性、服务性的智能,这与图灵的「行为主义智能」一脉相承。

通过从单设备到生态级协同、从静态交互到动态场景服务的跃升,HarmonyOS NEXT 用 Thinking Game (思维博弈)实践了图灵的智能机器设想,也展现了华为对 AI 手机或者终端的理解。

所谓系统级 AI ,应该是动态的、自主的和自适应的,让服务从被动转向主动 ,体验从单点转向多链条,实现「以意图为中心」的人机交互。

这种交互界面也将成为 AI 时代新的超级入口,而将软硬件核心都握在自己手上的华为,可能是最适合做这件事的公司。

下一个十年的智能终端

大模型爆发后,今年 AI 行业在两件事形成了共识:提升 AI 的思考能力,让 AI 能代替人去执行任务。

Anthropic 发布了computer use ,让 AI 像人类一样操作计算机,比如查看屏幕、移动光标、单击按钮和输入文本。智谱的 AutoGLM 也叫 Phone use ,只要一句指令就能让 AI 在手机帮你发微信、网购下单。

这种 AI 代执行的技术路线,其实就是模仿了人类执行任务过程智能体工作流,大模型为智能体的大脑,让其他的关键组件执行任务。

  • 拆解和规划任务的分配
  • 模拟人的记忆类型进行获取、存储、保留并检索信息
  • 调用外部 API 扩展模型能力

我们所说的系统级 AI ,并非只是软件,而是一种新的计算机形态,它可以连接各种软件和硬件,以及所有模态信息组成的外设,并调用 API 执行各种任务,用户不需要再通过一个个 app 来获取服务。

要实现设备间全局的智能体验,这就要求软硬件、端云侧的高度协同,将用户意图识别与任务执行的 AI 能力无缝扩展到不同设备。

华为的「鸿蒙原生智能」(Harmony Intelligence)就是这个技术路线上的先行者。在鸿蒙发布之初,我们就提出华为成为了一家「超级终端」公司,其中一个核心就是微内核和分布式能力天然适合万物互联。

华为以端云协同架构为底座,在 HarmonyOS NEXT 上重新定义了鸿蒙的智能核心,将 AI 深度融入系统,从内核到应用实现了全场景的智能化体验。

因此在 Mate 70 系列上,我们已经可以看到未来 AI 终端的一些关键特征:

  • 原生智能 OS
  • 系统超级智能体
  • 端云协同,统一的 AI 计算生态
  • 全场景融合感知
  • 开放生态

「小艺」从曾经的语音助手已经蜕变为无所不在的智能体,不仅能精准理解用户意图,还能完成从思考到规划、再到执行的一整套流程。小艺代表了AI 助手的新形态,更接近钢铁侠的「贾维斯」。

更重要的是,华为全面开放了从 AI 模型到控件的分层能力,赋能第三方开发者,为鸿蒙原生应用生态注入活力,这种开放性使开发者能够轻松构建和集成 HarmonyOS NEXT 原生的 AI 能力,目前已经有超过 15000 个应用和元服务接入这一系统。

软硬端云的协同结合正在重新定义计算体验,下一个十年的智能终端,不只是设备性能的比拼,更是生态体系的较量,而对核心硬件和操作系统的把控,则决定了整个生态是否能稳定地推进前沿 AI 技术的探索。

华为是当今为数不多从关键元器件到系统都自主控制,并深度融合打造系统级 AI 的公司,10 年前,余承东在 Mate 7 发布会上曾说:

通往山顶的路有很多条,我们选择最难、也是最有价值的那一条。

下一个 10 年,华为 Mate 系列依然走上了一条最具挑战性,也将带来巨大改变的路。在 OpenAI CEO 等行业领袖认为将实现 AGI 的未来几年,AI 手机或许也将迎来又一个「轻舟驶过万重山」的时刻。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AI 生态浪潮下,TWS 耳机应有怎样的自我修养?

By: 谢东成
27 November 2024 at 12:07

不知道你有没有发现,AI 大模型正在潜移默化地影响着我们在数字生活里的许多行为习惯。

从拍照识图到 AI 对象消除,从多轮对话到近乎真人的 AI 情感陪伴,AI 大语言模型等技术不仅拓宽了手机等终端设备的功能边界,也进一步加强了我们对它的依赖。

虽然在现有的市场格局下,那些所谓的 AI OS 尚未产生重大影响,但大模型的潜力不可忽视,未来的智能手机、AI 耳机、智能手表未必一定是今天的样子。

所以业内现在已经存在着一个共识:AI 并非万能,但没有 AI 却是万万不能。

在今年 6 月的 HDC2024 上,鸿蒙操作系统迎来了自诞生以来最大的一次更新,正式发布了 HarmonyOS NEXT 系统,也就是剥离安卓源代码的「纯血鸿蒙」,并且带来了系统级 AI 能力。

「鸿蒙原生智能」把分散在大模型和应用里的 AI 能力,聚合成为适用于每个普通用户的日常体验,从底层架构开始追逐全场景智能的高效协同体验。

11 月 26 日,随着华为Mate 70 系列的发布,我们也迎来了第一款搭载 HarmonyOS NEXT 系统的旗舰 TWS 耳机——华为FreeBuds Pro 4。

鸿蒙 NEXT 的 AI 能力,也开始从手机延伸到原生鸿蒙的 TWS 耳机之中。

生态之中,耳机与手机唇齿相依

近十年间,消失于智能手机之上的 3.5mm 耳机孔,催生了 TWS 耳机的繁荣业态。换句话说,几乎每人一部智能手机的同时,也意味着几乎每人都会拥有一副 TWS 耳机。

在 IDC 最新的《全球可穿戴设备追踪报告》中可以看到,耳穿戴设备预计在 2024 年依然保持着稳健增长

保持增长的原因是新兴市场的进一步普及和成熟市场的更新周期的开始,尤其是成熟市场的消费者在期望更换新一代的耳穿戴设备产品(耳机)来满足日常更多不同场景下的细分需求,甚至在考虑为多个不同的场景而配备多副耳机。

换句话说,消费者对新时代耳机日益增长的功能需求,正促使厂商进行新一轮的技术革新和产品迭代。而在 AI 大模型赋能系统交互的浪潮下,TWS 耳机与手机之间的关系正变得前所未有的紧密。

皆因手机和耳机之间,逐渐形成了「主机与终端」的关系联结——手机作为核心计算和连接枢纽,为 TWS 耳机提供了不可或缺的算力和网络连接能力;同时耳机也延伸并增强了手机的 AI 交互体验,在用户的耳边提供了智能语音助手的自然入口,并在多场景之中将手机的 AI 能力延伸到更加便捷和多元的使用场景。

正如刚刚发布的华为FreeBuds Pro 4,只要你将耳机佩戴在耳边并与手机保持连接,随时随地都能够轻声说出「小艺小艺」这句话来唤醒手机内的「小艺智能体」并来到你的耳边,聆听你的指令。

▲ 通过华为FreeBuds Pro 4 来直接调用手机上的小艺智能体

其中当属「随时随地」的体验最为难能可贵,这意味着你可以在手机息屏,或者是在湿手/烹饪/绘画等不想要直接操作手机的场景下,直接用耳机就能唤醒小艺来执行相应的语音指令,包括但不限于接打电话、音乐播放、耳机降噪、控制智能家居、设定闹钟或定时器、记录备忘录等等功能。

甚至是在你有差旅计划的时候,也可以通过耳机下达语音指令让小艺推荐出行计划、搜索导航路线、查看机票等等,而来到耳边的小艺也不负众望,跳过了一系列繁琐的聚合搜索操作,直接将结果呈现于屏幕之上,并在你的耳边一一述说。

尤其是需要轻声细语且不便掏出手机的场景,你也可以通过触碰耳机上的触控按钮来唤醒小艺,让华为FreeBuds Pro 4 耳机腔体上的三麦克风来精准地拾录你的语音指令,再将结果传递到你的耳边。

▲ 「小艺翻译」内搭载的「面对面翻译」功能,可以调用FreeBuds Pro 4 来聆听对话并进行翻译语音反馈

首发的「小艺翻译」功能更是支持「面对面翻译」和「同声传译」功能——只需要佩戴着华为FreeBuds Pro 4,耳机就能够收录对方的声音,并实时将翻译结果传达到你的耳边,传译所需的时延极低,戴着耳机就像是身边带着一个专业的翻译助理。

显然,基于大语言模型升级之后的小艺智能体,已经成为一个称职的私人生活管家、办公助手、娱乐助理。从这个角度来看,为了打造一种「用过就离不开」的 AI 交互体验,华为FreeBuds Pro 4 应该就是搭载原生鸿蒙系统的华为手机们,最亲密的智慧伴侣。

从弱连接到强连接,耳机与手机从未如此紧密

在 AI 时代,TWS 耳机和智能手机的「连接」,不仅是对基础听音功能的实现,更是成为对 AI 智慧能力尽情发挥的关键环节。尤其是 AI 驱动的功能,例如智慧问答、智慧翻译等功能,都是需要耳机和手机之间进行高频且大量的数据交换,这也就意味着手机和耳机之间,需要具备超低延迟且高带宽的传输能力。

与此同时,耳机和手机的连接需要在各种复杂的环境中保持稳定,尤其是在人群密集区域或信号干扰的场景下,耳机和手机之间的连接,也需要具备更优的抗干扰能力和可靠持续的连接稳定性。

不难看出,要满足手机和耳机 1+1>2 的 AI 智慧交互体验,对 TWS 耳机与手机之间传输的低延时、稳定性和速度,又提出了新的要求。

为了获得「无线胜有线」的连接能力,华为在 TWS 耳机上引入了星闪连接核心技术——暨 Polar 码技术。

得益于麒麟 A2 芯片和星闪连接技术,华为FreeBuds Pro 4 的传输速率有了 53% 的提升——除了可以基于 L2HC 4.0 编解码技术提供 2.3Mbps 无损音质传输以外,还大幅提升了无线抗干扰能力,在更远的距离上依然能够与鸿蒙原生手机保持稳定的连接,同时也保持着更低的时延和更高的响应效率。

就目前的能力体现而言,在短距离无线通信领域上,如果说蓝牙是「弱连接」,那么星闪(NearLink)就是「强连接」。有了「星闪」,华为耳机与华为手机的关系从未如此紧密可靠。

当然,对于 TWS 耳机而言,有了紧密的无线连接也还是需要直面「随手丢」的遗落痛点,在社交媒体上我们经常可以看到有用户在抱怨 TWS 耳机不小心弄丢了的情况,甚至因为 TWS 耳机太多人遗失了单边耳机或者耳机盒,社媒上还催生了「无线耳机相亲角」的相关话题。

为此,华为FreeBuds Pro 4 支持「离线查找」功能,启用「查找」之后,即便耳机或充电盒不在身边,也能通过远距离地图定位具体的位置,并且支持智能遗落提醒和耳机上线通知功能。同时有赖于「强连接」的星闪功能,华为FreeBuds Pro 4 的耳机盒支持「星闪查找」功能,用户可以在清晰的方位指引下,快速定位耳机盒的位置,而且耳机盒还可以响铃提升,帮助用户快速寻回。

华为表示,FreeBuds Pro 4 还支持「楼层定位」功能,可以通过华为查找网络查看丢失耳机的具体楼层位置。预计到 2024 年底,楼层定位能力将覆盖全国超过 300 个省市地区的 8000 多个大型商场、机场、高铁站等公共场所。

AI 生态中,TWS 耳机应有怎样自我修养?

不难发现,现有的 TWS 耳机使用痛点,无论是音质、稳定性、抗干扰等等,本质上都是「连接」的问题。

显然,擅长于「连接好一切」的华为,早已明晰了提升 TWS 耳机连接能力的重要性,并持续通过技术创新来解决一切与「连接」相关的难题。

纵观华为公司的发展历程,你会发现华为的确很执着、也很擅长于做好「连接」这件事情。

作为全球领先的通信设备供应商,华为在移动通信领域拥有丰富的经验和技术储备。从 2G 到 5G,华为始终处于行业前沿,提供高质量的网络设备和解决方案,确保全球数十亿用户的稳定连接。

值得一提的是,星闪技术起源于华为的超级蓝牙(绿牙)技术,绿牙不但能够涵盖传统蓝牙的功能,而且实测下来的稳定性和极限距离都远超当时的传统蓝牙技术。为了加快我国科技自立自强的步伐,华为继续投入研发这个新一代无线短距通信技术,并作为主要的技术贡献方,在 2020 年牵头成立了负责制定和规范星闪技术的「星闪联盟」。

作为中国自主原生的新一代无线短距通信技术,星闪在低时延、多链接、局域无线长距离高速要求等场景下均有显著优势。在 HDC2023 上,华为终端正式宣布,将星闪技术纳入到鸿蒙生态当中,让星闪为鸿蒙生态的万物互联提供一个坚实可靠的连接技术底座。

于是在 AI 浪潮迅速席卷全球消费电子领域的当下,我们在搭载原生鸿蒙系统的华为FreeBuds Pro 4 身上,确实是可以窥见智慧耳机必备的一些「自我修养」。

核心,是智慧耳机必须要与手机长期保持「强连接」,用更加粗壮的无形耳机线来拓宽 TWS 耳机音质和降噪的上限,让耳机的「基本功」表现得更加扎实。

其次,作为手机 AI 能力的延伸,TWS 耳机不再是单一的音频设备,而是化身成为 AI 生态里深度整合的交互终端,以「强连接」来实现对精准语音的识别并带来几乎无延迟的反馈,让小艺智能体可以像《钢铁侠》里的贾维斯一样,做到如影随形,瞬时响应并且越用越懂你。

可能随着未来技术的进一步发展,AI 耳机内在的算力会进一步暴涨,有望真的可以在端侧加载一个像「贾维斯」那样复杂的拟人化 AI 助手,可以完成更多的事情。我们也在华为的专利库当中,看到了 TWS 耳机有望增加一个低功耗的摄像头来智能识别周遭环境路况,从而提升佩戴者的出行安全。

但就目前而言,唯有让手机与耳机之间实现高效协作,依托于手机的算力和耳机的交互特性,才能让 AI 能力真正能够融入用户的日常生活,带来更优的体验。

如你所见,在以华为手机为核心的原生鸿蒙系统的生态之中,华为耳机与华为手机不再是单一的独立设备,而是共同组成了一个浑然一体的超级终端,共同构建出完整的鸿蒙生态系统体验。

说到这里,大家应该就可以理解,为什么能够说华为FreeBuds Pro 4 作为首款搭载 HarmonyOS NEXT 的智慧耳机,与首款出厂就预装 HarmonyOS NEXT 的华为 Mate 70 系列手机,天生便是一体。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为发布 Mate 70,余承东高呼对得起「那四个字」,还有个百万产品

By: 苏伟鸿
26 November 2024 at 18:24

就在九月,华为 Mate XT 非凡大师直面硬刚苹果发布会,与三折叠的问世,为逐渐走向沉寂的智能手机市场再度掀起了一阵热浪。

作为一台「迈向无人区」的产品,Mate XT 非凡大师在工艺和设计上达到了全新的高度,但也因此面临良品率的限制,相比于 Mate 系列的广泛覆盖,这台手机注定只能小批量生产,仅有少数幸运儿能体验到它的独特魅力。

不过,华为的脚步很快,没有让大家久等,两个月后的今天,余承东站在台上面向所有观众宣布「史上最强 Mate」的到来:

华为 Mate 70 系列与 Mate X6 折叠屏正式发布。

「史上最强的」Mate 70

这次发布会上,一共带来了 5 款不同的华为 Mate 手机:

  • 华为 Mate 70
  • 华为 Mate 70 Pro
  • 华为 Mate 70 Pro+
  • 华为 Mate 70 RS 非凡大师
  • 华为 Mate X6

发布会上对标准版 Mate 70 的着墨较少,主要提到了显示方面搭载了一块 6.7 英寸大小的 2688x 1216 OLED 直屏。

在安全方面,标准版依然搭载的是 2D 人脸解锁,以及侧边指纹。

发布会的重头戏自然是 Mate 70 Pro 与 Pro+ 。

华为 Mate 70 Pro 与 Pro+ 步调保持一致,采用等深四微曲设计,搭载 6.9 英寸 OLED 定制屏幕,分辨率来到了 2832 × 1316,支持 1440Hz PWM 调光,并且同样选择了侧边指纹识别以及 3D 人脸解锁及识别的方案。

值得一提的是,华为 Mate 70 Pro+ 后盖采用了一种名为「金丝锦纤」的新工艺,是一种微纳米 3D 拓印技术,让后盖呈现一种类似织物的纹路。

华为 Mate 70 Pro+  使用高亮钛玄武机身,耐磨能力提升 5 倍,后背的超耐用锦纤抗冲击能力比普通玻璃提升 5 倍,第二代昆仑玻璃整机耐摔能力提升 20 倍,全机身支持 IP68 级 6 米抗水以及 IP69 级抗高温高压喷水,使用中的意外再也不会让人心惊胆战。

作为大杯与超大杯,影像能力毫无疑问是重头戏,华为 Mate 70 Pro 与 Pro+ 背面中轴对称的星环影像模组内搭载了三颗镜头:

  • 右下角:5000 万像素 F1.4-F4.0 可变光圈主摄
  • 左下角:4000 万像素 F2.2 超广角镜头
  • 左上角:4800 万像素 4 倍 F2.1 潜望长焦

三颗镜头协同作战,覆盖了常用焦段,配合纵置摆放的「XMAGE」logo 与边框镶满 1440 颗星光饰钉的火山口 Deco,组成「超大杯」的影像硬件。

需要注意的是,Mate 70 Pro+ 的三颗摄像头均使用 RYYB 的像素排列方式,有效提高手机在低光环境下的成像表现,而 Mate 70 Pro 与标准版都是用较为传统的 RGGB 排列,这也是目前来看超大杯在影像上的最大优势。

从 Mate 50 开始,华为褪去了徕卡的外衣,推出了自己的影像品牌 XMAGE,一手包揽光、机、电、算四个维度,从硬件到软件,构建完整的影像体系。

Mate 70 Pro 与 Pro+ 的硬件配置强劲,XMAGE 还有新东西。

华为 Mate 70 全系都支持了全新的红枫原色影像系统,搭载了一颗红枫原色摄像头,通过 150 万多光谱通道捕捉外界色彩,再介入三颗光学摄像头的成像,使拍摄的照片与视频色彩更加准确、饱满,接近人眼所见的真实色彩。

此外,XMAGE 也再次进化,学习了全球超过 10 万幅艺术作品,打造了鲜艳、原色、明快三种全新的色彩风格,面对更多的环境与场景,用户都能拍出不错的画面。

静态影像升级,动态影像也没落后。

全新的 AI 电影质感引擎加持下,Mate 70 Pro+ 拍摄视频时的降噪、实时 HDR 与色彩效果都得到了全方面提升。

硬件与软件、静态与动态,华为 Mate 70 系列的影像已经向所有人揭开了自己的真面目。

2024 年,AI 能力成为了智能手机厂商的兵家必争之地,而华为的优势在于自研的软件+硬件深度结合,以及端+云的双模式。

得到鸿蒙原生智能加持的全新 Mate 系列,这次首发了九大 AI 功能,大致归类如下:

  • AI 消息随身、AI 降噪通话、AI 静谧通话
  • AI 智控键、AI 摘要大师、AI 隔空传送
  • 运动轨迹、主角时刻、穿越时空

其中比较值得一提的功能有「AI 消息随身」,这仿佛是给 Mate 70 手机配备了一个智能「防窥屏」能够检测视线,当检测到机主之外的注视时,手机会自动隐藏消息,保护隐私。

除了指纹识别之后,华为 Mate 70 的电源键也获得了全新功能「智控键」,轻触两次即可触发 AI 功能,可以设置成智能识屏或识物。

从 Mate 30 开始布局的隔空操作,与鸿蒙互联生态结合后,「AI 隔空操作」得以诞生。

这个功能效果非常科幻,可以从 Mate 70 手机中隔空伸手一「抓」,然后移到另一台设备一「放」,把截图或图片传送到其他设备上。

「运动轨迹」、「主角时刻」都是 AI 拍摄功能,前者通过 AI 多重曝光,实现一张静态照片对运动轨迹的捕捉;后者通过长曝光,实现拍摄背景的拖影效果。

「穿越时空」则是通过生成式 AI,改变人像照片所处的时空背景和衣服配饰。

除了影像与 AI,Mate 70 系列在综合性能上也有提升。

华为宣称,Mate 70 系列在原生鸿蒙系统、方舟调度引擎与全新硬件的加持下,操作流畅度比上代提高了 39%,游戏启动速度比上代提高了 52%,帧率也提高了 31%,整机性能提高了 40%。

Mate 70 系列搭载 5700mAh 电池,续航提高 24%,有线快充来到了 100W,无线快充紧随其后,来到 80W,充电速率进一步提高。

最后则是华为的老本行,Mate 70 系列采用第二代灵犀通信,信号强度提高 3dB,峰值速率提升 68%,并支持 Wi-Fi 7,在各种使用场景下都得了可观的提升。

在中杯、大杯与超大杯后,Mate 70 RS 非凡大师如约而至。

按照非凡大师传统,Mate 70 RS 的后盖换为陶瓷材质,后置摄像头模组传承独特的家族化设计语言,继续采用八边形「星钻」设计。

Mate 70 RS 采用双层 OLED 显示屏,并用 AI Pixel 光学引擎提供像素级色彩调教,达到高亮高动态的显示效果,整块玻璃提供高达 3500nits 的亮度,使用寿命提高两倍,并使用玄武钢化昆仑玻璃,为日常使用保驾护航。

本次华为 Mate 70 RS 的影像系统与 Mate 70 Pro+ 对齐,三颗摄像头均与 Mate 70 Pro+ 一致,非凡影像从下到上贯穿全系。

对比 MateXT 非凡大师的惊艳亮相,Mate X6 更像是一次稳健的升级。

Mate X6 采用了全新的分布式玄武架构,提升了整机内部器件的面积,不仅通信模块更巨大,信号更好,也带来了更强的分布式散热能力,加上全新的石墨烯导热材料,设备的性能进一步提升。

得益于这个全新的架构,Mate X6 展开厚度 4.6 毫米,折叠厚度 9.85 毫米。

Mate X6 也搭载了第二代玄武钢化昆仑玻璃、创新碳纤维内屏支撑层、机翼铝机身框架、全新玄武水滴铰链等等一系列「黑科技」,加强了轻薄的抗性和刚性。

影像方面,Mate X6 的摄像头配置如下图:

设计上,Mate X6 有两种不同材质,其中一种就是 Mate70 同款的锦纤材质,采用了星云纹理的设计。

最后,余承东也提到了大家关心的系统方面:华为 Mate 70 系列,以及 Mate X6 系列都将提供支持 Android 应用的 HarmonyOS 4.3 ,和 「原生鸿蒙」HarmonyOS 5 两个选择。

华为 Mate 70 系列版本繁多,我们将售价集中列出,方便大家对比观看:

  • 华为 Mate 70 与 Mate 70 Pro 提供曜石黑、雪域白、云杉绿、风信紫四款配色,有 12GB+256GB、12GB+512GB、12GB+1TB 三种选择,起售价分别为 5499 元 与 6499 元
  • 华为 Mate 70 Pro+ 提供墨韵黑、羽衣白、飞天青和金丝银锦四种配色,有 16GB+512GB 和 16GB+1TB 两种选择,售价分别为 8499 元与 9499 元
  • 华为 Mate 70 RS 提供瑞红、炫黑与皓白三款配色,有 16GB+512GB 与 16GB+1TB 两个配置,售价分别为 11999 元与 12999 元
  • 华为 Mate X6 提供星云灰、星云白、曜石黑、寰宇红、深海蓝五款配色,有 12GB+256GB、12GB+512GB 两种选择,起售价 12999 元,典藏版售价 14999 元起。

尊界 S800,鸿蒙智行的新高度

随着问界、智界、享界车型的陆续投产,鸿蒙智行中最神秘且备受尊崇的第四个系列——尊界,终于揭开了其神秘的面纱。

两周前,余承东在广州车展的新闻发布会上,精炼地概括了尊界首款产品的特质:

「很大,很尊,很亮。」

如此夸张且抽象地形容,加之各路媒体的渲染,不少人都对这款车产生了浓厚的兴趣。今天,伴随着华为 Mate 70 系列的发布,尊界品牌及其首款车型正式亮相,补齐了鸿蒙智行这个「华为元宇宙」。

尊界品牌的首款车型名为 S800,单从命名来看,这应该是该品牌产品序列里定位较高的车型,未来,尊界说不定还会推出 S600、S500 等车型。

说回 S800,它有着 5.5 米的车长,车宽超过 2 米,轴距 3370 毫米。作为鸿蒙智行目前定位最高的一款车型,S800 的确需要一个雄壮的体格来支撑百万级的售价。

与迈巴赫 S650 等众多豪车相仿,尊界 S800 采用了双拼色车身设计,并配备常见于豪华轿车的「大饼轮毂」,辅以平直的镀铬裙边装饰和车窗饰条,整体造型契合市场对一辆豪华轿车的期待。

尽管我们可以在尊界 S800 上窥见其他豪华轿车的设计精髓,但对于一个自诞生之初便定位于高端市场的品牌而言,打造一款符合消费者印象的车型,无疑是一个审慎且明智的决策。

当然,尊界也有在打造专属于它的产品记忆点——星空元素。

小半年之前,鸿蒙智行在享界 S9 上发布了采用璀璨星钻工艺的星河大灯,有着 10000 多个切割面,点亮后辨识度极高。今天的主角尊界 S800 则在此基础上再次进化,不仅车头融入了星空元素,尾部也有一条贯穿式星云灯带。

除此之外,新车的门把手处也有着星空元素,寄托着「手可摘星辰」的宏大寓意。以往,劳斯莱斯的星空顶被视作豪华轿车的象征,而这次尊界 S800 则进一步将星空元素发挥得淋漓尽致。

在今天的发布会里,余承东还公布了尊界 S800 的预售价格:100 万元,预定金 2 万。

不可否认,尊界作为新兴品牌,在百万级豪华轿车市场中与奔驰、宝马等历史悠久的豪华品牌相比,确实面临品牌认知度的挑战。然而,从产品力角度审视,尊界所提供的体验毫不逊色于其竞争对手。加之华为的品牌背书,所带来的品牌影响力和市场吸引力,为尊界在这一领域提供了广阔的发展空间。

根据易车公布的销量数据,在今年前三季度的高端轿车市场中,奔驰 S 级以平均每月超过 1300 辆的销量荣登榜首,保时捷 Panamera 以平均每月 1272 辆的销量紧随其后,而迈巴赫 S 级则以平均每月逾 1000 辆的销量位列第三。

这意味着,尊界 S800 若能实现过千的月销,便有机会跻身市场前三。

跨越四年的「最强」Mate

2020 年 10 月,华为 Mate 40 系列发布,这是余承东第一次掷地有声地喊出「史上最强 Mate」的口号。

星环设计、隔空手势、隔空截屏,如今依然在延续和进化的功能,最早都诞生在这个特殊时间节点上的手机里。

四年后,华为 Mate 70 系列问世,一脉相承并再度进化的 AI 手势操作、星环影像模组,再次出现在所有人面前,四年前的呐喊,回应阵阵。

当然,发布会结束了,真正的体验现在才开始,这些配色好看吗?隔空 AI 功能好用吗?新的红枫原色影像系统怎么样?爱范儿将准备一系列的体验与评测为你解答。

你还对 Mate 70 有什么看法?欢迎在评论区告诉我们!

*本文由苏伟鸿、周奕旨共同完成

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OPPO Reno13 系列发布!质感满满的超美小直屏,动态影像的新潮之作

By: 范津瑞
25 November 2024 at 23:45

不得不说,时尚是个圈。这句话同样适用于手机界。

2010 年,苹果 iPhone 4 系列手机横空出世,以其锋利独特的直角边框和简单流畅的设计风骚独领。十年后 iPhone 12 系列发布,在万众期待当中回归了直角边框设计,一直沿用到最新的一代。

几年前的安卓手机界,也几乎是以曲面屏为主的「神仙打架」。纵观 Reno 系列手机,从全机身手感顺滑,搭载惊艳众人的「全景屏」的第一代 Reno,到后来紧跟潮流使用「双曲屏」,再到后来 Reno7、8 系列回归直屏。

再到今天,继 Reno12 系列采用「四曲柔边直屏」之后,全新发布的 Reno13 系列依旧延续了经典的直屏设计和家族印记,无论是颜值、设计还是质感,都可以说是全面进化。

毕竟,时尚是个圈,也可以是个「O」。

既要颜值,也要质感

如果不是这一抹独特的「蝶蝶紫」配色,你可能会将它错认为一台「iPhone」。

的确,Reno13 的设计语言可谓是「质感满满」:轻薄利落的「超美小直屏」、 iPhone 数字版同款的铝合金金属中框以及采用全新点胶工艺的「极致窄黑边」,每一处细节都透露出「旗舰级」的质感。

不仅如此,Reno13 系列的后盖还采用 iPhone 同款一体化冷雕玻璃工艺。这种工艺将整块玻璃一体冷雕塑形而成,而非在玻璃上切割后拼接加入镜头模组。这种「无缝设计」对工艺的要求的极高,同时也有利于防水防尘。

虽然都是「直屏」,但 Reno13 标准版和 Pro 版本所搭载的直屏之间,亦有门道。

Reno13 标准版拥有 6.59 英寸的「超美小直屏」设计,更小、更趁手,同时薄至 7.24 mm,轻至 181 克。

而 Reno13 Pro 则配备了观感和手感兼具的 6.83 英寸「四曲柔边直屏」,在更大、更沉浸的同时,仅重 197 克,厚度也仅有 7.55 mm。两个版本的越级手感也是「旗舰级」的。

说回到辨识度相当高的「蝶蝶紫」配色,这是 Reno13 系列的主推色,灵感来源于美丽的蝶翼,同时蝴蝶也是甜酷风格的 Y2K 千禧潮流的重要设计符号。

Reno13 系列在后盖的 AG 玻璃上采用「蝶影光刻工艺」,蝴蝶翅膀的光影流动纤毫毕现,为「超美小直屏」注入了生命力表达。

此外,Reno13 系列还推出了午夜黑、星河蓝(标准版)和星光粉(Pro)配色,都是磨砂质感,同样是青春靓丽的年轻人专属,总有一款配色让你爱不释手。

动态影像超好玩

Reno13 系列在影像方面的最大升级,无疑是为用户倾力打造了「最强」LivePhoto 体验。就像莫妮卡在发布会现场说的「Live 哪家好,Reno 科代表」。

最值得一提的是,Reno 13 系列是业内首个支持拍摄 2K 清晰度 LivePhoto 的手机。与之相比,之前的 LivePhoto 最高支持 1080P 的清晰度。

用 Reno13 系列拍摄的实况照片,视频长度延长至 3s,与苹果完全一致;超清实况照片新增了 EIS 防抖支持,还增加了动态阔流技术,改善了画面帧率,让实况照片播放时更稳更流畅。

而且,任意重选封面帧都会对该帧的纹理细节进行 AI 超清优化,显示效果更加清晰,同时重选帧还支持 ProXDR 高动态光影显示效果,真正实现了「每一帧都是封面帧」,让你在挑选封面的时候不再纠结。

此外,Reno13 系列还支持实况照片的 GIF 格式导出和批量转视频,方便用户分享。

说到分享,最实用最出圈的功能还得是和 iPhone 的「一碰互传」,Reno13 系列也搭载了这个功能。用 iPhone 拍摄的实况照片,今后也可以分享至 Reno13 系列手机上进行编辑了。

令人惊喜的是,Reno13 系列还把柔光效果和 Find X8 系列上最新搭载的胶片滤镜引入了 LivePhoto。在柔光拍摄模式下,有三种风格可供选择:

  • 朦胧
  • 柔美
  • 梦幻

而在胶片模式下,可供选择的风格有 NC、NH 和 CC 三种:

Reno13 系列还新增了多款水印样式和个性化框,让你的手机能够随时随地变身「拍立得」。

Reno13 强大的影像能力,让「拍出好照片」根本不在话下。但对于「废片」,它同样有解决办法。

如果照片放大裁剪之后太模糊,你可以使用「AI 超清像素」功能;如果你拍摄的夕阳有玻璃的反光,你可以使用「AI 去反光」功能;如果你一不小拍糊了,没关系,「AI 去拖影」功能可以帮到你。

除了软件方面的升级以外,硬件方面的进化也十分亮眼。

Reno13 系列全系搭载同档唯一「水下相机」,并且拥有一套独立的水下色彩方案,让你的影像创作从此多了一个视角。就像莫妮卡在现场说的一样,「落水对于其他手机来说是险境,对于 Reno13 却是滤镜」。

Reno13 系列拥有 IP69 满级防水。有趣的是,Reno13 在落水后,长按电源键 3 秒,手机就能自动排水。

Reno13 Pro 则搭载了一颗 3.5 倍潜望长焦镜头,并且新增了「小舞台」摄影模式,让你在音乐节、漫展舞台、LiveHouse 和校园演出等多个场景下都能轻松满意出片。

不做花瓶做玩家

功能再强大,也要靠「芯」来驱动。

Reno13 系列全系搭载天玑 8350 旗舰芯片,跑分达 147.8 万,性能与天玑 9200 接近。这颗处理器使得 Reno13 系列不仅是外观好看,而且是「内外兼修」,性能也同样强悍。

除了有趣好玩的影像功能以外,用 Reno13 打游戏也完全是它的舒适区。

这一方面得益于 Reno13 系列所推出的相当实用的「双芯抢网」功能:OPPO 为其独家定制了两颗自研抢网芯片 X1,它的发射功率更大,能够连接百米以外或者五堵墙之后的 Wi-Fi 信号,也不怕多人挤占网络。

除了「硬芯片」之外,Reno13 系列还配备了「软芯片」——其拥有同档领先的游戏云计算专网技术,通过与运营商合作为用户搭建了基于游戏场景的网络 VIP 通道,能够大幅降低延迟,提升游戏流畅性。

而另一方面,Reno13 系列号称拥有「体温级控温」:它采用全局智能控温算法,连玩王者荣耀 8 个小时的情况下,手机温度竟然仅仅只是接近体温(37.5 摄氏度)。

Reno13 不仅看重你的游戏体验,对于你的视力也同样关心。它搭载硬件级低蓝光、类自然光显示、褪黑素保护、高亮可视暗光护眼和超精密环境光自适应五大明眸护眼技术,时时刻刻呵护用眼健康。

游戏要想玩得尽兴,大容量的电池绝对少不了。Reno13 和 Reno13 Pro 分别配备 5600 mAh 和 5800 mAh 的「五年耐用大电池」,即用户如果每天充电一次的话,电池在正常使用五年后仍有 80% 以上的容量保持率。

此外,Reno13 系列全系支持 80w 无线闪充,其中 Reno13 Pro 还支持 50w 无线充。

价格方面,Reno13 标准版为 2699 元起:

Reno13 Pro 的价格则为 3399 元起:

两款机型都将于 11 月 29 日正式开售。

Reno13 系列作为 OPPO Reno 系列的最新一代,象征着当代年轻人蓬勃的朝气、积极向上的活力和对未来的憧憬,就像印在手机后盖上的那只蝴蝶一样,「我的翅膀,会带我前往」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,黄仁勋获港科大荣誉博士,演讲大秀中文,称 AI 可能是人类历史上最重要的技术

By: 莫崇宇
23 November 2024 at 11:22

今天,请称老黄为黄博士。

就在刚刚,英伟达创始人黄仁勋现身香港,并出席香港科技大学荣誉博士学位授予仪式。

除了黄仁勋被授予工程学荣誉博士,被授予名单还包括演员梁朝伟、生物化学家迈克尔・莱维特教授和数学家戴维・芒福德教授,他们都将获得各自领域的荣誉博士学位。

期间,黄仁勋也在庄重的学位授予仪式上发表了演讲,还秀了略显生疏的普通话,特地聊到要与香港科技大学著名地标「火鸡」,也就是屹立与科大广场中央的日晷合影。

以下为黄仁勋演讲全文,由 APPSO 编译,enjoy it~

感谢您,副校长、主席、法院和理事会成员、尊敬的荣誉博士同仁、尊贵的来宾、毕业生们、女士们、先生们,感谢授予我这一非凡的荣誉。我感到无比自豪,能够成为香港科技大学的荣誉校友。

我也非常高兴今天能够在这里,与各位毕业生共同庆祝这个重要的里程碑,庆祝你们人生中重要旅程的开始。同时,我也要向所有支持你们的父母和家人表示衷心的祝贺。

今天对他们来说和对你们一样,是一个值得铭记的重要日子,祝贺大家!

香港科技大学是世界顶尖的科技大学之一,也是人工智能和数据科学研究的领军机构。你们是中国对开放科学研究重大贡献的重要组成部分,推动了全球人工智能的发展。

香港高校的人工智能研究论文在全球引用榜上名列前茅。开放研究是现代科学的一大奇迹,也许是全球合作的最高形式,我们必须共同努力保护它。

香港科技大学注重创新与创业,并且已经成功推动这一地区发展为中国的大湾区。

这片土地上初创企业如雨后春笋般涌现,科大校友创立了超过 1800 家初创公司,其中 10 家已成为独角兽企业,还有 14 家公司成功上市。

英伟达也从这片区域的发展中受益良多。

在中国,我们早在 25 年前就已扎根。英伟达的设计中心分布在香港、浦东、北京和深圳,这些中心中有许多优秀的科大校友,以及与我长期共事的同仁,他们帮助我建立了英伟达。

更重要的是,他们从一开始就为中国技术生态系统的构建作出了卓越贡献。

今天来到这里时,我的同事们——自豪的科大校友——还特别提醒我要与科大的地标「火鸡」合影留念。

这是你们毕业的非凡时刻,同时也是英伟达的非凡时刻。人工智能时代已经开启了一个全新的计算纪元,这一纪元将深刻影响每个行业和科学的每一个领域。

我们已经重新定义了计算堆栈的每一层。从基于规则和逻辑编写的软件,到基于观测数据进行机器学习;从运行在 CPU 上的代码,到在 GPU 上处理的神经网络。

如今,软件行业正在全速采用机器学习和生成式人工智能,而硬件行业正在努力现代化传统计算基础设施,这些基础设施的价值高达数万亿美元。

人工智能正在彻底改变科学。

在 2018 年超级计算大会上,我首次提出了将原理性方法与人工智能相结合以推进科学计算的理念。从那时起,人工智能和机器学习几乎已经融入了科学的每一个领域。

人工智能正在以不可思议的规模帮助分析数据、加速模拟、实时控制实验,并构建预测模型,从而彻底改变了从药物研发到基因组学,再到气候科学等多个领域。

借助人工智能,我们能够以前所未有的规模研究物理系统。人工智能的变革性影响已经得到了最高级别的认可。

杰弗里·辛顿和约翰·霍夫菲尔德因其在神经网络领域的开创性工作而荣获诺贝尔物理学奖。德米斯·哈萨比斯、约翰·朱珀和大卫·贝克则因其在蛋白质预测方面的突破性进展而获得诺贝尔化学奖。

这些突破,仅仅是个开始。

全球的企业正在争相采用人工智能,以加速创新并提升生产力。

不久的将来,各组织的每个团队都将有人工智能智能体并肩工作,从市场营销、销售、供应链管理到芯片设计和软件开发等各个领域。

在重工业和制造业中,由于物理人工智能的全新突破,机器人技术的投资正在迅速增加。正如我们见证了认知智能基础模型的快速进步一样,我们也正在目睹物理智能基础模型的飞速发展。

随着人工智能变革每一个行业,机器人时代正在到来。一个全新的行业将随之诞生,致力于生产和生成人工智能,就像上一次工业革命中交流电发电厂和电力工业的兴起一样。

从人工智能时代开始,人工智能工厂和数字智能的生成将成为新的核心产业。

自英伟达创造出第一块 GPU 的 25 年后,我们已经重新定义了计算,并引发了一场全新的工业革命。人工智能无疑是我们这个时代最重要的技术,甚至可能是人类历史上最重要的技术。

我为看到如此多的力量集中在推动人工智能科学发展,以及利用人工智能推进香港科技大学和整个中国的科学进步而感到由衷的激动。我为在座的所有毕业生感到无比兴奋。

我真希望自己能够在这个时候开启职业生涯。整个世界正在经历一次重置,而你们正与所有人一道站在起跑线上。一个行业正在被重新定义,新的行业正在被创造。你们现在已经拥有必要的工具,能够推动众多领域的科学发展。

过去那些曾经看似无法克服的挑战,现在突然之间都变得可以应对了。

祝贺你们毕业!祝贺你们迈出了这意义非凡的一步!我期待未来能够有许多人加入英伟达的团队。再次感谢大家授予我这一殊荣,感谢你们认可我们许多人在英伟达的毕生努力。

同时,请务必提醒我找到通往「火鸡」的路。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AirPods Pro 2 这个新功能,为什么值得所有厂商抄作业?

By: 苏伟鸿
22 November 2024 at 18:49

在你面前有一个微波炉,一个纸箱,几张锡纸,和一台 iPad,你或许很难想象,这会和家里耳朵不好的奶奶有什么关系。

有几位印度的小伙子,正是利用以上的这些装置,打造出了一个能屏蔽信号的「法拉第笼」,将 Wi-Fi 版本 iPad 10 放入其中,就能将其与周围的设备和无线网络隔离,打开微波炉,就能干扰 Wi-Fi 信号。

然后再使用开源的 Wi-Fi 数据库和伪造工具,就能欺骗 iPad 设备,让它以为自己身处于大洋彼岸的美国加州。

如此大费周章,只为了一个目的:让奶奶在印度也能用上 AirPods Pro 2 上的助听器功能。

布局已久的助听器功能

在 iPhone 更新 iOS 18.1 后,用户可以利用 AirPods Pro 2 进行听力测试,然后才能开启耳机的助听功能。用户也可以扫描或者上传医生开出的听力损失图。

这个听力测试过程大概需要五到十分钟,在一个非常安静的环境下进行,耳机会播放一些不同频率的声音,用户如果听到了可以点击屏幕,由此排查出耳朵已经听不到哪些声音频率。

▲ Mixdown Magazine

测试后会生成用户个人的听力档案,告知用户大概有多少分贝的听力损失,以及一个非常接近临床医学的听力损失图。

戴上 AirPods Pro,切换到「通透模式」,就能开启助听器模式,在通过测试得知你听不太清哪些频率的听力后,助听器模式会针对这些频率的声音进行针对性地放大,因此在开启了相关功能后,AirPods 就不太适合借给他人使用了。

即使只有轻微听力损伤的用户,在助听器模式下也能感觉到外界的各种声音更加清晰,电视上小声的对白也能听清,在嘈杂环境也能更好和他人对话。

耳机不是无脑放大声音,城市嘈杂的喧闹声会被压制,但过马路时的车声依旧清晰。

除了增强外界声音,助听器模式还有针对手机内部声音的「听力辅助」功能,可以在设备播放视频、音乐或者进行通话时,对音量进行针对性增强。

用户或许需要一段时间才能适应这个助听器功能,不过在 iPhone 的控制中心,已经集成了一整个相关的面板,用户不仅可以自己调整听力增强的强度,还能一键开关 AirPods Pro 的其他听力辅助功能。

当这些原本散落在手机设置各处的功能,都集成在一块儿,我们才会发现 AirPods 变身助听器是苹果布局已久的结果。在 6 年前,让 iPhone 化身收音麦克风的「实时收听」功能从助听器设备下放到了 AirPods 上。

从此,AirPods 就开启了听力辅助设备的「辅修」之路。2021 年,AirPods Pro 获得了「对话增强」的功能,用户可以更容易听清面对面对话,还可以选择降低环境噪音。

用户和医学界也很早就开始探索 AirPods 作为听力辅助设备的可能性。韩国延世大学医学院在今年早些时候曾经进行过实验,让 35 名中轻度听力损失患者佩戴 AirPods Pro 进行测试,得出结果是升级前的 AirPods Pro 已经能达到消费级别的个人助听器效果。

临床级的助听器功能则更进一步,成为美国食品监督管理局批准的首款非处方助听器软件功能,改变了听力辅助行业的游戏规则。

改变的开端

助听器并不便宜。

在美国,助听器价格基本在 300 美元以上,并且这个价位还只是非常基础的「声音放大器」设备,作用就是单纯放大外部世界的声音,不支持定制化功能。

而市面上主流、功能丰富的 OTC 助听器,例如 Jabra 品牌,价格就要到 1000 美元以上。

而能进行听力测试,支持个性化增强,主要面向轻度和中度损伤人群的 AirPods Pro 2,在美国标价 250 美元,在第三方平台还能以更低价格拿下。

国内的情景要更复杂。新京报曾经进行过调查,发现在电商平台上售卖的非处方低价助听器鱼龙混杂,很多贴牌产品质量不好,甚至可能会导致进一步加深听力损伤的情况。

而专业产品的价格也和美国类似。声音放大器价格在千元以内,体验也并不好;主流的入门和中端助听器单只价格在 2000-7000 元左右;高端产品单只价格在 1 万元以上。而 AirPods Pro 2 在国内标价 1899 元,电商平台价格在 1500 左右。

不仅价格更低,AirPods Pro 2 的体验也更好。市面上大多数助听器按钮很多,调整起来不够直观科学,蓝牙功能还是额外的价钱。AirPods Pro 2 不仅能进行听力测试,助听器参数还能直观地用 iPhone 进行调整,本身还是一个音质不错的蓝牙耳机。

还有一点非常重要的是,作为耳机的 AirPods Pro 2,不会给老人家带来羞耻的感觉。

奶奶用 AirPods 看电视,效果感觉很好。戴着耳机的时候,她并不感觉自己是个病人。

用「法拉第笼」破解 AirPods 助听器功能的印度小伙在相关博客中这样写道。

延世大学医学院的研究中则提到:

助听器的使用障碍是高价格、羞耻心和一些负面的观念,而 AirPods 可以消除这些障碍,并可作为听力损失患者听力康复的一种经济实惠且临床有效的选择。

但我认为 AirPods 不仅仅只是给听力损伤人士一个更好的选择,更掀起了一场听力健康的革命。

世界卫生组织的数据显示,全球超过 15 亿人有听力损失的问题,4.3 亿人有听力残疾风险。

而由于逐步恶化的特性,听力损失常常难以察觉。苹果的研究显示,在美国,有 80% 的人口在过去五年时间没有接受过听力检查,全球 75% 的听力损失确诊患者缺少所需的辅助支持。

腾讯数据显示,我国需要佩戴助听器的老人约 6300 万,而其中只有 6.5% 佩戴了助听器,67% 的老人不清楚自己有听力下降的问题,其中只有 7.4% 接受过听力检测。

因此,如果全球数千万的 AirPods Pro 2 用户,都能在家中花个五到十分钟的时间做一个可靠的听力测试,了解自己的听力损失情况,完全可以说是全球听力卫生事业的一大进展。

▲ 图源:腾讯银发听力健康

而那些测试出中轻度听力损失的用户,他们可能只是有点耳背,需要身边人大点声说话,还没有到需要助听器的地步,就很适合随手戴上一个 AirPods Pro 2 来辅助自己。

当然,AirPods Pro 2 并非完全取代助听器,作为「非处方」级别的功能,AirPods 仅限于中轻度听力损失患者当作辅助设备。

对比起传统助听器,AirPods Pro 2 耳塞的形态戴久了也不够舒服,开启助听器功能只有 6 个小时的续航,也远远落后于大部分传统助听器设备。

还有一个最大的问题:由于涉及临床级的医疗功能,并不是所有地区的 AirPods Pro 2 都能变成助听器,目前中国大陆也无缘这个功能。

让需要的人都能得到应有的帮助

在生前最后一段时光,罹患癌症的史蒂夫·乔布斯一直在与医生和医疗系统打交道,也正是那个时候,一些想法在乔布斯内心萌生,为患者、医疗数据和保健系统构建连接,以及构建一种能追踪健康的移动个人设备。

乔布斯没能亲眼看到这些想法长出果实,但 Apple Watch 确实构建了一个随身、方便、直观的健康管理系统,帮助更多人直观了解身体状况,发现潜在的健康风险。

如今,AirPods 也继承甚至超过了乔布斯当时的设想,不仅能检测、记录个人的听力健康情况,还能充当非处方的临床级医疗器具。

而作为全球更多人在使用的可穿戴式设备,我们对蓝牙无线耳机确实有着更多的期待。

在 2019 年,我们已经大胆预测了 AirPods 未来或许将从助听器吸收灵感,并且不仅仅能提供听力辅助,还将集成 AI、全身健康监测等一系列功能。

▲ BOSE SoundSport Pulse 耳机,带有心率监测功能

AI 耳机正在萌芽,健康监测功能还在探索,但助听器功能当下已经能帮助很多听力轻度受损的用户,简单快速获得帮助。

虽然助听器功能还没来到大陆,好消息是,苹果只是这条道路上的先行者,更多厂商开始关注听力健康。

就在苹果宣布为 AirPods 带来助听器功能的同一天,腾讯关注听力健康的「天籁实验室」也发布了测听、验配、助听服务方案,不仅聚焦在传统助听器设备,还有望在 TWS 无线蓝牙耳机上实现,兼容适配各类 Android 手机。

在去年,腾讯 SSV 银发科技实验室推出了「银发听力健康」小程序,可以检测用户在安静环境下各个频率可以听到的最小声音。

而在 AirPods 支持助听器功能后,国内不少用户呼吁国产品牌跟进相关功能。

近些年国产厂商在穿戴健康和无障碍功能上的发展速度有目共睹,相信过不了多久,就会陆续有相关的功能和产品问世。

让需要帮助的人都能得到应有的帮助,这也是科技进步的价值得以彰显之处。

年关将至,今年过年回家,不妨和爸爸妈妈一起做一做听力测试。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


索尼新旗舰发布,售价近五万,这是一台普通人「不需要」的相机

By: 周奕旨
21 November 2024 at 15:50

2021 年初,索尼在经过三代机身的打磨后,顺利推出了自家的旗舰级无反 Alpha 1。

这台机器的问世,正式宣告着主打静态画质的 R 系列、主打视频的 S 系列以及均衡的 M 系列有了老大哥,也成为了彼时的主心骨。

就在所有人都以为 Alpha 1 会是接下来一段时间的当红炸子鸡时,事情却发生了转变——小弟们个个猛如虎,M 系列以下犯上,画质担当 R 系列也迭代到第五代,Alpha 7S III 更是以超强的高感、直录银河等特性火出了圈,去年年底的 Alpha 9 III 更是将 Alpha 1 的风头瓜分殆尽。

近四年过去,索尼新一代旗舰 Alpha 1 II 登场。

四年磨一剑

作为一台相机的核心,CMOS 传感器至关重要,所有的光信号都会通过 CMOS 转为电信号,成为我们熟悉的数码照片。

索尼 Alpha 1 II 继续搭载前作 Alpha 1 相同的 5010 万像素全画幅 Exmor RS BSI CMOS 传感器,型号为 IMX 610。

由于四年没换 CMOS,Alpha 1 II 拍摄的静态影像并没有太大提升,如果有高像素需求,需要通过像素转换多重拍摄模式来弥补,也就是大家俗称的「摇摇乐」,用户可以拍摄 16 张照片,并在后期合成为约 1.99 亿像素(17,280 x 11,520 像素)的高分辨率影像。

我知道四年不变的 CMOS 可能引起诟病,但这事出有因——目前民用领域的确找不到更强的 CMOS 了。

理论上,IMX 610 最高可以达到以一秒六十张的速度连续拍摄 50mp 14-bit RAW 的照片或录制 8K 240p 14-bit 规格的视频,Alpha 1 II 还远没有触及到其极限,同样一块底,索尼还搭载在自家售价高达三十五万元人民币的旗舰电影机 CineAltaV 2 上(又称 VENICE 2),这台电影机自 2021 年上市后,参与了多场电影的拍摄,也可以侧面印证其性能潜力。

▲ CineAltaV 2 在片场

不过,虽然 CMOS 没有更换,Alpha 1 II 的连拍性能还是不错,可以在 5010 万像素的规格下,进行每秒 30 张的画面不黑屏高速连拍,最多支持连续拍摄 153 张 Raw 格式照片,并以约 120 次/秒的速度对画面进行曝光计算,保证连拍照片的曝光准确。

得益于这块 CMOS 高速的读取与前代就配备的防畸变功能,电子快门并没有产生较强的果冻效应,加上更快的快门速度,电子快门在许多应用场景中的也许比传统的机械快门更有优势。

▲ 电子快门

想要拍摄一张照片,自然不能只看 CMOS,对焦性能也同样重要。

去年年底发布的 Alpha 9 III 已经秀出了索尼在对焦功能上强大的技术储备,拍摄了《特朗普举拳照》的美联社驻华盛顿特区首席摄影师埃文·武奇就因其强大的对焦性能将其作为自己的工作专用相机。

▲ 埃文·武奇与索尼 Alpha 9 III

Alpha 1 II 配备了 759 个相位检测自动对焦点,覆盖约 92% 的取景范围。从 CMOS 读取的大量数据通过双 BIONZ X R 处理器进行高速处理,同时优化的算法确保了高速度自动对焦和跟踪性能,从而实现可靠地锁定和跟踪拍摄对象。

可设置的对焦点尺寸也变得更多了,相比之前的 S、M 和 L 尺寸,Alpha 1 II 预设对焦范围增加了 XS 与 XL 两种尺寸,方便用户在需要时快速调用。

▲ 更小的对焦范围,带来更高的合焦进度,图片来自 @索尼中国

同时,AI 芯片的加入,解决了前代 Alpha 1 的最大遗憾之一,配合双 BIONZ XR 处理器,Alpha 1 II 可以对人类的姿态进行识别,对焦不犹豫,锁焦稳得住。

除了人体识别外,动物、鸟类、昆虫、汽车、火车和飞机等多种物体识别对焦的成功率也得到了提升,在拍摄照片和视频时提供更大的灵活性和可靠性。

在强大的连拍与对焦性能的保障下,Alpha 9 III 上出现的预拍摄功能,也出现在 Alpha 1 II 上,这个功能可以捕捉用户按下快门之前最长 1 秒的图像。

可以说,这是相机上的 Live Photo,相机用户再也不需要为偶尔的恍惚懊悔,迎来了自己的「后悔药」。

▲ 图片来自 @索尼中国

现在是流媒体与视频的时代,搭载了与 CineAltaV 2 同款 CMOS 的旗舰无反 Alpha 1 II,视频性能自然也不弱。

Alpha 1 II 最高可以拍摄 8K 30p 10-bit 4:2:2 或是 4K 120p 10-bit 4:2:2 视频,以 Super 35 规格拍摄 4K 30p 或 24p 时,可以获得由 5.8K 超采而来的画面,为不同需求的创作打造充裕的画质条件。

▲ 图片来自 @索尼中国

同时,机身支持与专业电影机兼容的 S-Log 曲线,其中的 S-Log 3 伽马曲线可以记录超过十五档的动态范围,与 CineAltaV 2、FX9 等电影机拍摄的素材轻松匹配,打通后期处理流程。

对于新手而言,S-Log 的确不好上手,Alpha 1 II 支持导入 16 个用户 LUT 用于预览画面,进一步降低专业调色曲线的使用门槛。

如果 S-Log 还不能满足用户的创作需求,Alpha 1 II 还支持通过机身上的 HDMI 接口连接外录设备,将 16-bit Raw 格式的视频输出到外部记录仪,在几乎不损失画质的情况下,为后期提供极大的调整空间,助力所有创意的落地实现。

▲ 连接了外录设备的索尼 FX3

外观设计方面,Alpha 1 II 遵循了索尼一贯的设计,整体外形紧凑利落,机身采用哑光黑色镁合金打造,透露出精致与刚毅感,质感强烈并具备良好的耐用性与防护性。

Alpha 1 II 整机仅重 743 克,配合深厚的手柄设计,在长期握持的使用中缓解手部压力与疲劳。

在橙色的卡口环中,Alpha 1 II 内置了 5 轴防抖组件,最高可以实现 8.5 级画面中心防抖与 7.0 级画面周围防抖补偿,为高像素条件下的清晰成像提供了保障。

值得一提的是,Alpha 1 II 也加入了动态防抖增强模式,这个功能首先出现在索尼 ZV-E1 上,提升超过 30% 的防抖效果,影像旗舰也能成为「运动相机」,不过这个功能在开启 8K 或是 120 帧及以上的视频规格时不可用。

此外,机身配备了与 Alpha 9 III 相同的可触摸操作 4 轴多角度翻转屏,从任何角度拍摄照片、视频都不是难题。

▲ 图片来自 @索尼中国

在机身卡槽上,Alpha 1 II 的双卡槽都支持最新的 CFExpress A4.0 卡格式,写入速度可以达到 3GB/s 以上,是 CFexpress 2.0 速度的 2 到 2.5 倍,在回看照片时,Alpha 1 II 支持按顺序无缝读取观看两张卡内部存储的照片。

索尼 Alpha 1 II 的官方售价为 47999 元,将于 2024 年 12 月上旬正式上市。

影像巅峰,意义何在?

有一句笑话是这样说的:

想要完全发挥现在旗舰相机的性能,可能需要用最高规格的视频录制一只野生动物在非洲大草原的银河星空下穿着婚纱奔跑。

虽然听起来真的离奇荒谬,但这的确是各家旗舰现状的真实写照。

就像布加迪用极致速度和性能定义超跑标杆一样,Alpha 1 系列就是那种秀肌肉的性能怪兽,几乎没有人可以同时触碰到它每个方向上的性能极限,这样的定位注定了它服务于专业的影视团队或是有着极致需求的摄影师,其将近五万的售价也证明了这一点。

▲ 图片来自 @索尼中国

那这台对我们普通人来说遥不可及的相机,它有意义吗?

我认为有。

现在,我们正处在摄影史上的一个关键时刻——在摄影诞生一百多年后,手机摄影这个新贵,凭借它的便携性和强大的算法杀入局中,让摄影这件事变得前所未有地亲民。

手机的加入是打压,短短十年就让相机市场逐步压缩,但另一个角度来说,手机阵营的加入也是一剂强心剂,整个摄影环境因为手机的加入,涌入无数新玩家。

相机和手机两大阵营也从最初的对立,逐渐进入了相互融合、相互学习的阶段,相机开始加入 AI 辅助成像,手机也学习相机厂商的色彩科学,你中有我,我中有你,任何一方阵营的技术突破,都有可能给对方带来新的灵感与方向。

影像的可能性,变得无限丰富。

回到具体的设备上,索尼 Alpha 1 II 这台「影像巅峰」离我们很远,不是一台普通人需要的设备,但我们又的确需要它们——正是这些有点遥远的设备,孕育着人们想像中的影像技术,只要技术有进步,就迟早会以某种形式,向每个用户普及。

我们每个人,都有可能因为某台「遥不可及」的设备诞生,在未来拍出更好的照片。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌