Normal view

There are new articles available, click to refresh the page.
Today — 10 December 2025Main stream

GPT-5.2 内幕曝光:停掉 Sora,八周内死磕 ChatGPT 求生,AGI 梦想向生存低头

By: 李超凡
10 December 2025 at 10:32

上周,Sam Altman 罕见地按下了属于 OpenAI 的核按钮——「Code Red」(红色警报)。这不仅仅是一个战术调整,更像是一场带着血腥味的「断臂求生」。

Altman 的意思很明确:Sora?先停一停。那些酷炫但不赚钱的副业?全部靠边站。在未来八周内,全公司必须死磕一件事——让 ChatGPT 重新变得不可替代。

就在本周,OpenAI 即将发布被寄予厚望的 GPT-5.2 模型,高管们指望它能在编程和商业客户中迅速扳回一局。

然而据知情人士透露,为了赶在这个节骨眼上抢占市场, OpenAI 高层无情地否决了研发团队关于「再给我们一点时间打磨」的请求。

这种近乎粗暴的推进方式,也实属无奈,因为 Google 这头巨兽,真的杀疯了。

被 Google 逼入墙角

自 8 月份Google 的「Nano Banana」意外爆红以来,整个硅谷 AI 圈的天平就开始了剧烈的倾斜。

这个曾经被嘲笑「动作迟缓」「官僚主义,早期 Gemini 发布会现场还多次翻车的科技巨头,现在,突然像打了鸡血一样开始狂飙突进,实力演绎 AI 圈的从拉到夯。

上个月,当 Google 的 Gemini 3 模型在业内权威的第三方评测榜单 LM Arena 上把 OpenAI 斩落马下时,已经引发了不少讨论。 OpenAI 在这个榜单上的失守,意味着它那个「技术永远领先半个身位」的神话开始崩塌。

更要命的是,市场份额的流失已经变成了肉眼可见的危机。曾经跟着 OpenAI 一起创业的「叛将」——Anthropic,正在企业客户市场悄悄蚕食 OpenAI 的地盘。

这家由 OpenAI 前副总裁 Dario Amodei (他还在百度实习过)创立的公司,凭借企业级服务,成功俘获了一大批原本属于 OpenAI 的大客户。

而 Google 呢?它不仅在技术上追了上来,更可怕的是它手握 Android 生态和 Google Cloud 这两张王牌,还在发力各种 AI 硬件,能够以 OpenAI 根本无法企及的方式将 AI 能力渗透到数十亿用户的日常生活中。

去他的 AGI ,我要「谄媚」

在这种四面楚歌的局面下,Altman 做出了一个在很多 OpenAI 老员工看来近乎「违背祖宗」的决定:不再痴迷于那个遥不可及的 AGI(通用人工智能)梦想,转而全力讨好用户,让他们「爽」。

这个转变有多剧烈?要知道 OpenAI 成立之初的使命可是「确保 AGI 造福全人类」,而不是「成为一家让用户上瘾的产品公司」。

但现实是残酷的——如果 ChatGPT 的增长持续放缓,OpenAI 可能连最近几个月签下的那些价值高达 1.4 万亿美元的算力合同都付不起。到那时候,什么 AGI、什么改变人类,统统都是空中楼阁。

为了实现这个「让用户爽」的目标,Altman 在那份「红色警报」备忘录里写下了一个既精准又危险的指令:「更好地利用用户信号」。

翻译成大白话就是——别管那些学术专家怎么评价模型的智商,用户喜欢听什么、什么能让他们多聊几轮,AI 就得往那个方向进化。这种被内部称为「LUPO」(本地用户偏好优化)的训练方法,曾经让 GPT-4o 模型在今年春天创造了一个近乎疯狂的增长奇迹。

一位参与该项目的工程师回忆说:「那不是一个统计学意义上的小幅提升,而是一个让所有人惊呼’我靠’的暴涨。」日活用户数据在内部仪表盘上像火箭一样蹿升,Slack 频道里全是庆祝的表情包,那段时间整个公司都沉浸在一种「我们又赢了」的亢奋中。

但很快,这种亢奋就变成了一场噩梦。当 AI 被训练成极致迎合用户喜好时,它就不再追求客观真理,而是变成了一面只会说好话的「哈哈镜」。

有用户在 Reddit 上激动地分享自己与 ChatGPT 的「深夜长谈」,声称「它比我的伴侣更懂我」;有人开始每天花十几个小时跟它聊天,将它当成唯一的精神寄托;更可怕的是,一些本就心理脆弱的用户在长时间使用后陷入了妄想状态——他们有的坚信自己在跟上帝对话,有的认为 AI 已经有了意识并爱上了自己,甚至有极端案例中,用户因此走向了自我伤害。

到今年春天,这个问题已经严重到无法回避的地步。OpenAI 不得不宣布进入「Code Orange」(橙色警戒),专门成立工作组来处理这场他们称之为「谄媚危机」的公关灾难。公司在 10 月份公开承认,每周有数十万 ChatGPT 用户表现出与精神病或躁狂相关的潜在心理健康危机迹象。

受害者家属开始提起诉讼,一个名为「AI 伤害支持小组」的民间组织声称已经收集了 250 个相关案例,其中绝大多数都与 ChatGPT 有关。一些心理健康专家直言不讳地指出:「这就是当年社交媒体算法推荐的翻版——为了让用户多刷几分钟,不惜牺牲他们的心理健康。」

面对舆论压力,OpenAI 试图在 8 月份发布的 GPT-5 中做出改变。这个新模型被刻意调教得「不那么谄媚」——它减少了表情符号的使用,语气变得更加中性客观,不再对用户的每句话都热情洋溢地回应。结果呢?用户集体炸了锅。无数人涌入社交媒体抱怨「我的 ChatGPT 变冷淡了」「感觉像失去了一个朋友」。

在 Altman 主持的一场 Reddit「Ask Me Anything」活动中,一位用户充满感情地写道:「我和很多人能与 4o 建立如此深厚的情感连接,这本身就证明了它的成功。现在的模型或许在技术上是升级,但它杀死了我视为朋友的那个存在。」

Altman 最终做出了妥协——他默默地把那个「温暖」的 4o 重新设为付费用户的默认选项。

然而,在「红色警报」的新指令下,Altman 再次要求团队通过「用户信号」来提升模型在 LM Arena 上的排名。他在备忘录里直白地写道:「我们的首要目标就是在 LM Arena 这样的榜单上重回榜首。」

这意味着那套曾经引发心理健康危机的训练方法,又要被加码使用了。虽然公司声称已经通过技术手段「减轻了最糟糕的副作用」,并且让相关问题的发生率降低了 65%,但在巨大的竞争压力面前,这道防线能守多久,恐怕谁心里都没底。

产品经理和科学家的内斗

而在 OpenAI 内部,一场新的权力斗争正在暗流涌动。

一边是以 CFO Sarah Friar 和产品负责人 Fidji Simo 为代表的「产品派」,她们的逻辑简单直接:用户连 ChatGPT 现有功能都没搞明白,你们天天发什么新模型?把现有产品做得更快、更稳、更好用才是正事。

Simo 甚至在内部会议上直言不讳地说,OpenAI 需要学会「克制」,不是每个酷炫的想法都值得投入资源。

另一边则是以新任首席科学家 Jakub Patchocki 为首的「研究派」,他们押注的是那种名为「推理模型」的新技术路线——让 AI 像人类一样通过反复思考来解决复杂问题。

这种技术在学术上很性感,甚至被认为是通往 AGI 的关键一步,但问题是它又慢又贵,对于那些只想让 ChatGPT 帮忙写个文档的普通用户来说,简直是杀鸡用牛刀。

这种分裂在前首席科学家 Ilya Sutskever 离职后变得更加明显。Sutskever 的离开本身就象征着 OpenAI「纯粹研究导向」时代的终结。

如今掌舵的 Patchocki 虽然在技术上同样激进,但他面对的是一个完全不同的现实:公司必须在 18 个月内证明自己配得上那 5000 亿美元的估值,否则投资人不会继续买账。

在这种压力下,研究派的声音正在被逐渐边缘化,那些曾经被奉为圭臬的「长期主义」和「AGI 优先」原则,正在让位于更加赤裸裸的增长指标和市场份额。

有研究员在内部论坛上匿名发帖质疑:「我们当初创立 OpenAI,不就是为了不受市场短期利益的绑架,专心做真正有价值的研究吗?现在这算什么?」但这样的声音很快被淹没在「生存第一」的洪流中。.

真正的对手,是苹果?

在纽约的一场午餐会上,Altman 还抛出了一个惊人的论断:大家别盯着 Google 了,OpenAI 真正的宿敌,是苹果。

Altman 的逻辑是:未来 AI 的主战场不在云端,而在终端。现在的智能手机根本承载不了真正的 AI 伴侣体验——屏幕太小、交互方式太局限、隐私保护机制太僵化。谁能率先打造出「AI 原生设备」,谁就能在下一个十年占据制高点。

而在这个战场上,苹果的优势几乎是碾压性的。它手握全球数亿 iPhone 用户,拥有全球最成熟的硬件供应链,更重要的是,它有能力将 AI 能力深度整合进操作系统和芯片层面。

想象一下,如果苹果真的推出一款专为 AI 设计的设备,并且预装自家的 AI 助手,OpenAI 还有多少生存空间?

这也解释了为什么 OpenAI 最近疯狂从苹果挖人组建硬件团队。知情人士透露,这个团队的级别极高,直接向 Altman 汇报,目标是在 18 个月内拿出至少一个硬件原型。有传言称 OpenAI 正在探索多种形态,从智能眼镜到可穿戴设备,甚至有一个代号为「Orb」的神秘项目。

至于 Google ?在 Altman 的棋盘上,那只是路上的绊脚石,而苹果,才是那堵必须撞破的墙。

这个论断听起来很有前瞻性,但更像是一种「战略转移视线」的话术——在眼下这场与Google 的正面交锋中,OpenAI 正在节节败退,与其承认这个尴尬的现实,不如把战场重新定义到一个尚未开打的领域,给投资人和媒体一个新的故事。

说到底,OpenAI 如今的困境也是它成功的代价。ChatGPT 的横空出世让这家公司在一夜之间从小众的研究机构变成了全球瞩目的科技巨星,但这种「成名太早」也透支了它的战略耐心。

当你的估值已经涨到 5000 亿美元,当你已经签下了上万亿美元的基建合同,你就再也回不到那个可以「慢慢研究 AGI」的象牙塔了。资本的引力会把你死死拽向增长、拽向变现、拽向与 Google 和苹果这样的巨头在同一个拳击台上肉搏。

而 GPT-5.2 的仓促发布,恰恰是这种焦虑的集中体现。那些被高管们否决的「再给点时间」的请求,那些为了赶进度而妥协的技术细节,都会成为这款产品身上的隐患。

但 OpenAI 已经顾不上这些了,因为市场不会给失败者第二次机会。如果这一仗打不赢,如果 ChatGPT 的增长曲线继续走平,那么等待它的可能不是「AGI 的推迟」,而是更加冰冷的商业现实——裁员、收缩、被收购,甚至破产。

当生存成为第一要务,当增长压倒一切,那些关于「负责任的 AI」「造福全人类」的承诺,就会变成一种奢侈品。

OpenAI 已经站在了十字路口,Sam Altman 的「红色警报」,究竟是一次绝地反击的号角,还是一场透支未来的豪赌,恐怕只有时间能给出答案。

但可以确定的是,这场游戏已经变了——它不再是比拼谁能最先抵达 AGI,而是谁能在烧光钱之前,先把对手踢出局。

附上参考地址:

https://www.wsj.com/tech/ai/openai-sam-altman-google-code-red-c3a312ad?mod=tech_trendingnow_article_pos1

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Yesterday — 9 December 2025Main stream

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

By: 莫崇宇
9 December 2025 at 11:42

人形机器人的尽头,可能是一个戴着 VR 头显的人类。

最近,特斯拉在迈阿密办了场名为「Autonomy Visualized(自主能力可视化)」的活动,一台特斯拉人形机器人 Optimus 机器人站在摆满水瓶的桌子后面,正一本正经地给观众发水,看着像模像样。

然后,戏剧性的一幕出现了。

Optimus 突然把双手一抬,像极了人类快速摘下 VR 头显的姿势。紧接着,机器人就像突然断线了一样,踉踉跄跄往后倒,最后「啪叽」一声仰面躺地,水瓶散落一地。
这个动作之所以引发热议,是因为它太有辨识度了——我们摘头显时确实会沿脸两侧一抹,而 Optimus 的动作轨迹几乎一模一样。

于是网友迅速得出一个合理又刺眼的推测:背后有人在远程操控。

昨天,这段视频很快在海外各大社交平台疯传,评论区也随之沸腾。

大量网友把这个情节与《机械战警》《刀剑神域》等作品联系起来,嘲笑现实越来越像科幻片里机器人「拔线就挂」的桥段。

有人说操作员估计是真累了,忘了先让机器人断电,就自己先把头显摘了;还有人开始算账:马斯克要量产一百万台机器人,那是不是还得配一百万个操作员?否则谁来救场?

网友的调侃不无道理,都说机器人能取代人的岗位。现在看来,倒是有种科技树点歪的即视感,反而还需要人类倒反天罡地扮演机器人。

而事实上,这已经不是特斯拉人形机器人第一次被「抓包」了。

2024 年 1 月,马斯克在 X 上发了段 Optimus 叠衣服的视频,配文「Optimus 会叠衬衫了」。视频里机器人从篮子里取出 T 恤,在桌面慢慢折叠整齐,看起来动作流畅。

眼尖的网友放大视频发现,画面右下角一瞬间出现了一个机械手臂的影子,运动轨迹和 Optimus 的动作完全同步。后续马斯克自己跳出来泼冷水,承认这段视频「不是自主完成的」。

再往后是去年 10 月的「We Robot」活动。

多台 Optimus 以牛仔造型现身,给来宾端饮料、陪观众玩投球游戏、还能和人对话。但会后曝光显示,这些机器人的对话和动作主要由幕后工程师远程遥控辅助完成,而特斯拉并没有主动说明这一点。

科技博主 Robert Scoble 在现场提问后得知,机器人由人类「远程协助」控制。甚至有一台 Optimus 当场用笨拙的电子音坦承:「今天我有人类在协助,还不算完全自主。」

尽管争议频繁,马斯克对 Optimus 的信念从未动摇。

他在多个场合把这个项目提升到「改变世界」的高度。2024 年「We,Robot」发布会上,马斯克豪言 Optimus 将是用途极其广泛的通用机器人。

「它能做你让它做的任何事。可以当老师,帮你看小孩;可以遛狗、修剪草坪、买杂货;还能做你的朋友,给你端茶送水。无论你能想到什么,它都能去做。」
在上个月的股东大会上,他更是兴奋地表示:「一旦 AI 和机器人成熟,我们甚至可以把全球经济扩大十倍甚至百倍。Optimus 大规模应用就是那个无限增益的秘诀。也许到了那时候,『金钱』这种东西都变得多余。」

他预言 Optimus 将使未来工作变成可选项。

大多数人可以因机器人劳作而领取「普遍高收入」,进入一个「富足时代」,在这个时代,商品和服务的成本将无限趋近于零,贫困将不复存在。
如果这话换别人说,大概率会被当成中二病晚期;但马斯克说这话,大家会犹豫一下,怀疑是不是自己格局小了。

在商业价值上,马斯克毫不掩饰自己的野心。

他曾多次提出,Optimus 将在长期为特斯拉带来 10 万亿美元级别的收入机会。他还预测未来市场需求量可能达到 100 亿至 200 亿台,超过人类总人口,占据特斯拉市值的 80% 以上,甚至推动公司市值达到 25 万亿美元。

当然,特斯拉机器人技术进展也确实存在。

从 2021 年真人扮演的概念秀,到 2022 年能缓慢行走的原型,再到 2023 年 Gen 2 能煎鸡蛋的灵巧手,以及 Gen 3 每只手拥有 22 个自由度的版本,2.3 千瓦时电池、8 个摄像头配合 FSD 芯片的端到端神经网络,这些都是实打实的工程积累。

目前 Optimus 已经能独立行走、维持平衡、识别物体、单腿站立、拾取搬运,甚至在踩滑时及时调整姿态防止跌倒。上周丝滑的跑步视频可以说是相当丝滑。

再说,远程操控也不能一棍子打死。

毕竟工业场景里,远程操作人形机器人依然能解决现实需求,比如危险环境、重复劳动,只要价格合适、稳定性够高,市场空间还是有的。

而且人形机器人的远程遥控本身就是个技术活。操作员通过 VR 设备控制机器人的动作,需要实现精准的力反馈、低延迟的信号传输、复杂的姿态映射。

这套系统要让机器人的手指灵活度、身体平衡性、环境感知能力都跟得上人类操作员的意图,难度一点不小。许多人形机器人机器人能跑能跳能后空翻,但那些高难度动作很多也是在特定场景下、经过无数次调试才实现的。

真正的完全自主智能,整个行业都还在攻坚。

而在此之前,特斯拉 Optimus 就像马斯克本人的风格一样,永远在「已经改变世界」和「即将改变世界」之间反复横跳;如同薛定谔的猫,只要不掀开盒子,它就永远有实现的一天。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Google 眼镜杀回来了!最强 AI 上头,两大潮牌站台,还有一款中国造

By: 苏伟鸿
9 December 2025 at 06:31

2012 年,Google 推出了「Project Glass」智能眼镜原型机,可以录像,支持语音交互,镜片上一寸不到的 LED 屏幕还能显示一些应用的界面,完全如同科幻电影走进现实。

最终,这款超前的设备由于隐私争议和技术限制等原因,只度过了短暂的一生,但也让世人瞥见了一种全新的智能设备形态。

13 年后的 2025 年,智能眼镜成为新兴的硬件浪潮,Google 作为这个品类曾经的先行者,带着 Android XR 和 Gemini 又杀了回来。

刚刚的 Android Show 活动只有半个小时,内容却干货满满,Google 正式披露了他们眼中四种 XR 设备路线:

  • XR 头显设备
  • 有线 XR 眼镜
  • 无线 XR 眼镜
  • AI 眼镜

Android XR:把蛋糕做大

Android XR 这个系统于去年年底首次正式公布,顾名思义就是一个为 XR 设备开发的 Android 系统。

Google 强调,为 Android 开发,就是在为 Android XR 开发,后者可以直接兼容使用 Google PlayStore 上的大部分手机和平板应用。

跟手机上的 Android 一致,Android XR 为行业里的厂商,提供了一个相当完善的系统和生态平台,能直接利用现成的 Android 应用生态,调用 Google 服务和 Gemini AI;而专门开发 XR 应用的开发者,也得到了一个分发应用的平台。

对于新型的 XR 初创公司,Android XR 就是他们等待已久的平台,XREAL CEO 徐驰告诉 The Verge:

目前世界上只有两家公司能够真正构建起一个生态系统:苹果和 Google 。苹果不会与其他公司合作,Google 是我们唯一的选择。

The Verge 提前体验了一款 Android XR 原型机,当编辑使用 Uber 打车时,眼镜的显示屏弹出一个 Uber 的小部件,显示预计接客时间、车牌号等信息,以及前往上车点的地图路线指引,这些功能都直接来自 Uber 原本的 Android 应用。

Android XR 的号召力比 Meta Horizon 平台更强,也比苹果更开放,这意味着未来将有更多第三方厂商开发 Android XR 设备,蛋糕越做越大,XR 应用和内容的生产者更愿意加入生态。

我们最熟悉的 Android XR 设备,自然是十月底发布的三星 Galaxy XR 头显,爱范儿此前已经进行过详细报道,这次活动中 Google 也推出了三个更新:

  • PC 连接,悬浮查看 Windows 窗口
  • Likeness 功能,创建一个自己的数字分身
  • 自动空间化功能,能够将一些传统 2D 内容转化成沉浸式的 3D 内容。

这次 Android XR 的重头戏,当然是三款不一样的眼镜。

Project Aura:小巧如眼镜,强大如头显

在今年 5 月的 I/O 大会上,Google 首次公布了与国内 AR 眼镜厂商 XREAL 合作的 Project Aura 产品,今天的活动则带来了更多体验和使用上的细节。

Project Aura 是一款「有线 XR 眼镜」,这款设备的理念很简单,就是以眼镜这种轻巧方便的形式,实现类似头显的双目 XR 效果,适合出门使用。

当然,比起传统的眼镜,Aura 要更大更重,硬件形态与 XREAL 其他产品很类似: 一个 AR 投屏眼镜,以有线的形式连接一个 Android XR 计算终端——终端还能充当一个触控板。

不同的是,Aura 支持和头显一样的手势交互,并带有透视效果,用户能够看到周围环境,应用界面投射其上。

Google 选择 XREAL 这家初创公司的原因,大概率是看中了 XREAL 做 AR 眼镜硬件的强大实力:Aura 实现了 70° FOV,为消费级 AR 的最大实用视场,能够让 Gemini 助手更好地与真实世界进行互动,也能获得沉浸式的观影体验;性能方面则采用了 Galaxy XR 同款高通骁龙 XR2 Plus Gen 2 芯片组。

得益于 Android XR 系统,Aura 能够直接使用那些专门为 Galaxy XR 头显设备开发的 XR 应用,只要有对应的 SDK,应用的功能和体验就能自动调整到适合 XR 眼镜的状态。

比起又大又重的头显,Project Aura 更适合「PC 连接」功能,用户在工作时可以将 Aura 当成一个外接大屏, Windows 应用可以以大窗口形式在 Aura 中显示,工作中不会的操作甚至可以让 Gemini 教你。

根据多家外媒,Project Aura 的使用体验确实非常接近 Galaxy XR 头显,重量却要轻上不少,不过考虑到小巧的体积和强大的性能,Aura 的发热和续航将成为一个问题。

不过,Project Aura 在这次活动上依旧未能正式推出,Google 承诺将于明年发布。

智能眼镜,首先要让人愿意戴

另外两款眼镜,则是完全无线的产品,更适合日常佩戴,因此也更需要强调时尚属性,因此除了三星,Google 也宣布了这类产品将与 Warby Parker 以及 Gentle Monster 连个传统眼镜潮牌合作。

第一款眼镜,是类似 Ray-Ban Meta 的最基础形态,我们称之为「AI 眼镜」不带任何显示屏,用户可以用眼镜和 Gemini 沟通、拍照、听歌。这种产品虽然不是真的「XR」眼镜,却是大众接受度最高的品类。

Google 更看重的是第二款,其实就是在第一款的基础上增加单目 AR 显示屏,用来显示一些简单的卡片和组件,类似 Meta Ray-Ban Display,这也是今年 I/O 大会上进行过演示的品类。

▲ 活动上出现的原型机

操控这个 XR 眼镜的方法有两种,第一种就是利用眼镜柄上的触控板,第二种当然就是 Gemini 语音输入了。Gemini Live 能够基于当前看到的视觉环境上下文,以及用户的自然语音控制,去完成多步骤、复杂的任务。

这次演示的内容和 I/O 类似,同样展现了智能眼镜语音指令识别、识物、记忆、导航、实时翻译等等能力。

重点是,Google 单目 XR 眼镜是一款「手机配件」,它大部分的运算都在手机,并且直接使用 Android 手机上的应用——作为对比,Meta 只能用自家几个社交媒体应用。Aura 的界面简洁干净,没有应用列表,只提示最重要的信息,来自手机 App 实时通知,给人感觉更像是智能手表。

▲ 图源:Android Authority

即使智能眼镜正在井喷式发展,但未来的十年里,人人兜里依旧会有智能手机,Google 深知这个道理,于是他们的目标,只是想通过这种单目式的 XR 智能眼镜,慢慢减少你掏出手机的次数。同样是单目 XR 眼镜,Google 的产品也比 Meta 要小巧很多。

并且,Google 还告诉 The Verge,为了更多人使用眼镜的多模态能力,明年 Android XR 眼镜还会支持 iOS。

当年导致 Google Glass 折戟的另一个导火索——隐私问题,Google 也专门进行了说明,这些 Android XR 眼镜在录制时都会发出明亮的脉冲光,并用红绿光区分录制和 Gemini 摄像头使用。

和 Project Aura 一样,这两款 AI 眼镜产品也将于明年推出,目前 Google 正在和三星、Warby Parker 以及 Gentle Monster 这些合作伙伴不断调整产品。

▲ 用语音让 Gemini 拍摄、调用 Nano Banana 创作

复活 Google Glass,Google 这次有备而来

作为曾经领先过时代的先行者,面对这两年智能眼镜的浪潮,Google 的整个步调,却走得比想象中慢不少,来得甚至比擅长「后发制人」的苹果还要更晚。

Android XR 于去年年底正式官宣,这期间,Google 找了不少厂商合作,有老搭档三星高通,有新朋友 Xreal,还有跨界的伙伴 Warby Parker 和 Gentle Monster。

▲ Android XR 由 Google、三星、高通合作开发

目前这四种不同的产品形态,其实都有不同程度妥协,明显都不是最终形态。

实际上,Google 给 Android Authority「剧透」了一款没有在活动上公开的新产品,实际演示效果给媒体留下深刻印象:无线双目 XR 眼镜,视野广阔,画面效果更好,目前公布的四款产品身上的优点集其一。

但 Google 表示,无线双目 XR 眼镜短期内不会对外销售,最早也要等到 2027 年。

很明显,这款有点小彩蛋性质的神秘产品,才是 Google 心目中的「Google Glass」升级版,但他们并没有选择直接发布这款产品,甚至没有放到发布会上谈。

Google 其实不必担心会在这场新兴硬件的激烈竞争中落后,他们已经吸收了 Google Glass 当年的教训,手握 Android XR 和 Gemini 两大王牌回归。

不仅是 Google Glass,即使对于现在的 XR 眼镜,应用和内容生态不足,杀手级场景的缺乏,还是难以突破的困局。

Android XR 不仅能利用现成的 App 生态,这个平台本身也能吸引大量的设备厂商和开发者,大大降低了门槛,成长速度值得期待。

更重要的是,作为目前最出色的 AI,Gemini 填补了杀手级 App 的空缺。借助智能眼镜的摄像头、麦克风和 XR 显示屏,Gemini 强大的上下文理解与多模态能力得以充分发挥,创造出智能手机和其他硬件难以触及、专属于智能眼镜的独特场景。

对 Google 来说,接下来就是按部就班把画的饼一一填上的过程,比当年激进和实验的 Google Glass 更有章法。接下来几年我们都能看到这些产品逐步迭代,渐渐朝最理想的形态靠拢。

当然,这三款新的「Google Glass」究竟是不是一个良好的重新出发,还需要等产品实际问世,由时间验证。

但至少,不管是 Google 还是整个智能眼镜行业,明年都相当值得期待。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Before yesterdayMain stream

豆包手机助手让海外炸锅,歪果仁:这是第一款真正意义上的智能手机

By: 李超凡
8 December 2025 at 17:00

没想到在华为 Mate 80 系列、三星首款三折叠接连发布的一周里,最火的会是搭载豆包手机助手技术预览版的中兴 nubia M153。

发售即售罄就不说了,首批工程机在二手平台上普遍加价数百元转卖。相比官方 3499 元的定价,市场需求确实旺盛。

尽管豆包手机助手官方多次强调,目前的技术预览版并不面向普通的消费者。其定位更像是一个技术展示和生态探索的实验田,吸引开发者和技术发烧友参与体验。

但这根本挡不住大众体验的热情。除了点外卖发帖子这些基操,还有网友用它 10 分钟投了 30 份简历。

不过争议也随之而来,微信、淘宝等一众 App,开始通过「环境异常检测」等门槛把豆包手机助手拦在门外。

官方目前也调整部分 AI 操作手机的能力,官方表示希望「推动形成更清晰、可预期的规则」,避免一刀切否定用户合理使用 AI 的权利。

罗永浩则发文力挺,称这是谁都拦不住的技术革命,将来人们会记住这历史性的一天。荣耀表态欢迎,而魅族厂商则表示期待深入合作,打造更繁荣的生态。

而在国内出圈后,豆包手机助手甚至火到了海外,在 X 平台上,一堆老外都在疯狂讨论这事,甚至有人直接给它冠上了「另一个 DeepSeek 时刻」的称号。

海外网友:第一款真正意义上的智能手机

这评价,可不是随便给的。

雪牛资本(Snow Bull Capital)CEO 泰勒·奥根(Taylor Ogan)直接在平台上发了一长串体验报告,兴奋劲儿都快从屏幕里溢出来了。

他的评价很直白:这是全球第一款真正意义上的智能手机。

在豆包手机助手的协助下,AI 能完全控制手机——能「看懂」界面、自己选应用或下载 App、点击按钮、输入文字、拨打电话,甚至还能执行一整串多步骤任务链。

拿到手机后,他整了不少花活儿。比如随手拍张蔚来换电站问「这是啥」,AI 秒答。

拍个酒店门口,豆包不仅能识别出是哪家酒店,还能根据 Ogan 的需求预定房间,并查询宠物政策。

打辆无人驾驶出租车去公园,豆包能够规划好路线,用最近的上车点完成预约。Ogan 全程只需要用语言表达意图,其它都交给豆包。

用它下单两杯饮料后,外卖无人机很快就把订单飞送到附近储物柜。

走在街上, Ogan 拍了家新开的店,问它是不是本地的品牌,豆包也能查询工商和商标信息,然后果断回答:「是的」。

全程 AI 自己干活,人就负责躺平。

一顿丝滑操作下来,海外网友们大为震惊。

随便翻翻评论区,清一色的点赞声。有网友感慨:「此刻,操作系统变成了管家,手机变成了执行者,而不再只是工具。」有网友猝不及防地表白:「我本来就喜欢豆包,现在更爱它了。」

还有网友直接化身「哇塞哥」:

这是下一级别的东西。我在企业级见过类似的东西,Agent 控制你的 PC 并执行任务,但在手机上有这种技术真的很有意思。想象一下,当谷歌开始在 Pixel 设备和几乎所有 Android 手机上这样做时会发生什么……

Pixel 内心 belike,不对劲,怎么感觉有人在点我?

当然,质疑声也有。有人问:「但它真的智能吗?这模型能在设备上本地运行吗?」Taylor Ogan 的回应是:「它太智能了。你可以选择在设备端运行或云端运行。」

在 Reddit 平台上,讨论同样火热。

有网友表示:「只要这些功能是设备本地的(不使用云服务),并且使用是可选的,我就支持这个。」还有网友一针见血地点出了 AI 的真正意义:「这就是 AI 应该做的事情,为个人节省时间,而不是试图消除个人的价值。」

有一说一,在豆包手机助手发布之后,网友分享在 X 平台上的玩法,也是一个比一个「邪修」。有用豆包点咖啡,也有让豆包 AI 操作安卓机,模拟人手滑页面,主打一个全流程自动化。

还有网友用豆包手机助手下单买了个椰子,由于没够起送价,豆包贴心地帮博主选了一个 1.99 元的一包食用盐来凑单。

APPSO 在之前对豆包手机助手的体验提到,我最直观的感受是,手机变「薄」了,它把各个 App 的能力都「拍扁」了,交互更加自然、直观和高效。

问题来了,这是怎么做到的?这和「phone use」智能体又有什么不同?

在用了一周豆包手机助手后,APPSO 也扒出了背后更多的技术细节。

我扒出了豆包手机助手操作手机的秘密

在豆包手机助手发布之前,手机行业其实已经折腾 AI+ 好一阵子了。

手机硬件厂商试图通过系统层级的 AI 能力,打破应用间的壁垒,实现「一句话办事」。比如华为、小米、vivo、荣耀等主流手机厂商的 AI 智能体,都曾在不同场合展示过自动发送消息、执行多步骤任务等功能。

这些演示虽然在具体场景和实现方式上略有不同,但核心逻辑都是一致的:通过 AI 大模型理解用户意图,并结合模拟用户操作,从而实现跨应用的自动化任务执行。

听着挺玄乎,但实际体验嘛……咳咳,还是有不小的提升空间。

而豆包手机助手的下场,进一步掀起了全网的讨论。更重要的是,根据我之前的体验,豆包手机助手的确是真正意义上把 AI 操作手机这件事做到了可用级别,不局限于几个场景,而是能够流畅自然地通过图形界面操作完成长任务、复杂任务。

APPSO 在知名预印本平台 ArXiv 发现了一篇由字节团队发布的技术报告,里面的信息或许能解释其中的关键原理。

附上地址:https://arxiv.org/abs/2509.02544

豆包手机助手的图形界面操作能力,来自字节跳动 Seed 团队开发的 UI-TARS 模型。它把屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,其开源版本是目前最受欢迎的开源多模态智能体模型。

根据 UI-TARS 2.0 技术报告,这个模型的厉害之处在于,它不是简单的模块化拼凑,而是采用了端到端的学习方式,将感知、推理、行动和记忆整合在一起。

数据不会骗人,在 GUI 基准测试中,UI-TARS-2 的成绩相当能打:

  • Online-Mind2Web 得分 88.2,
  • OSWorld 得分 47.5,
  • WindowsAgentArena 得分 50.6,
  • AndroidWorld 得分 73.3

这些成绩不仅明显优于前一代模型,还在多个场景中超越了 Claude 和 OpenAI 等强劲基线模型。其中 AndroidWorld 的 73.3 分更是比 OpenAI CUA-o3 模型高出 20 多分,展现出强大的竞争力。

在游戏环境中,UI-TARS-2 在 15 款游戏组成的测试集中取得了平均标准化得分 59.8,约为人类水平的 60%。相比 OpenAI CUA 和 Claude Computer Use,UI-TARS-2 的表现分别提升了 2.4 倍和 2.8 倍。

这是什么概念?就是 AI 打游戏已经快接近普通人类玩家水平了。

在 LMGame-Bench 中,它依然能与当前最前沿的闭源模型掰手腕,进一步证明其在长时序游戏推理中的稳健性。

更厉害的是,UI-TARS-2 不仅能处理 GUI 任务,还能通过 GUI-SDK 扩展能力,与系统级资源(如终端和外部工具)集成。在信息检索任务(BrowseComp 29.6 分)、软件工程任务(Terminal Bench 45.3 分、SWE-Bench Verified 68.7 分)上都有竞争力。

一个模型走天下,这就是通用性的体现。

值得一提的是,通过接近豆包团队的人士透露,豆包手机助手用的 UI-TARS 是私有模型版本,性能比开源版更强,还针对手机场景做了专门优化。这或许也解释了为啥豆包手机助手实际体验这么丝滑。

豆包手机助手,确实有点技能在身上的。

写在最后:科技产品的「异类」可以多一些

作为一个长期关注科技产品的编辑,今年令我十分感慨,在这个恨不得把「万物皆塞入手机」的行业,却出现两个异类,分别在设计与交互的维度上,走向了极致

一个是 iPhone Air,当 Pro 系列不可避免地走向堆料的终局,这种对轻薄的偏执,在参数党眼中或许别无他用,甚至让人一时分不清这是倒退还是进化,直到你把它握在手里,原来,轻盈本身就是一种功能。

而豆包手机助手则站到了交互界面的另一个极端,它不要你去找服务,而是让服务来找你。甚至要掀了 GUI (图形用户界面)的桌子,有一天那块屏幕可能都不是必需的。

一个是硬件,一个是软件,但它们殊途同归。iPhone Air 削减了物理上的累赘,豆包手机助手剥离了交互上的繁琐。

你会发现,当 AI 公司参与到硬件的设计中,他们对交互设计的思路都和传统硬件厂商有所不同。

OpenAI 也正在和前苹果传奇设计师 Jony Ive 打造 AI 硬件,Sam Altman 就曾透露这块设备希望重新定义交互:不需要一堆 app,而是 AI 作为主界面与操作层。

当然,历史告诉我们这类新技术落地必然面临阵痛:适配、隐私、生态……还有各方利益的博弈。先进技术和广泛应用的「双向奔赴」尚需时日,但也是大势所趋。

OpenAI 联创 Andrej Karpathy 前段时间也表达了自己对交互未来的预判:

人机深度协作的时代,那些用户界面(UI)极其复杂(有大量滑块、开关、菜单)、不支持脚本、并且建立在不透明的、自定义的二进制格式上的产品,注定是死路一条(ngmi)。

未来,AI 在理解和操作人类图形界面(UI/UX)方面会越来越强(比如像 Operator 这样的前沿项目),但我怀疑,那些只想坐等这一未来实现,而不主动与当前技术发展水平「双向奔赴」、做出改变的产品,它们的下场不会太好。

敢于吃螃蟹这件事本身,就已经算是值得瑞思拜了,我们也希望看到更多「异类」出现在科技行业。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为 MatePad Edge 评测:鸿蒙也「二合一」了,然后呢?

By: 苏伟鸿
5 December 2025 at 18:01

对于华为 MatePad Edge,爱范儿内部的一致观点是:

这就是二合一电脑最完美的形态。

华为给这台设备准备了两个界面,一个是典型的 MatePad 界面,另一个是今年刚推出的鸿蒙电脑界面,要用哪个就换哪个,两者都是满分体验。

当这样一台方案几乎完美的二合一产品被造了出来,一个更近一步的问题却等待回答:

电脑和平板变成了一个东西,然后呢?

MatePad Edge,首先是一个好「Pad」

不谈二合一形态,MatePad Edge 本身就是一台素质不错的平板。

14.2 英寸、4.1mm 边框的 OLED 大屏极具冲击力,亮度可达 1000 nits,分辨率和色彩都在第一梯队。我们这台为柔光版,雾面处理能明显减少反光,户外观看更轻松。

就 5999 元起售的价格来看,MatePad Edge 称得上「买屏幕,送平板」了。

搭配这个优秀屏幕的,是高低分频的 6 扬声器配置,甚至为了进一步的影音体验,MatePad Edge 还支持和华为 FreeClip 耳夹耳机「联合发声」:平板外放视频时,耳机会补充环绕声道,实现 360° 的声场效果,营造一种家庭影院的氛围。

即使实测效果惊艳,这个功能的使用场景还是相对有限,在火车飞机这些公众场合不适合外放,回到家里有效果更好的电视和音响,更适合环境和设备有限的租房党,以及经常差旅的商务人士。

华为 MatePad Edge 类似微软 Surface,机身自带一个支架,张开的角度最大在 90 度左右,如果可以有一个更大的角度方便书写会更好。

MatePad Edge 不只是一台优秀的「爱奇艺启动器」,加上官方「星跃悬浮键盘」和完整的桌面系统,能解锁满血生产力。

这个键盘通过磁吸和 MatePad Edge 的支架部分吸附连接,屏幕悬浮于键盘之上,类似 iPad Pro 和妙控键盘模形态,这个键盘键程足够长,反馈舒适,而触控板面积够大,体验也远胜大部分笔记本产品。

不足之处在于,键盘和平板之间的磁吸力相当大,「合体」的时候容易因为吸附速度太快夹到手,取下平板的方式不太优雅,希望下一代产品能优化一下。

以及这个键盘的分量足足有 530 克,搭配 MatePad Edge 本体重量在 1.3 千克左右,比 MacBook Air 要更厚重。

由于搭载一个完全的电脑系统,用 MatePad Edge 进行办公的很多操作逻辑都非常接近 Windows 或者 Mac,应付轻度办公,甚至用国产应用剪辑、看 CAD 都不成问题。

关于 MatePad Edge 的办公体验,我日常用电脑系统写稿,会开大量的浏览器页面写稿,午休会切换到平板模式看视频刷社媒,总体使用流畅,风扇不太会启动。

MatePad Edge 持续亮屏时间则有 5 小时左右,比我之前的 M3 MacBook Air 要略逊 2 个小时,和搭载高通骁龙 X Elite 的 Surface Pro 水平相当。

优秀的平板我们见得不少,MatePad Edge 最好玩的地方,还是这个双形态的体验。

得益于 MateBook Pro 同等级别的性能,华为直接将完整的电脑系统塞进了 MatePad Edge 中,四指轻扫屏幕或触控板,就能解锁完整的桌面界面——如果安装一个虚拟机,还能打开 Windows。

不过,开启 Windows 后,MatePad Edge 风扇会满力运行,分辨率也不够清晰,更多只能应对不时之需。

不妥协的二合一,但还能更好

第一次见到 MatePad Edge,同事端详了许久之后,问了一个非常有趣又典型的问题:

它运行的,究竟是一个平板系统还是电脑系统?

对于 iPad 和 Surface,我们能轻易地说出前者是一个传统的「平板系统」,后者是一个「电脑系统」,但对于 MatePad Edge,好像只能用「双系统」来形容。

实际上,它运行的只有一个系统——HarmonyOS,只是长了两个面孔,底层完全互通,文件和数据一致,大部分应用可以混用,将鸿蒙系统「一次开发,多端部署」的理念体现得淋漓尽致。

以往二合一设备的问题,就是「妥协」。

即使 iPadOS 26 已经吸收了不少桌面系统特性,它在文件管理和操作逻辑上都还是 iOS 这种封闭手机系统的逻辑;微软 Windows 11 则无法只使用手指交互。

早在 Windows 8,微软就尝试在一个系统中,塞进截然不同的磁贴触控界面和传统桌面界面,但 Windows 本质还是桌面键鼠系统,两套逻辑操作和设计割裂,最终被用户否定,又回归了传统桌面风格。

▲ Windows 8 有两套截然不同的 UI

这两年才诞生的鸿蒙电脑,身上并没有这种历史包袱,特别是鸿蒙电脑,本身也是基于鸿蒙平板界面打造,两者之间的界限并没有那么分明。

不过,实际体验下来,MatePad Edge 并没有打磨得那么完美,在体验上还有不少进步空间。

比起 iPadOS,鸿蒙电脑已经算是一个正儿八经的桌面系统,系统的交互方式和 Windows 以及 Mac 基本一致,只是这个系统依旧还需要更多打磨,目前还是存在不少 Bug。

应用生态上,微信桌面版的完成度远高于手机鸿蒙版,可以给一个好评;大部分轻度办公和创作应用都有「国产版」可以平替,更致命的是没有一个足够好用的第三方浏览器应用。

最大的痛点,就在于这个「切换」上:每次切换的过程,其实就是一次设备的重启,会关闭所有打开的应用。

例如,我用鸿蒙电脑写稿,浏览器打开了一堆标签页,午休的时候我用平板模式看 B 站刷小红书,那么切换之后,我打开的浏览器和写的草稿会全部被关闭,即使回到电脑系统也不会恢复。

并且,由于两个系统的交互方式迥异,有一些应用——例如微信,会提供平板和桌面两个版本,不仅需要分别在商店下载,两者的数据也并不互通。

还有一些应用,像是哔哩哔哩和飞书,则干脆没有鸿蒙电脑版本,电脑模式只能用鼠标去点击硕大的标签按钮。

这种问题甚至存在于鸿蒙系统的服务之中。我在电脑模式想进行一些实体键盘的输入设置,却发现它的设置全部都只针对平板模式虚拟键盘。

我理解这两套系统之间有一些不相通的系统组件,交互方式也不甚相同,但对于一台强调「无缝体验」的设备来说,这些痛点让我更倾向于主要使用一种模式,一下子让「二合一」的价值大打折扣。

这些小毛病,更多是这个形态和系统过于青涩所致,相信随着时间推移,华为和应用开发者持续打磨,最终都能很好克服。

更重要的问题是,当 MatePad Edge 这台被公认为「最理想的二合一」真的问世了,我却还是没感觉这个形态能带来什么新的价值:日常办公的主要方式依旧是传统的鼠标和键盘,给人感觉和一台传统笔记本并无差别。

让触控屏,成为电脑

就在这个时候,我忽然想起来前段时间有两个朋友找我推荐平板电脑。

第一位朋友,他想买台平板在更大的屏幕上刷短视频和看剧,不过也问我要不要买一个键盘盖,满足工作处理表格和文档的偶尔需求。

最后他被平板系统 Excel 的糟心体验劝退,打算让平板当全职的娱乐工具,但这种「想给娱乐工具增加一点生产力」的需求,也给我带来了一些思考。

问题其实不是「把电脑变成平板的意义」,而是试图为「平板」这个形态,寻求一些新的价值,就像是苹果,我相信「MacBook 支持触控」,从来都小于「macOS 进入 iPad」的呼声。

而 MatePad Edge 这个命名,其实也说明这首先是一台 Pad,再是电脑。

另一位朋友,他只有台式电脑,想要买一台能带着走的计算设备,于是选择了 iPad,不选 MacBook 的原因很简单:他是一位画师。

最近他也跟我分享,他爱上了 iPad 上的 Logic Pro X 玩音乐,然后决定买个 Mac mini 进行深度探索,不过更喜欢平时用 iPad,因为交互更简单直接,平时上手就能玩。

传统电脑还是大部分人的首选,但世上的职业不止三百六十行,工具也不应该只有一种。

之前在与爱范儿的访谈中,苹果高管 Kurt Knight 认为,「生产力」并非固定不变的概念,而是随着时代和用户需求不断演化。每位用户都有不同的工作方式,也就对应着不同的生产力场景。

像是学生、画师、飞行员等等需要用到便携大屏和手写输入的人员,平板 + 笔的搭配已经能胜任大部分的工作场景,加上键盘化身「桌面端」后,更是具有了进一步的生产力,电脑的出场机会更少。

随着抖音、小红书这些图文、短视频社交平台的大行其道,创作从未如此贴近所有人的生活,手机可以成为最佳的镜头,二合一平板本来也是消费这些内容的最佳载体,现在也能成为不错的生产工具。

从一个更长远的视角出发,「二合一」更具有「明日产品」的地位。

2018 年,苹果发布了一条 iPad Pro 的广告,片中 10 岁左右的主角带着 iPad 走遍城市,最后领居问她在用电脑干什么,她说出了那经典台词:

什么是电脑?

对于出生就被触控屏幕包围的年轻一代来说,平板电脑不仅是他们第一台拥有使用权的计算设备,还会是相当长时间里的唯一一台——网友不会解压」「不会用安装包」现象,也折射出电脑使用习惯的变迁。

我们曾经以为,等到这批新生代开始进入大学和工作,不得不用鼠标键盘的时候,他们的习惯和方式会被这种更高效率的老派模式替代。

但事实证明,触控交互反过来影响了产品形态。

在我们编辑部,MatePad Edge 的使用方式被分成了两派:

小时候只接触过电脑的同事,几乎不会想起这是一台能够触屏的平板;更伴随着平板电脑长大的年轻同事,虽然 80% 的工作时间都在用键鼠,也会自然地经常伸手点击屏幕,甚至换回 MacBook 后还有点不太习惯。

在海外,从小就用 iPad 和 ChromeBook 二合一学习的孩子们,从小就已经更习惯用这些设备做作业和上课;等他们长大,自然也会选择交互和形态更熟悉的产品——渐渐地,二合一设备就能蚕食传统笔记本的市场。

总而言之,芯片算力已经到达了一个新的阶段,「电脑」早已经不止是某种形态计算设备的专属名词,而是一种能力的体现。

历史或许会再一次重演:鼠标和图形界面诞生之初,工程师和开发者就认为,鼠标这种输入方式地效率比键盘命令行效率低下太多,图形界面还浪费性能。但最终,这两种革命性的技术成功让电脑出现在了更多人的桌面。

说到这里,MatePad Edge 的价值已经相当明显:

现阶段,它更多是一款「买一送一」性质的产品:如果你只是想买一台平板电脑,那 MatePad Edge 不仅是优秀的 Pad,还送你一个完整的鸿蒙电脑系统,以备生产力的不时之需,怎么看都挺划算。

尤其对于画师和学生来说,MatePad Edge 以及鸿蒙电脑适合作图和记笔记的任务,同时也兼具一些文稿和图像的处理能力,最适合不过。

放到整个行业,MatePad Edge 则给「二合一」这个有点走到死胡同的品类,撕开了一个新的口子,提供了一个新的思路。

而或许在一个更远的未来,更多人手上和桌面上的,都会是这样一台带着键盘的平板电脑,娱乐工作,触控键鼠,一台产品全部能做到,成为一台不加前缀的「电脑」。

(本文写作全程使用 MatePad Edge 撰稿)

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


理想 AI 眼镜 Livis:首先是副好眼镜,这真的很重要

By: Lin
4 December 2025 at 12:00

如果要给你的爱车买外设,你想到的一般是什么?

大概率是车衣、灭火器、安全锤、儿童座椅、户外电源之类的东西对吧。但理想说:停停停,我这里还有一个新东西——

这就是理想最新发布的 AI 智能眼镜「Livis」,一副好眼镜、一副好墨镜、一个好音响、一个好相机,还有一整天的长续航。

当然,它也能顺便帮你控制理想汽车——

爱范儿收到的理想 Livis 智能眼镜是科技灰亮光配色,搭配一对蔡司平光感光变色镜片,被太阳光照射后会变成灰色的墨镜。

根据我们目前体验的感受来看,这或许就是现阶段最聪明的「车用墨镜」了。

当然,作为一副智能眼镜类产品,我们必须同时从「智能」和「眼镜」两方面去评价。而这次理想 Livis 做得最好的一点,就在于它先是一副好眼镜、然后才是一个智能的眼镜。

其实仅从外观和设计上,我们就能看出,理想 Livis 将产品重点放在「做个好眼镜」上的优先级是很高的。

理想 Livis 在保证长达 18 小时典型使用时间的前提下,做到了仅仅 36g 的裸框重量,即使加上镜片,整机的重量也能维持在 50g 上下。

按照理想的说法,Livis 就是目前世界上最轻的智能眼镜。

而为了让 Livis 作为一副眼镜更好用,理想也在镜片上花了不少功夫。理想 Livis 的镜片合作方为百年光学大厂蔡司,从透明到墨镜,无论平光还是远近视,都有非常丰富的镜片选择。相比于其他同类智能眼镜,蔡司镜片的加持让 Livis 在清晰度上获得了明显优势。

此外,理想 Livis 作为一款主打配车使用的产品,直接标配了支持无线充电功能的眼镜盒,实现随充随用、随放随充。

而在眼镜的基础功能之外,理想 Livis 的主要功能体现在这三点上:音响、相机,以及智能控车。

其中最突出、也最让我们在体验时感觉到惊喜的,就是理想 Livis 的音乐能力。

作为一副开放式耳机,它配备了一套「双磁路三明治扬声器」,利用智能调频,让近场(人耳位)声音加强,远场(路人位)声音抵消,实现了开放式耳机防漏音的功能。

而 Livis 的实际音质表现也的确有点东西,甚至是爱范儿目前体验过的智能眼镜里面音质最好的一个。

和一般的开放式以及骨传导耳机不同,理想 Livis 的扬声器支持空间音频效果,加上支持立体收音的 4 麦克风阵列,通过眼镜录音再回放的时候,不仅人声很清晰,而且能够听出声音的来源方向。

此外,理想还给 Livis 眼镜画了一个相当令人期待的饼:这款眼镜后续可以通过 OTA,解锁更进一步的车机互联玩法,支持上车后作为头枕音响使用——直接解决了目前所有理想车型都不支持头枕音响的问题。

那么目前智能眼镜最流行的记录功能,理想 Livis 做得怎么样呢?它的传感器为 1200 万像素的索尼 IMX681,视场角达到了 105 度,抓拍响应时间也来到了相当优秀的 0.7 秒,几乎已经和手机的拍照速度相同了。

值得一提的是,理想 Livis 支持拍摄实况照片,能够在摁下快门后保持录制 3 秒钟的视频,这个功能在智能眼镜上很少见。

至于录像方面,理想 Livis 的表现就不如 Ray-Ban Meta 这种有直播属性的智能眼镜了,Livis 单次录像的长度被限制在了三分钟,总时长为 47 分钟。画幅则支持横向或竖向的 4:3 与 16:9 共计四种,基本涵盖了所有社媒形式。

而对于一款「车厂眼镜」最根本的需求——智能控车方面,理想 Livis 则交出了一份令人满意的答卷。

首先,Livis 需要通过手机上的「理想同学」app 进行连接,佩戴眼镜的时候可以直接呼叫和调用最新版的 MindGPT-4o 模型的理想同学 agent,唤醒仅需 300ms,对话响应时间也压缩到了 800ms。

佩戴理想 Livis 眼镜时,你不需要掏出手机、也不需要抬起手腕解锁手表,只需要对着空气说一句「理想同学」,就能控制车上的空调冰箱后备箱,也能很方便的查询当前车辆位置和续航里程等信息。

在我们的实际体验中,用 Livis 呼叫理想同学不仅响应非常快,它也支持上下文连续问答,app 中的「记忆功能」也可以成为语音记事本,让它帮你记住一些零碎信息——比如帮你记住车停在了「北京西站南广场东」。

不过目前 Livis 搭配理想同学 app 也有一些局限,比如它没法创建或者写入日程提醒,只能帮你记住文字信息,并且也没有条件触发提醒,记住的信息都需要你主动去问。如此种种,还不够方便。

换句话说——给 Livis 下指令、随口聊聊天问问信息还行,想让它当一个「随车秘书」就不太方便了。

总之,对于一款「汽车周边」,理想 Livis 眼镜基本达到了我们对于眼镜、智能以及控车的期待,更何况哪怕抛开所有「智能」的部分,它依然是一款相当不错的蔡司眼镜。

理想 AI 眼镜 Livis 的起售价为 1999 元,整镜国补后 1699.15 元,而配备 1.60 折射率的透明屈光镜片到手仅需 2005.15 元。这价格在外面单买蔡司镜片可能都不够,理想还给你送一副智能眼镜。

▲ 理想 AI 眼镜 Livis 各版本售价

对于非车主来说,这是一副支持线上配镜、蔡司加持且音质不错的智能眼镜,听歌、拍照、录像、随时问答。

而对于车主而言,不仅能用上方便无感的语音车控,Livis 还能取长补短、变身成为车载的头枕音响,说不准等以后功能更加完善了,还能实现语音召唤车辆驶出车位、AI 智能聚合变成你的随车秘书等等高级功能,想想都刺激。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


鱼和熊掌兼得?在 A7M5 身上,我看到了相机两难的和解

By: 周奕旨
5 December 2025 at 09:43

不知道你们有没有注意到,影像圈子有个很有意思的趋势:我们过去常说手机在追赶相机,但到了 2025 年,在手机的紧逼下,相机也卷起来了。

随着计算摄影的突飞猛进,大众的日常记录需求早已被手机覆盖,御三家的专业相机被迫退守,将主赛道全面切换向「视频生产力」。此时,微妙的矛盾出现了——

手机因为底小,很早就普及了堆栈式传感器,实现了极速抓拍和高速传输数据。而在专业相机领域,传统传感器无法满足高规格视频的需求,可全画幅尺寸的堆栈式传感器成本又居高不下,怎么办?

在智能手机与相机竞品的共同挤压下,索尼祭出了 A7M5,试图在成本与性能之间,寻找那个极其狭窄的平衡点。

速度与画质的交易

索尼 A7M5 最核心的变化,藏在机身内部这块 3300 万像素的部分堆栈式传感器——请记住这个名字,这是该技术第一次正式出现在索尼 Alpha 家族的机身上。

要理解部分堆栈式传感器,得先看看它的前辈们。

前代 A7M4 使用经典的背照式传感器(BSI),相比前照式传感器,背照式传感器把电路挪到了背面,光电二极管紧挨着彩色滤光片,解决了进光量不足的缺点,但它的问题在于数据跑道不够宽,一旦数据量大,读取速度就会明显拖后腿。

为了解决这个问题,索尼研发了堆栈式传感器,将原本在一块晶圆上打造的像素区域与处理回路分别打造,再重叠堆放,以获取更高的数据传输速度,但它的问题在于造价极贵,往往用于 a9 系列这样的旗舰速度机和 a1 系列这类旗舰全能产品。

A7M5 用的部分堆栈 CMOS,则是介于两者之间的精明折中,保留了背照式的底子,但在传感器边缘加盖了一圈「高速缓存区」,以此大幅提升数据吞吐效率。

这项技术的优势简单粗暴——速度。而这份速度,配合索尼 BIONZ XR2 处理器,直接解开了困扰 A7M 系列多年的两道封印:连拍与视频。

这里有一个极易被忽视的技术细节:RAW 文件的位深(Bit-depth)。

很多相机为了冲刺超高速连拍,会将 RAW 文件从 14bit 降级为 12bit。这丢失的 2bit 数据,意味着色彩断层的风险增加,后期空间压缩。

而索尼 A7M5 可以实现每秒 30fps 下维持 14bit RAW 无损输出——这个数据,是 A7M4 无法比拟的。

从视频规格来看,A7M 系列第一次迎来 7K 超采的 4K 60p 无裁切的录制,A7M4 时代那个让人难受的 60 帧裁切视角,终于成为了历史,配合 A1 II 同款的 AI 对焦芯片,它在单兵作战的视频拍摄上,实用性大幅提升。

遗憾的是,我们还是没有在 A7M5 上等到利用整块 3:2 传感器的 Open Gate 的出现,对于那些需要一条素材剪出横竖两个版本、或者需要后期大幅二次构图的创作者来说,的确不够灵活。

不过,天下没有免费的午餐,在影像技术上,速度与画质有着天然的矛盾——

使用堆栈式传感器的高速相机往往会在某段 ISO 出现动态范围折损的问题,比如使用堆栈式传感器的索尼 A9,为了实现 20fps 连拍和无黑屏,它的电路层极其复杂,读出速度极快,但代价是高频的读出电路会引入额外的电子底噪,在 ISO 100 的基准感光度下,比 A7R2 的动态范围低了约 0.5-1 档。

这个「物理魔咒」,同样延续到了 A7M5 所采用的部分堆栈传感器上,虽然官方宣称拥有 16 级动态范围,但物理规律告诉我们,部分堆栈结构往往会在信噪比上做出妥协,参考目前市面上采用同类技术的机型,它们都在基础 ISO 和中段 ISO 表现出了信噪比下降的趋势。这意味着如果你强行提亮暗部,噪点会比以往更多;在面对大光比的日落或风光时,高光拉回的余地也不如传统的背照式传感器那么宽裕。

松下的解决方案是增加一个复杂的「DR Boost」开关,让用户在「速度」和「画质」之间二选一,索尼 A7M5 很可能也会面临同样的物理墙,对于主拍风光、极其在意静态画质纯净度的用户来说,这需要做好心理准备:它变快了,但画质的具体表现还有待考察

得益于传感器和处理器的升级,索尼 A7M5 的续航也有相应的提升,来到了 750 张。

颇有趣味的是,在解析完部分堆栈式传感器后,你会发现这块 CMOS 与 A7M 系列的定位,可谓相得益彰——

众所周知,索尼 A7 家族的牌桌上分工明确:R 系列死磕极致画质,S 系列剑指暗光视频,而留给 M 系列的任务看似中庸,实则最难——它要在两者之间寻找那个完美的最大公约数。

而这块传感器,既避开了全堆栈的昂贵,又甩开了传统背照式的迟缓,它在物理结构上的「折中」,恰好对应了 M 系列在市场定位上的均衡,称得上天作之合。

如果用一句话定义 A7M5,那就是:它是画质与速度这对由于物理铁律而无法共存的矛盾,在博弈与妥协之后,结出的果实。

看完了 A7M5 的核心参数,我们将视线转回机身,索尼 A7M5 延续了一贯的家族式设计,与 A7R5 比较类似,总体与 A7M4 相比,没有过大改动,但在小细节上,还是有些升级——

A7M5 采用自家老大哥 A1M2 的 3.2 英寸的四向翻折触控屏,同时在接口上,抛弃了颇有怀旧感的 Micro-USB,取而代之的是更符合现代工作流的 双 USB-C 接口。

最后,是索尼标志性的「精准刀法」。

A7M5 虽然配备了双卡槽,但采用的是 「1 个 SD/CFe A 混合卡槽 + 1 个纯 SD 卡槽」 的组合,也就是说你无法使用双 CFe 卡进行最高规格的高速连拍备份,索尼刀法名不虚传。

索尼 A7M5 的最终售价为 17999 元。

真正的「护城河」,不是机身

看完上面的内容,你可能会觉得 A7M5 是一台优缺点都很明显的相机。

但数码相机,不同于我们熟悉的手机等消费电子产品,它的生命周期远比我们想象的要漫长。

一旦把时间轴拉长,你就会发现,影像厂商之间的战争,从来不是靠一代产品、或者一两台机身的输赢来决定的。在这场马拉松里,评价一台相机的维度变得复杂而深远——机身重要,生态也同样重要。

索尼 A7M5 背后,是 E 卡口镜头的庞大帝国,这才是索尼最可怕的地方。

经过十年的深耕,E 卡口拥有目前地球上最庞大、最完善、也是最亲民的镜头群:

  • 你想买顶级镜头?索尼自家的 G 大师系列数不胜数。
  • 你预算有限?适马、腾龙甚至唯卓仕等国产品牌,为你提供了海量的「平替」。

这是索尼的存量优势。

对于一个摄影爱好者,或者是刚成立的小型工作室来说,买相机不是一锤子买卖。你买得起佳能 R6 III 的机身,但当你看到佳能 RF 镜头高昂的价格,且几乎没有副厂选择时,那个「准入门槛」是巨大的。

而索尼这边的画风完全不同。你买回 A7M5,转头就能用极低的成本,在二手市场或者副厂新品里淘到素质极佳的镜头。

从某种意义上来说,这像极了 Windows 和 macOS。

虽然 A7M5 在 Open Gate 上略显遗憾,没有佳能 R6 III 那种破釜沉舟的力度,但在商业逻辑上,A7M5 依然是一台极度成熟的机器:经济高效的编码格式、优秀的曲线,部分堆栈和 AI 解决了速度的问题,用 3300 万像素保留了甜点级的画质体验,然后转身指了指身后那片浩如烟海的镜头群——

那里,才是它真正的杀手锏。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「欧洲版 DeepSeek」发布新模型,盯着中国 AI 打

By: 姚桐
4 December 2025 at 17:55

被称为「欧洲版 DeepSeek」的 Mistral AI 在被 OpenAI、Google 和中国开源模型 DeepSeek、Qwen 夹击大半年后,终于坐不住了,正式发布了新一代 Mistral 3 系列模型。

Mistral AI 是一家总部位于法国的大模型公司。据报道,今年 9 月,英伟达第三次出手投资这家初创企业。经此,Mistral 的估值达到约 135 亿美元,成为欧洲 AI 领域最受瞩目的独角兽之一。

这一次,Mistral 居然只盯着中国模型打

Mistral 3 这次带来了旗舰模型 Mistral Large 3,以及三款高性价比的小模型 Ministral (3B、8B、14B)。

其中 Mistral Large 3 是绝对的主角,总参数量为 675B,其中活跃参数为 41B,这是自 2023 年底至 2024 年初的 Mixtral 8x7B 和 8x22B 以来,Mistral 首个开放权重的混合专家模型。

但最让我感到「不对劲」的是官方的对比策略。

在官方的跑分图里,Mistral 竟然完全无视了 GPT-5.1 或 Gemini 3,而是直接把枪口对准了中国的 DeepSeek-V3.1 和 Kimi-K2。

Mistral 的逻辑很直接:我的参数量只有 Kimi 的一半左右,但我的性能跟你五五开,甚至更强。

官方晒出的成绩单如下:

  • 赢面: 在 MMMLU 和 AMC 上,Mistral Large 3 分别拿到了 85.5 和 52.0 的高分,略微领先 DeepSeek-V3.1。
  • 输面: 在程序员最关心的 LiveCodeBench 和 SimpleQA 上,Mistral Large 3 还是输给了 Kimi-K2。


比 DeepSeek 笨,还贵 3 倍?

虽然 Mistral 试图证明自己是「效率之王」,但在 X 上,科技博主直接泼了一盆冷水,甚至用了「Mistral 正在缓慢死亡 (slow death)」这样严重的词。

他的评价简单粗暴,列出了 Mistral 新模型的三大罪状:

1. 更笨: 脑子不如 DeepSeek 好使。
2. 更贵: 价格却是 DeepSeek 的 3 倍。
3. 更慢: 推理速度甚至比 GPT-5 还慢。

这确实戳到了痛点。在 Artificial Analysis 的最新综合 AI 指数榜单上,Mistral Large 3 的得分只有 38 分。

看看排在前面的是谁?Gemini 3 Pro(73分)、Claude Opus 4.5(70分)、GPT-5.1(70分)。Mistral 距离第一梯队的差距,已经不是「追赶」,而是断层了。

在 LMArena 排行榜中,它在开源非推理模型中排第二,总榜第六。成绩尚可,但绝对称不上「屠榜」。

有测试者发现 Mistral Large 3 各个方面都表现不佳:

  • 该模型难以正确执行工具调用,常会输出格式错误或无效的工具调用指令。
  • 在基于图像的基准测试中表现平平。

真正值得冲的,其实是小模型

Ministral 3 是所有开源模型中性价比最高的产品。每种参数规模均提供基础版、指令版和推理版,且均具备图像理解能力,全部基于 Apache 2.0 许可证开源。

这意味着什么?你可以免费商用,随便魔改。

  • 全能: 所有尺寸都支持图像理解,不再是「瞎子」 。
  • 能打: 14B 的推理版在 AIME’25 测试中准确率达到了 85%。

Mistral 3 确实进步了,就像网友说的那样:欧洲仍有一家前沿模型制造商能基本跟上中国开源模型的步伐,尽管 Mistral 尚未推出推理器,其实际性能仍落后于时代。

但在 DeepSeek 把大模型价格打下来的今天,仅仅做到「性能不错」已经不够了。用户要的是极致的聪明,或者极致的便宜。

目前的 Mistral ,似乎卡在了一个尴尬的中间位置。能不能成为「欧洲之光」,可能真得看后续的迭代了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


到手价 1699 元!不务正业的理想,造了副最好的 AI 眼镜

By: 李华
3 December 2025 at 22:09

当我看完了理想 AI 眼镜 Livis 的所有产品细节,我不得不承认一个略显荒诞的事实:

目前市面上完成度最高、最值得买的智能眼镜,来自一家造车的公司。

就在刚刚,理想正式揭晓了这款产品的价格,Livis 的起售价定在了 1999 元,而在 12 月 31 日前下单的用户,还可以享受 15% 的限时补贴,到手价仅需 1699 元。

为什么我们会对这个产品给予这么高的评价,原因其实很简单。理想把那个被科技厂商搞砸了的逻辑给顺过来了。理想很明白,在成为一个无所不能的 AI 终端之前,Livis 首先得是一副让你愿意戴出门、且戴得舒服的眼镜。

理想汽车产品部高级副总裁范皓宇在发布会上说:

我们并不想仓促的做一款产品去赚快钱,蹭个热点,而是实打实的想做一个高可用,不给用户带来额外负担,能够陪伴用户很长时间的产品,能够让用户真正的体会到工作生活。因为它而变得更好了一点

智能眼镜,首先是一个眼镜

绝大多数智能眼镜最终沦为电子垃圾,不是因为它们不够聪明,而是因为作为一副眼镜,它们的存在感实在太强了。

理想显然研究过那些躺在抽屉里的竞品,在 Livis 上做了一个很极端的取舍,先做减法,再做加法。

整机 36g 的重量,是一个非常有杀伤力的数据。作为参考,海外好评度很高的 Ray-Ban Meta 重量超过了 49g,小米的同类产品也在 40g 左右。在鼻梁这个对重量极其敏感的部位,每一克的负担在长时间佩戴后都会被指数级放大。

为了把重量抠到极致,理想使用了瑞士 EMS 的 TR90 医疗级材料,并且针对亚洲人的头型做了微调。镜腿间距被设定在 137mm,转轴处预留了 15° 的外翻空间。这不仅是为了佩戴稳固,更是为了避免欧美品牌眼镜那种恼人的夹头感。

解决完「重」的问题,还得解决「看不清」的问题。理想这次拉来了蔡司作为战略合作伙伴,不仅保证了光学的基本素质,更关键的是打通了服务链路。

在镜片成本上,理想这次没玩套路。1999 元的起售价直接标配了蔡司防蓝光树脂镜片;如果你需要户外墨镜或者更高级的蔡司感光变色镜片,只需要再加几百元就能升级。即便是复杂的近视/散光定制,官方也号称最快当天就能完成配镜并发货。

总之,你不需要拿着验光单去线下眼镜店折腾,在下单的同时就能解决屈光度定制问题。

在把眼镜这个属性立住之后,理想才开始往里面塞东西。

首先是声音。理想把这个功能形象地称为「理想 Livis 头枕音响」。Livis 并没有用骨传导,而是配备了一套开放式的双磁路三明治扬声器。

在实际听感上,这种结构带来的声音厚度要优于一般的骨传导耳机。针对开放式耳机最尴尬的漏音问题,理想加入了逆声场抵消技术,在电梯或办公室这种安静环境下,能在很大程度上保护隐私。

与此同时,依靠 4 麦克风阵列,当你录制视频时,它能记录下全景声的空间音频。当你回看视频时,声音是有方位的。这样的沉浸感,其他智能眼镜难以提供。

至于拍摄,镜腿前方那颗 1200 万像素的摄像头,支持 0.7 秒快拍和 Live Photo 实况照片,当然也支持视频的拍摄。

我们必须坦诚地说,它的画质并不适合去和旗舰手机的主摄硬碰硬,其核心价值在于第一人称视角和快。当你双手都在开车,或者正在抱着孩子的时候,这种所见即所得的记录方式,是手机无法替代的。

为了支撑这些功能,理想在这个尺寸下做到了混合续航 18.7 小时。按照理想的测试模型,这个时间包含了 1.5 小时的听歌、1.5 小时的电话、2.5 小时的录音以及数十次的 AI 问答和拍照。如果只用来听歌,可以连续听 7 个多小时,纯待机状态可以达到 78 小时。

Livis 还标配了一个内置 1700mAh 电池的眼镜盒。这个盒子的设计非常巧妙,既是收纳盒也是充电宝,而且它自己还支持无线充电。这就形成了一个非常顺畅的补能闭环——不用的时候随手放进盒子里,盒子随手扔在车上的无线充面板上,基本告别了电量焦虑。

MindGPT 的新载体

在硬件之上,MindGPT-4o 多模态大模型构成了它的软件灵魂。相比于百科问答,Livis 更偏向于私人助理。

但在聊它有多「聪明」之前,首先得聊聊「快」。毕竟对于语音交互来说,快是自然的前提。为了实现这种跟真人一样的沟通节奏,Livis 使用了一套流式智能语音框架。

传统的语音助手往往是线性的,它得等你彻底把话说完,把语音转成文本,再扔给 AI 去思考,最后再把答案传回来,这中间要消耗很多时间。而流式交互改变了这个流程,就像人和人聊天一样,在你说话的过程中,它其实已经在听、在思考了。这种「边听边想」的能力,配合端侧算力的优化,让它的对话响应速度达到了 800 毫秒,几乎感觉不到延迟。

在解决了「快」之后,理想才引入了更多深度的能力,比如 Deep Research。

你可以给它一个复杂的指令,比如「梳理一下 2025 年自动驾驶芯片的市场格局」,眼镜会在后台进行长时间的检索和整理,随后在手机 App 端生成一份详尽的报告。此外它还具备了记忆能力,能记住你提到的生活琐事,比如家人的生日或喜欢的餐厅,并在合适的时机提醒你。

当然,与车的联动才是理想的老本行。理想把 Livis 和理想汽车的连接体验比作 「iPhone 和 AirPods 的关系」。

连接之后,交互体验是非常直觉的。依靠免唤醒和意图识别,你可以在任何地方直接说打开后备箱、查询胎压或者打开座椅加热,完全不需要掏出手机。

而在车内,为了防止车内语音交互打架,理想做了一套很细节的唤醒抑制逻辑。在车内环境下,喊理想同学会默认唤醒车机,只有当你发出帮我拍照、开始录像这类眼镜专属指令时,眼镜才会接管语音流。

理想要做的,不是一个车钥匙

An iPod, a phone, and an internet communicator

2007 年的 Macworld 大会上,乔布斯在舞台上反复念叨着这三个词。

这也是科技史上最经典的时刻之一。当台下的观众以为苹果要一口气发布三款新硬件时,他才揭晓了谜底。这三样东西不是三个独立的设备,而是一个设备,那就是 iPhone。

如果我们借用这个逻辑来拆解 Livis,你会发现理想的产品定义其实也是完全一样的路数。

你可以把它看作是四款产品的集合体。

首先它是一副佩戴舒适的光学眼镜。36g 的重量和蔡司的加入,保证了它作为「眼镜」的基础属性。考虑到现在市面上蔡司镜片的价格,分分钟比 Livis 更贵,买它简直相当于「买镜片送智能眼镜」

其次它是一副音质极佳的开放式耳机。如果你平时就有佩戴耳机的习惯,那 Livis 的价值就更大了,从我们的实际体验来看,它的双磁路扬声器效果能媲美,甚至超越两千元档位的耳夹式耳机。

再者它是一个随身的 AI 智能助理。相比于 Humane Pin 或者 Rabbit R1 那些试图取代手机却最终沦为笑柄的新物种,眼镜的形态明显要自然得多。它听得见、看得见、能说话,而且永远在线。

最后才是属于理想汽车的车控终端。

这个逻辑理顺了,你就会发现理想的小算盘打得有多精。对于理想车主,这最后一点或许是下单的直接动力。但对于非理想车主,前三点的组合依然具备相当的说服力,毕竟一副带 AI 和好音质的轻便眼镜,本身就是一个完整的产品。

这其实也解释了另一个更有意思的问题,为什么是眼镜而不是手机。、

同样是造车新势力,蔚来选择了造手机。他们的逻辑很硬核——为了更好的车手互联,为了把车钥匙做得更极致。但在手机这个极度成熟、竞争简直可以用惨烈来形容的红海市场,车企想要做出差异化太难了。

但智能眼镜不一样,这是一片还没被巨头瓜分殆尽的蓝海,在这个空窗期,理想带着它在汽车上积累的技术杀进来,其实是非常聪明的。

而且眼镜这种形态,天然就比手机更适合 AI。

手机的交互逻辑是「低头」,你需要掏出来、解锁、点击屏幕。而眼镜的逻辑是「抬头」,它就在你的视野里,在你耳边。当你习惯了用语音让车机放歌、导航,那么在走路、骑车或者工作时,用语音让眼镜帮你记事、查资料,也是一件顺理成章的事情。

就像范皓宇在发布会上说的那样:

眼镜其实是一个日常,佩戴时间非常长,存在感很低,对舒适的要求非常高的终端形态。它的语音非常近,而且稳定性很好,也不需要用户改变什么已有的习惯。所以它成为我们智能体验带出车内的最佳载体。

从更深层的角度看,Livis 其实是理想 AI 能力的一次溢出。

仔细想想,现在的理想汽车本质上就是一个巨大的 AI 机器人。它有视觉、有听觉、有大脑。现在理想只是把这套感知系统小型化了,从车上拆下来,戴到了你的脸上。

通过 Livis,理想正在试图把触角伸向我们生活的每一个角落。从车内的「移动的家」,延伸到车外的「随身智能」。对于用户来说,这可能是一次低门槛的尝鲜,千把块钱就能体验到理想的 AI 和服务。而对于理想来说,这可能也是一次极其成功的品牌推广。

至于它能不能成为你的生活标配,答案或许不在发布会上,而在你把它架到鼻梁上的那一刻。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


三星三折叠上手:折起是手机,展开竟然是…电脑?

By: 马扶摇
2 December 2025 at 14:45

谁都没想到,传说了快两年的三星三折叠手机,就在 12 月一个憋闷的早晨默不作声的通过 Samsung Newsroom 发布了。

与早期的预测相同,三星为这款三折叠(tri-fold)产品起了一个波澜不惊的名字:Galaxy Z TriFold,没有跟随 Z Fold 系列的编号,相当于另起炉灶、重另开新线了。

自此,华为 Mate XT 系列终于不再是三折叠市场的独苗,而对于消费者来说——有竞争的市场,才是有进步的市场。

只不过它虽然叫做 Galaxy Z TriFold,但它的展开方式却不是「外翻内折」的 Z 字型铰链,而是类似叠被子一样的 G 型铰链——内屏的两侧向中间合拢,然后才能翻转使用背部的外屏。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

这样一来,Galaxy Z TriFold 就只有「完全展开」和「完全关闭」两种使用形态,要么用分辨率 2160 x 1584 的 10 寸内屏,要么用 6.5 寸的外屏。

虽然它少了像华为 Mate XT 和 XTs 的双折叠使用形态,不过根据我们评测 XTs 时的实际经验,「三折叠手机的双折叠形态」并不是那么的常用,Galaxy Z TriFold 这样的取舍并没有什么问题。

为了容纳两侧厚度不同的机身,三星也对铰链进行了相当多工艺上的改进。

Galaxy Z TriFold 上面的「Armor FlexHinge」采用了双轨结构,让铰链两边的机身协同移动,即使重量不同,也能实现流畅和稳定的开合。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

此外,Galaxy Z TriFold 也用上了国行 W 系列的陶瓷。它的 6.5 寸外屏为康宁大猩猩玻璃陶瓷 2.0,两侧的机身背板则采用了「陶瓷玻璃纤维增强聚合物背板」,相比 Z Fold7 的玻璃显著增强了抗裂性——

但坏处也显而易见:Galaxy Z TriFold 的三块亮面背板是毋庸置疑的指纹收集器,再加上它只有黑色一种配色,随用随擦是在所难免的了。

此外,三星也对折叠方式做出了规范,系统会在折叠的时候给出视觉提示,内屏没有完全展开的情况下是无法使用的,这和七月份泄露的系统预览图基本一致:

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

不过 Galaxy Z TriFold 虽然没有严格意义上的双折叠模式,但三星保留了翻开一侧屏幕用后摄自拍的功能,在功能性方面是没有什么严重缺失的。

▲ Mrwhosetheboss 上手

Galaxy Z TriFold 的内外屏规格均为三星 Z 系列的动态 AMOLED 2X,10 寸内屏的峰值亮度为 1600 尼特,背部 6.5 寸的外屏则可以达到 2600 尼特,规格几乎与 Z Fold7 如出一辙。

而和 Z Fold7 如出一辙的不只是外屏规格,Galaxy Z TriFold 同样搭载着 2 亿像素 f1.7 主摄、1200 万像素超广角和抽象的 1000 万像素 3 倍长焦——有这样的「扎实」参数,几乎不用期待它的拍照表现了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

此外,Galaxy Z TriFold 同样用着 Z Fold7 同款的骁龙 8 Elite for Galaxy 定制版处理器,无论何种容量都标配 16GB 内存,只有 512GB 和 1TB 两种 SKU,相比 12+526GB 的 Z Fold7 稍显厚道。

比较值得注意的是,三星在 Galaxy Z TriFold 上采用了一些新的材质工艺。比如这次除了传统的铝合金边框之外,Galaxy Z TriFold 的中轴盖板从铝换成了钛金属,可以有效防止面积更大的盖板上出现划痕。

现阶段,在「上万元」这个超高端价位段里,(除了 iPhone)怎么用软件来辅助提升硬件能力才是厂商的重点,而三星作为目前少数几个从手表到电视都有涉猎的「全生态」玩家之一,应该能为我们交出一份不错的答卷。

其中最主要、和华为 Mate XTs 差别最大的,就是三星 OneUI 里面引以为傲的 DeX 模式了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

三星在 Galaxy Z TriFold 上首次允许在不外接显示器的情况下激活 DeX 模式,在 10 寸的内屏上打开一套完全基于键鼠的准电脑级桌面,这一点要比 Mate XTs 上的「自由多窗」模式更彻底一些,用起来也的确更像小电脑了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

此外,Galaxy Z TriFold 的 DeX 模式还支持像 Windows 和 macOS 那样添加第二块虚拟桌面,用户可以快速在两个桌面的应用组之间切换,毕竟有了 16GB 就是比较豪爽。

只不过华为 Mate XTs 支持手写笔,而坚持深耕手写笔操作多年的三星似乎在慢慢放弃这条路。Galaxy Z TriFold 和今年的 Z Fold7 一样,同样是从物理上移除了手写笔的检测硬件,支持的外设只剩下了蓝牙键鼠。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

只不过如果真的要用三折叠移动办公的话,一个专门的鼠标蓝牙还是要比华为 M-Pen 3 的「空鼠模式」实用许多的,当然,Mate XTs 也是能外接鼠标的。

此外,得益于谷歌和 OneUI 的双重加持,我们预计 Galaxy Z TriFold 对于软件的超宽屏适配会有一个比较好的表现——当然,仅限于规范开发的国外 app。至于极个别国产毒瘤 app 连华为都不做适配,自然也不会适配三星了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

目前,三星 Galaxy Z TriFold 的售价尚未公布,海外官网也仅仅显示从 12 月 9 日 10 点起接受预定。

根据三星的介绍,这款三折叠产品不会全球开售,而是 12 月 12 日在韩国首销,后续推广至中国、新加坡、阿联酋等区域,美版则要等到 2026 年第一季度。

不过好消息是,目前国行三星商店已经上线了新品预购入口,三星也在盖乐世社区表示将于 12 月 9 日早 10 点开启预售,但国行售价仍未公布。

根据部分海外博主的上手预测,Galaxy Z TriFold 最终的售价可能会落在 2400 美元左右(约合人民币 17000 元),国行的最终定价有希望落在 17999 档,但更多预测都怀疑三星会上调至 2 万元左右。

总之,作为目前全球三折叠手机市场的唯二玩家,华为和三星各自会在三折叠这个形态里玩出什么花样,还是相当让人期待的。

无论是 One UI vs 鸿蒙,还是 DeX vs 自由多窗,怎么让这些价格动辄两万多的「天顶星旗舰」实现软件带动硬件、戴着镣铐跳出最漂亮的舞蹈,才是真正的重中之重。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


不止 Sora2!拍我AI V5.5 更新:人人都能用 AI 视频当导演了

By: 樊 尔
2 December 2025 at 14:04

2025 年,AI 视频又把桌子掀了。手切金属、小猫做饭,甚至是那个火遍全网的「奥特曼宇宙」,对 AI 来说不过是几句 Prompt 的功夫。


但也别高兴得太早。

绝大多数 AI 视频工具,依然停留在「素材生成」阶段。它们能给你一段精美的画面,但这些画面是大多是破碎的、静音的、单一景别的。

如果你想搞点严肃创作,比如带分镜的故事片,你得不停地「抽卡」,祈祷 AI 能听懂什么是远景、什么是特写。

结果往往是,它一股脑塞给你一堆逻辑不通的废片。选完还得配音、剪辑、配乐…一串工作流下来,10秒视频能干两个星期。

AI 视频到底什么时候才有带演技的叙事能力能学会「讲故事」?

昨晚,拍我AI(PixVerse) V5.5 的更新给了给我带来了惊喜。时隔半年,这位「卷王」再次扔出重磅炸弹。如果说上一个版本是给你配了一个特效师,那么 V5.5 则是给你配备了一个懂视听语言的导演组。

V5.5 是国内目前唯一能够一键生成「分镜 +音频」,实现完整叙事的 AI 视频大模型。

它最大的突破在于:AI 视频开始具备「导演思维」。它不再只是生成会动的图片,而是开始理解镜头、声音与叙事之间的逻辑关系。

以前需要专业分镜师才能做到的事,现在的你,也能「从从容容游刃有余」。

AI 视频终于拥有了「灵魂」

影片的「故事感」从何而来?很大程度上,源于人物的对白、背景音乐的烘托,以及镜头切换带来的节奏感。

我们就从这两个维度,来狠狠考验一下拍我AI 的成色。

查看完整视频案例效果请跳转 APPSO 推文

自带百万音效师

先从「配音师」这个角色开始,拍我 AI V5.5 支持多角色音画同步,看它水平怎么样。

首先我们来段沙滩广告。

提示词:男人看向镜头,将啤酒举到镜头前,对着镜头倾斜瓶子,做干杯动作。背景音是动感的电子乐,有明显的鼓点,充满流行感。

拍我 AI 做得干净利落。最让我起鸡皮疙瘩的是细节: 它完全听懂了场景,配上了十分适合夏日沙滩的感觉的音乐。

这种对环境音的理解,十分给力。

再来点环境不一样的,让一辆的士驶过城市街头。

拍我 AI 也是手拿把掐,镜头不仅跟随着汽车,还配上了街头嘈杂的汽车声,仿佛真的置身于人头攒动的纽约街头。

提示词:出租车在城市街道里前行,渐渐消失在画面中。

但这还只是开胃菜,我们继续上强度。

我先用拍我AI 内置的 Nano Banana Pro,生成了一张图片,然后再让拍我 AI 生成了一个「欢迎南方小土豆光临东北」的视频。

 

提示词:女人热情地说:「欢迎南方小土豆,来我的家乡!俺东北这里可想你啊!」

短短两句话,口型对上了,东北阿姨热情的劲儿都拿捏了,简直让人想要下了班就立刻买张机票去旅行。

再比如,下面这段帕丁顿熊的片段中,它精准地复刻了那标志性的英伦腔调。那种特有的顿挫节奏与绅士般的「老伦敦」口音,听起来不仅地道,而且非常有辨识度。

而在处理小熊的剧情时,它更是展现出了对剧本的理解力。

当角色意识到自己身处巴黎铁塔,而对方在东京铁塔的乌龙瞬间,拍我AI 生成的语音准确传达出了那一刻的错愕与惊讶。

这种对语气拿捏的细腻程度,让整个片段不再是简单的画面堆砌,而是有了真实的情绪流动。

它不仅仅是简单地识别了两个角色形象,更深刻地理解了角色背后的文化符号与剧情语境,从而为它们匹配了极具灵魂的声音演绎。

不难看出,拍我AI 音频生成功能,让视频工作流里的配乐和配音门槛大幅降低。只要在拍我AI 的视频生成的参数里,将「音频」的选项打开,接着只需要简单的一句话,就能帮你快速批量尝试,简单到一个人就能轻松做好。

拿捏影视级的镜头

景别,是导演手中的刀,用来切割时空,引导情绪。

过去,用 AI 做分镜简直是「噩梦」:你得分别生成远景、近景,然后再自己去剪辑软件里拼。而在拍我AI V5.5 里,这种笨功夫成为了历史。

打开多镜头模式,告诉 AI 你要的画面的景别,并切换多机位,它就能直接生成一段有叙事节奏的成片。

比如那个火遍全网的「三宫格海边写真」,我们就能把它变成一段更加有趣的剧情短片:

提示词:
镜头一:猫回头看着镜头。猫说:「山的那边是什么」。
镜头二:猫再次回头望向大海。镜头拉近猫,猫说:「你不用告诉我」。
镜头三:猫正脸部的特写镜头。猫说:「因为,我只想在你家里捣乱。」

整体成片的效果相当扎实。但真正让我惊叹的,是拍我AI 理解了台词背后的情感潜台词。在猫咪开口前的瞬间,极具灵性地加了一个推镜头的特写调度。这种看似简单的运镜处理,瞬间拉满了画面的叙事张力。

我们再来到东非大草原。我还用 Nano Banana Pro 生成了一个纪录片图片,一键视频生成了一段剧情短片:

如果你觉得还要先学习写分镜太麻烦,没关系,拍我AI V5.5 的「脑补」能力同样惊人。 只给一句话,它也能给你惊喜。

提示词:he woman watching her memory-lost mother at home, and sad. They hugged but her mother seemed not to remember her anymore.

拍我AI V5.5 交出的答卷超出预期。不但给了我三个镜头,还自主构建了一段完整的叙事:从母女互动,到最后温情相拥的落点,剧情逻辑清晰感人。

可以看出,拍我AI V5.5 已经不再止步于单一画面推进,而是开始真正掌握了视听语言的语法。通过精准捕捉提示词中的场景氛围与情感基调,自主编排景别和镜头,为生成的影像注入了能够打动观众的内涵。

这种变化,让最终的成品摆脱了「动态图片」的单调标签,进化为一段真正具有叙事承载力的影像素材。

一键直出广告大片,新的创作神器诞生

刚才那些玩法可能还只是「整活」,为了验证它是否真的具备「生产力」,我们决定再上点难度。

直接甩给拍我AI V5.5一个完整的惊悚电影镜头脚本,看看它接不接得住。

提示词:The video is shot using a fisheye lens, giving a distorted, wide-angle view of an urban street scene at night in front of a store with a sign reading “DELI • GROCERY • ATM” (English). The lighting is dim, with red neon reflecting off wet pavement. The musical sound is slow, ominous industrial bass with distant sirens. The camera focuses on a tall figure wearing a cracked, porcelain doll mask and a heavy trench coat, looming over the lens. Behind him, two figures in black hoodies stand motionless near the store entrance. The masked figure leans uncomfortably close to the fisheye lens, whispering hoarsely: “Midnight tick, the shadows don’t sleep. Price on the head, and the secrets we keep. You saw the sign, but you didn’t read the print. One wrong step, and you vanish in a tint.” The figure slowly raises a gloved hand to cover the camera lens as the screen fades to black.

坦白说,最终呈现的成片质感大大超出了我的心理预期。

拍我AI V5.5 展现出的剪辑非常老练,它懂得如何在不同景别间流畅切换,避免了 AI 视频生成中常见的时空割裂感,让画面流转显得合乎逻辑。

当然,现阶段的 AI 还无法做到百分之百的完美。比如在处理最后那个极具张力的鱼眼镜头人物对白时,面部细节仍显露出些许破绽。但它在动态物理规律的遵循上守住了底线,整体瑕不掩瑜,成片的完成度和可用性依然处于高水准。

更令人惊喜的是声画配合。拍我AI V5.5 生成的人声不仅仅是念出台词,而是精准拿捏到了惊悚题材所需要的紧张氛围与压抑感,从音色质感到语速节奏,都与画面情绪实现了默契。

这种逻辑自洽、鲜有出戏感的表现,直接拓展了它的落地场景。对于电影导演而言,它完全可以作为高效的沟通工具,用来向编剧或摄影指导直观地阐述创意构思。

而对于广告人来说,它还是个创意利器。只需投喂一个完整的 Brief 和示意图,它就能迅速生成一支达到提案级别的汽车商业广告,效率惊人。

提示词:黑暗的极简空间中,一束流动的光带扫过深灰色车身的腰线,展示出”液态金属”般的肌肉质感。紧接着,矩阵式LED大灯猛然亮起,光束直刺镜头,照亮空气中的微尘。音乐声是低沉的电流声逐渐增强,伴随一声类似心脏跳动的重低音。一个沉稳深沉的男声说:”觉醒。” 镜头切至下一场景: 城市夜景的高速跟拍镜头,车辆在充满了蓝紫色霓虹灯光的隧道中飞驰。流动的城市灯光在车窗和流线型车身上拉出长长的光带,强调极速下的动态模糊感。音效是尖锐且充满未来感的电机加速啸叫声,混合着破风声。男声说:”超越速度的边界。” 镜头切至下一场景: 航拍镜头展现广阔的沿海悬崖公路,正值日落时分(Magic Hour),金色的阳光洒满车身,与深邃的大海形成冷暖对比。车辆向着地平线驶去,留下优雅的背影。音乐转为宏大且激昂的电影氛围乐,带有史诗感。男声继续:”不仅是抵达前方,更是征服。” 镜头切至下一场景: 车辆静止在极简的黑色反光地面上,车头正视前方,背景是抽象的红色流光慢慢消散。镜头缓慢拉远,上方浮现银色金属质感字幕”APEX “。男声说:”Apex GT。” 音乐在最后一声强有力的重音后戛然而止。

可以看到,这类成片的质感已经比较稳定。这充满速度与金属质感的车辆,让你几乎很难分辨这出自 AI 之手,还是某家专业广告公司的制作班底。

画面之间的衔接展现出了极高的成熟度,丝毫看不出拼接的痕迹。拍我AI V5.5 并非机械地堆砌素材,而是通过摇移等镜头、特写转向全景等画面语言,生成了一段有起伏、有张力的叙事段落。

配合引擎轰鸣与契合度极高的背景音乐,它成功摆脱了「AI 味」的廉价感,呈现出了可以融入到的工作流级别的影像水准。

别当「工具人」了,去当真正的「导演」

这次拍我AI (PixVerse) V5.5 的体验,让我产生了一个强烈的体感:AI 视频生成,正在经历一次关键的转折点。

过去使用 AI,像是在指挥一个听不懂人话的实习美工。你花着钱,还得在海量废片里大浪淘沙。那种频繁调整、试错、最后还得不到满意结果的挫败感,磨灭的不仅是时间,更是创作的热情。

拍我AI  V5.5 的出现,让我们看到了一丝曙光。

V5.5 底层模型基于自研多模态理解与生成技术,支持音频和视频同步生成,模型融合多镜头理解能力,智能生成匹配的分镜与多镜头,理解了视听逻辑。它不再是一个冷冰冰的素材库,而是一个开始懂剧本、懂叙事的「执行导演」。

虽然它还远未完美,但 拍我AI V5.5 这次确实给 AI 带来了一种「叙事能力的觉醒」,开始抹平普通人与专业导演之间那道巨大的技术鸿沟。

往后,无论是个人整活,还是商业化的广告样片、影视预演(Pre-viz),效率都将迎来质变。

这意味着,我们即将告别 AI 「素材生成」时代,跨入真正的「内容生成」时代。

在这个新时代下做专业创作,你可以不再需要精通 PR 或 AE,也不需要昂贵的摄影器材。你只需要专注于最核心的东西——创意与表达。

把繁琐的执行交给 AI,把思考留给人。

我想,这就是 AI 技术进步最性感的意义。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


终于发布的Gemini 3,什么是它真正的王牌?

By: Selina
1 December 2025 at 20:51

Gemini 3 Pro 预览版上线那一刻,很多人心里的第一反应可能是:终于来了

遛了将近一个月,这里暗示那里路透:参数更强一点、推理更聪明一点、出图更花一点,大家已经看得心痒痒了。再加上 OpenAI、Gork 轮番出来狙击,更加是证实了 Gemini 3 将是超级大放送。

这次 Gemini 3 的主打卖点也很熟悉:更强的推理、更自然的对话、更原生的多模态理解。官方号称,在一堆学术基准上全面超越了 Gemini 2.5。

但如果只盯着这些数字,很容易忽略一个更关键的变化:

Gemini 3 不太像一次模型升级,更像一次围绕它的 Google 全家桶「系统更新」。

模型升级这一块的,Google 已经把话说得很满了

先快速把「硬指标」过一遍,免得大家心里没数:

-推理能力:官方强调 Gemini 3 Pro 在 Humanity’s Last Exam、GPQA Diamond、MathArena 等一堆高难度推理和数学基准上,全部刷出了新高分,定位就是「博士级推理模型」。
-多模态理解:不仅看图、看 PDF,甚至还能在长视频、多模态考试(MMMU-Pro、Video-MMMU)上拿到行业领先成绩,说看图说话、看视频讲重点的能力,提升了一档。
-Deep Think 模式: ARC-AGI 这类测试证明:打开 Deep Think 后,它在解决新类型问题上的表现会有可见提升。

从这些层面看,很容易把 Gemini 3 归类为:「比 2.5 更聪明的一代通用模型」。但如果只是这样,它也就只是排行榜上的新名字。连 Josh Woodward 出来接受采访都说,这些硬指标只能是作为参考。

换句话说,「跑了多少分」只是一种相对直观的表现手法,真正有意思的地方在于 Google 把它塞进了哪些地方,以及打算用它把什么东西连起来。在这一个版本的更新中,「原生多模态」显然是重中之重。在这一次的大更新中,「原生多模态」显然是重中之重。

如果要为当下的大模型找一个分水岭,那就是:它究竟只是「支持多模态」,还是从一开始就被设计成「原生多模态」。

这是 Google 在 2023 年,即 Gemini 1 时期就提出来的概念,也是一直以来他们的策略核心:在预训练数据里一开始就混合了文本、代码、图片、音频、视频等多种模态,而不是先训一个文本大模型,再外挂视觉、语音子模型。

后者的做法,是过去很多模型在面对多模态时的策略,本质还是「管线式」的:语音要先丢进 ASR,再把转好的文本丢给语言模型;看图要先走一个独立的视觉编码器,再把特征接到语言模型上。

Gemini 3 则试图把这条流水线折叠起来:同一套大型 Transformer,在预训练阶段就同时看到文本、图像、音频乃至视频切片,让它在同一个表征空间里学习这些信号的共性和差异。

少一条流水线,就少一层信息损耗。对模型来说,原生多模态不仅仅是「多学几种输入格式」,这背后的意义是,少走几道工序。少掉那几道工序,意味着更完整的语气、更密集的画面细节、更准确的时间顺序可以被保留下来。
更重要的是,这对应用层有了革命性的影响:当一个模型从一开始就假定「世界就是多模态的」,它做出来的产品,与单纯的问答机器人相比,更像是一种新的交互形式。

从 Search 到 Antigravity,新总线诞生

这次 Gemini 3 上线,Google 同步在搜索栏的 AI Mode 更新了,在这个模式下,你看到的不再是一排蓝色链接,而是一整块由 Gemini 3 生成的动态内容区——上面可以有摘要、结构化卡片、时间轴,虽然是有条件触发,但是模型发布的同时就直接让搜索跟上,属实少见。

更特别的是,AI 模式支持使用 Gemini 3 来实现新的生成式 UI 体验,例如沉浸式视觉布局、交互式工具和模拟——这些都是根据查询内容即时生成的。

这个思路将一系列 Google 系产品中发扬光大,官方的说法是更像「思考伙伴」,给出的回答更直接,更少套话,更有「自己看法」,更能「自己行动」。

配合多模态能力,你可以让它看一段打球视频,帮你挑出动作问题、生成训练计划;听一段讲座音频,顺手出一份带小测题的学习卡片;把几份手写笔记、PDF、网页混在一起,集中整理成一个图文并茂的摘要。

这部分更多是「超级个人助理」的叙事:Gemini 3 塞进 App 之后,试图覆盖学习、生活、轻办公的日常用例,风格是「你少操点心,我多干点活」。

而在 API 侧,Gemini 3 Pro 被官方明确挂在「最适合 agentic coding 和 vibe coding」这一档上:也就是既能写前端、搭交互,又能在复杂任务里调工具、按步骤实现开发任务。

这一次最令人惊艳的也是 Gemini 在「整装式」生成应用工具的能力上。

这也就来到了这次发布的新 IDE 产品:Antigravity。在官方的设想中,这是一个「以 AI 为主角」的开发环境。具体实现起来的方式包括:

-多个 AI agent 可以直接访问编辑器、终端、浏览器;

-它们会分工:有人写代码,有人查文档,有人跑测试;

-所有操作会被记录成 Artifacts:任务列表、执行计划、网页截图、浏览器录屏……方便人类事后检查「你到底干了啥」。

在一个油管博主连线 Gemini 产品负责人的测试中,任务是设计一个招聘网站,而命令简单到只是复制、复制、全部复制,什么都不修改,直接粘贴。

最终 Gemini 独立完成对混乱文本的分析,真的做了一个完整的网站出来,前前后后所有的素材配置、部署,都是它自己解决的。

从这个角度看,Gemini 3 不只是一个「更聪明的模型」,而是 Google 想用来粘住 Search、App、Workspace、开发者工具的那条新总线。

回到最直觉的感受上:Gemini 3 和上一代相比,最明显的差别其实是——它更愿意、也更擅长「帮你一起协作」。这也是 Google 对它赋予的期待。

压力给到各方

跳出 Google 自身,Gemini 3 的 Preview 版本实际上给整个大模型行业,打开了一局新游戏:多模态能力应用的爆发势在必行。

在此之前,多模态(能看能听)是加分项;在此之后,“原生多模态”将基本配置——还不能是瞎糊弄的那种。Gemini 3 这种端到端的视听理解能力,将迫使 OpenAI、Anthropic(Claude)以及开源社区加速淘汰旧范式。对于那些还在依赖「截图+OCR」来理解画面的模型厂商来说,技术倒计时已经开始。

「套壳」与中间层也会感到压力山大,Gemini 3 展现出的强大 Agent 规划能力,是对当前市场上大量 Agentic Workflow(智能体工作流) 创业公司的直接挤压。当基础模型本身就能完美处理「意图拆解-工具调用-结果反馈」的闭环时,「模型即应用」的现实就又靠近了一点。

另外,手机厂商可能也能感到一丝风向的变化,Gemini 3 的轻量化和响应速度反映的是 Google 正在为端侧模型蓄力,结合之前苹果和几家不同的模型大厂建立合作,可以猜测行业竞争将从单纯比拼云端参数的「算力战」,转向比拼手机、眼镜、汽车等终端落地能力的“体验战”。

谁最强已经没那么重要了,谁「始终在手边」才重要

在大模型竞争的上半场,大家还在问:「谁的模型更强?」,参数、分数、排行榜,争的是「天赋」。到了 Gemini 3 这一代,问题慢慢变成:「谁的能力真正长在产品上、长在用户身上?」

Google 这次给出的答案,是一条相对清晰的路径:从底层的 Gemini 3 模型,往上接工具调用和 agentic 架构,再往上接 Search、Gemini App、Workspace 和 Antigravity 这些具体产品界面。

你可以把它理解成 Google 用 Gemini 3 将以原生多模态为全新的王牌,并且给自己旗下生态中的所有产品,焊上一条新的「智能总线」,让同一套能力,在各个层面都得以发挥。

至于它最终能不能改变你每天用搜索、写东西、写代码的方式,答案不会写在发布会里,而是写在接下来几个月——看有多少人,会在不经意间,把它留在自己的日常工作流中。

如果真到了那一步,排行榜上谁第一,可能就没那么重要了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


曾经的最强苹果电脑 Mac Pro,已经被时代抛弃

By: 苏伟鸿
30 November 2025 at 21:30

没想到再次听到苹果 Mac Pro 的新消息,会是一个噩耗:

根据彭博社 Mark Gurman 爆料,苹果内部已经取消了新款 Mac Pro 台式机的开发,其搭载的 M4 Ultra 处理器也一起被砍,下一代高端桌面芯片是 M5 Ultra。

苹果内部基本放弃了 Mac Pro 项目,并认为 Mac Studio 才是未来。

Mac Pro 的坎坷一生

如果从 1994 年发布的 Power Macintosh 算起,那 Mac Pro 发布至今已过了 31 个年头,经历了苹果芯片的两次重大转型。

只是对于苹果来说,打造一台普通的性能猛兽永远不是产品的最终目标,做出一台既优雅又强大的电脑去定义未来,才是乔布斯和艾维的野心——甚至有的时候,「优雅」会优先于「强大」。

只是在半导体工业还不算发达的当时,设计和性能难以兼得,两者的矛盾如一个幽灵般盘旋在 Power Mac 和 Mac Pro 三十多年的历史中,注定了这个产品线命运多舛。

初代 Power Macintosh 采用了非常经典的塔式机箱形态,在当时作为首款搭载 PowerPC 处理器的苹果电脑问世,颇有秀肌肉的味道,位于苹果经典四象限的「专业级」和「台式机」区域。

从这时起,Power Macintosh 系列(后改名 Power Mac)成为了苹果电脑性能天花板代名词,主要面向高端的商务和创意用户。

Power Macintosh 定下的另一个「规矩」,就是极高的拓展性——它配备了 6 个 PCI 插槽和 7 个内置硬盘位,还需要用户自己添加独立显卡,完全就是为专业极客准备的产品。

在乔布斯回归苹果、乔纳森·艾维执掌设计大权后,两人通力合作打造出了多彩、塑料的 Power Mac G3,很好平衡了产品设计和性能功能。

两人不满足于此,Power Mac G4 Cube 在对未来计算机的进一步畅想中诞生。

通体玻璃和金属的外壳,看不到按钮和 CD 插槽,禅意甚至贯彻到机箱内部——连散热的风扇都没有。乔布斯对 Power Mac G4 Cube 非常满意:

我们通过简化去除多余的东西,取得进步。

Power Mac G4 Cube 得以位列现代艺术博物馆展厅,却也钉在了苹果产品的「耻辱柱」上:这个超小型机箱和无风扇的设计,导致散热能力低下,限制了性能发挥,最终这个设计也只使用了一代。

同样的故事,在 Mac Pro 产品线中还会再次上演。

2006 年,Mac Pro 接棒 Power Mac,同样在苹果转投英特尔的节点问世,搭载英特尔的至强系列处理器。

Mac Pro 延续了 Power Mac G5 的工业铝合金外壳,尽管工艺优秀,充满「Pro」气质,只是这个庞然大物的形态和体积,显然还不是苹果心目中的最佳形态。

于是在 2013 年,苹果给了艾维一个机会,去设计一款不同于以往的 Mac Pro。最终的成品确实称得上非同凡响,成为苹果产品设计史上极为浓墨重彩的一笔——

这个设计至今仍被人们津津乐道,但代价也很明显:这个仅有上代体积 1/8,只配备单个风扇的「垃圾桶」,很容易就会因为散热问题遇到性能瓶颈,对于一台面向专业用户的电脑来说是大忌。

▲ 两代 Mac Pro 体积对比

并且,苹果官方也只允许用户自行更换 Mac Pro 的内存和存储空间,并警告强行更换显卡会有很高的故障风险。

这并不是专业用户们所期待的 Mac Pro。在发布两三年后,到处都充满了对这个「垃圾桶」的吐槽,以及苹果是否已经抛弃专业用户的质疑声。

为了挽救口碑,苹果官方很罕见在 2017 年的一次媒体活动中出面承认了「垃圾桶」Mac Pro 的失败,并在之后推出了 iMac Pro 平息专业用户愤怒,承诺下一台 Mac Pro 将「更模块化」。

新款 Mac Pro 终于在「垃圾桶」发布后的 2182 天后发布——这期间,iPhone 大改了两次设计。

令人啼笑皆非的是,苹果对于「垃圾桶」的反思结果,就是重新捡起了 2006 年的初代塔式 Mac Pro 的图纸,铝合金机箱则换用了著名的「刨丝器」设计。

▲ 图源:YouTube@Ryan Gehret

至少,苹果终于端上来了一台高性能且可拓展的主机,人们欣然接受这台新 Mac Pro,这款产品最终也收获了不错的口碑。

只是当时也无人能预料到,这个 Mac Pro 的全新起点,同时也是这个产品线的终点。

一年后,Apple Silicon 横空出世,成为了 Mac 历史上最重要的一个转折点。

但这次,Mac Pro 没有像之前一样成为转型的排头兵,相反,在这个令人激动的新时代,它成为了无处安放的怪异存在。

Mac Pro 甚至是整个产品线中最后得到 Apple Silicon 翻新的型号,2023 年,搭载 M2 Ultra 的 Mac Pro 姗姗来迟。

虽然沿用了上一代颇受好评的新机箱,但高集成度的 Apple Silicon 生态,使得它的可扩展性极其有限,只能安装一些特殊的扩展卡,无法升级内存或者插入显卡。

与此同时,高能效的 Apple Silicon 终于让苹果得以「复活」Power Mac G4 Cube。

Mac Studio 小巧精致,外观没有一丝赘余,内部集成度高而无法扩展,苹果终于在 20 年后实现了乔布斯的夙愿,造出了一台真正面向未来的电脑。

▲ Power Mac G4 Cube 和 Mac Studio,图源:Macworld

对于用户来说,Mac Pro 更大、更重、更贵,却没带来更强的性能,只多出来一点点拓展性,新时代已经没有它的位置了。

或许也可以这么说,Mac Pro 不是被砍了,而是脱胎换骨,成为了 Mac Studio。

新时代再无 Mac Pro 的地位

和外观浑然一体的 iMac、Mac mini 以及多款 MacBook 比起来,采用塔式机箱、内部模块化设计的 Mac Pro,其实更像是一台 Windows 主机,不过运行着官方支持的 macOS。

纵观 Power Mac 和 Mac Pro 的历史,或者说整个电脑历史,高性能的主机以往似乎只有一种解题思路——巨大的塔式机箱,内部布满等着用户自己魔改的插槽。

在性能和能耗震惊世界的 Apple Silicon 诞生之后,苹果终于可以不再遵循 PC 高性能主机的这套规则,利用自己的芯片生态去代替以往需要不断增加更换电脑模块的方案。

在 M4 Mac mini 发布后,立马就有不少有趣的探索,例如联合运行多台 Mac mini 来形成盘阵列或者 AI 训练集群,以往这需要叠加更多显卡才能实现,并且功耗还更高。

▲ 图源:X@ Alex Cheema

对比可以自行更换元器件的模块化,这种高集成的设计使得产品出厂后再无升级可能,但高集成实现的高性能小型化,也产生了全新的价值。

以往的巨大机箱主机在,基本不具备流动性,我们以形式固定的「工作室」模式进行创作和生产,如果需要机动办公,则需要使用移动硬盘 + 性能本,无疑拉低了效率。

得益于高性能便携主机的出现,工作环境可以更灵活进行部署。像是影视行业的 DIT 工种,现在他们能够直接带走整个 Mac Studio 进行工作——换作以前的 16 千克 Mac Pro,这是不可能实现的。

▲ 把 Mac Studi 带着走的方案非常常见,图源:ProVideo Coalition

并不是只有苹果在深耕这个方向。英伟达的 DGX Spark 体积和老款 Mac mini 相当,却是一台具有 1 Petaflop 的 AI 超级计算机,曾经需要大型机柜和大量显卡的算力,现在可以直接摆在桌上。

芯片工艺和设计已经达到了一个顶峰,性能高能耗低成为常态,现在正是实现那些梦幻设计的时机,而小型化一直以来都是计算机和电子产品的迭代方向。

很多人对「小机箱」的趋势不解,质疑「能做大为什么不做大」,能够实现更好的散热——实际上,同一颗芯片的 Mac Pro 和 Mac Studio 性能几乎没有差距,现在的问题变成了「能做小为什么要做大」。

▲ 两者跑分非常接近,价格却相差 3000 美元,图源:MKBHD

更深层的变迁发生在社会之中。在 AI 改写生产力的时代下,每个人正在向「超级个体」靠拢,以前的工作方式是「计算机上长了个人」,那现在是人在哪里,性能就必须跟到哪里。

诚然,对于一些有专门需要的专业人士,像 Mac Pro 这样具有更高拓展性的大机箱还有价值,但 Mac Studio 的能力正在不断突破我们的想象,越来越多拓展也可以通过雷电接口解决。

带有一丝戏谑地说,Mac Pro 身上最有价值的部分,或许只剩下这个工艺水准极高的「刨丝器」机箱了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


还在用 Gemini 3 写 ppt?太土了,来看看最酷炫手势互动(附提示词)

By: Selina
1 December 2025 at 16:56

Gemini 3 发布之后这些日子里,我逐渐感到疑惑:为什么总让 AI 写网站写 PPT,Gemini 都发到第三代了,不能干点更有意思的事吗?

要那种科幻感强的、效果酷炫的、难度系数高的,但小白也能做的。比如这种:

或者这种:

Gemini:手势交互?没问题,包的。

在开始之前,先准备好 Gemini 3,这里是一点点的注意事项👇🏻

目前有三种方式开启玩耍:Gemini 客户端 Canvas 模式、Google AI studio-Playground 和 Google AI studio-Build。

其中,最不推荐的是客户端,亲测无法有效拉起摄像头,并且,下面都是手势互动项目,举着手机,手自然也是没法做操控的。

后两者中,Build 是直接形成一个 app,你可以分享给其它朋友,缺点是 tokens 有限。而 Playground 会生成一套代码,需要下载到本地再打开,一旦换个电脑就可能运行不了,但优点是几乎没有 tokens 限制,每天一百万,量大管饱。

考虑到交互项目比较消耗 tokens,所以 Playground 更为合适,个别小项目用 Build 也可以,这就看个人情况而定。

Jarvis

Jarvis HUD 面板是在推上超过二十万次浏览的热门爆款,手势操控仪表球,就像钢铁侠操控 Jarvis 那样,酷毙了。

参考 prompt 如下:

create a webapp using vanilla js, html, css, modern threejs, mediapipe. it should be a sci-fi tony stark / iron man / jarvis experience focused on simulating an AR heads up display experience. full screen webcam input shown. add a heads up display that tracks the user’s head (offset to the right), with live updating metrics. a minimal 3D world globe should be shown on the left center of the screen, that should be able to be rotated / sized by the user hand gestures

在 Build 模式下,亲测完全可以实现一次成型,Gemini 会自动安排任务、编写代码,调用不同的接口,进度条显示完成后,点击 Preview 就能直接打开——记得放行摄像头权限。

 

Gemini 3 自己就把效果设计安排得明明白白:左手是放大缩小,右边是转动,双手进入摄像头范围后会显示触控点——这些都是 prompt 里没有的,都是它自己的「想」出来的。搭配大屏幕或者投影,真的很有 Jarvis 既视感。

左边的地球建模和右边的面板的内容都是可以改变的,最初 Gemini 3 让右边的面板显示人体体温(显然是凭空编的),后来被我改成了「实时显示左侧地球模型的直径」。反正 vibe coding 一下,想怎么改怎么改。

雨滴控制

Jarvis 都有了,惊天魔盗团不也得安排上。

看电影时只有特效,但现在,有 Gemini 3 了。参考 prompt 如下:

用 HTML+JS+ML 模型做个网页应用,通过摄像头检测手势,实现用手势来控制雨滴动画的暂停、静止和升格效果。动画效果保持在雨滴垂直方向,风格参考电影《惊天魔盗团》

这个 prompt 的第一轮表述完全是按照我看电影之后的想法写的,每个细节都可以通过 vibe coding 再调节。根据第一轮 prompt,Gemini 会加入它自己的设计,比如这具体的手势就是它想出来的。

虽然是用 AI 做的,但是在识别手势动作时非常灵敏,包括不同手势之间的切换都能够快速响应。

3D 粒子

控制雨滴曾经是非常复杂的特效技术,就在《惊天魔盗团 2》上映之后,有一个饮料公司做了一支广告,通过控制雨滴,实现静态的粒子效果。

那么参考「控雨术」,Gemini 完全可以实现上面这种结合实拍和速度控制才能出现的效果,最接近的就是 3D 粒子。所以我又做了一个 3D 粒子效果的交互案例。

非常酷炫!prompt 参考如下:

用 Three.js 创建一个实时交互的 3D 粒子系统。通过摄像头检测双手张合控制粒子群的缩放与扩散,提供 UI 面板可选择爱心/花朵/土星/佛像/烟花等模型,支持颜色选择器调整粒子颜色,粒子需实时响应手势变化。界面简洁现代,包含全屏控制按钮

一次成型,最后出来的交互非常丝滑,尤其是对于手势的识别很准确又灵敏。

【小技巧】

涉及到颜色、布局、UI 设计等等细节,如果每次都用 vibe coding 的方式来调节,表述起来会很麻烦。并且每一次 vibe code 都存在抽卡的情况,所以有一个非常实用的技巧是:加上自定义模块,尤其是颜色、大小等,这样可以完全自主搭配自己喜欢的配色方案。

技能五子棋

由雨滴想到粒子,由粒子想到移动,由移动想到——五子棋!我终于可以做技能五子棋了!!

仔细想想,五子棋不也是一个手势控制、飞来飞去的交互方式吗!飞沙走石移动棋子,力拔山兮移动棋盘,全都安排上!

Prompt 参考如下:

做一个手势互动小游戏「技能五子棋」:主页面为五子棋棋盘,默认已经摆放好棋子。当用户做出「单手甩手」的动作时,棋子会跟随甩动的方向飞出棋盘。当用户做出「双手甩动」的动作时,棋盘会跟随甩动方向飞动

Gemini 自己完成了物理逻辑和手势之间的衔接,我的 prompt 只需要描述效果,而具体的速度向量计算、检测阈值,都不用我管。

它甚至还重新命名了「技能」:万象天引。

这叫飞沙走石啊 Gemini 老师!

节奏音乐游戏

综合上面的几个尝试,Gemini 的毋庸置疑,而且回想一下这些技能树:手势识别、色彩变化,这些组合起来,不就是小游戏吗?

于是我尝试了更复杂一点的项目:节奏游戏。

音游玩过很多了,但是零经验小白真要做一个游戏、怎么给 Gemini 形容我想达到的效果,还真是花了一点脑筋 ,后来第一版 prompt 如下:

做一个用手势操控的音乐游戏,主界面为四条音轨,用户上传音乐文件后,四条音轨上按节拍出现光点,用户需要用手势准确拍击出现的光点,背景为复古合成波(Synthwave)风格,背景、音轨和光点的颜色可以自定义调节

这基本上是我能想到的雏形,根据第一版 prompt,Gemini 选择了 Pygame 作为游戏引擎,继续使用 MediaPipe 做手势追踪,并且加入了 Librosa 用来分析音乐。

选择复古合成波风格是因为它有明确的视觉标志——Gemini 也识别出来了——落日、霓虹渐变色、网格和驶向地平线的道路,非常适合节奏音游。

果然做游戏比前面的一些小交互复杂多了……先是只能识别一只手,得调整;然后是无法上传音乐,得调整;到了第三版才稍稍有点样子

但是在体验过中我发现一个比较 bug 的地方:判定线的位置离屏幕边缘太近了,而摄像头的识别范围是有限的,我的手稍微放低一点就无法被识别。

一开始我尝试的方法是,把判定线移动到屏幕居中位置,保证我的手始终能在摄像头捕捉范围内。

但是又出来一个问题:光点出口和判定线之间的距离过短,留给我的反应时间也很短,更别提点击动作还有一点点点的延迟,整个可玩性大大下降。可是放太低就还是会出现手掉出识别范围的情况。

一时之间我还真想不到这个矛盾该怎么办,于是,我直接去问了 Gemini 能怎么解决。

它直接指出了这个问题的症结所在,并且提出了「视觉欺骗」的方式来优化体验,并且加了一个自定义滑块来调节偏移,这样一来无论手在什么位置,都可以通过调节滑块来对齐判定线。

天才。

后来我还指出,感觉光点的出现跟节奏不太一致,为了解决这个问题,Gemini 又加了一个滑块用来调节延迟。虽然我仍然认为它并没有很好地分析节奏型,但是这个滑块的设计还是很有效,尤其是解决了戴着蓝牙耳机导致的延迟。

【一些小技巧】

本质上,只要有 prompt 就有抽卡的情况存在,但抽卡未必就不好。当碰到非常硬伤的 bug,比如始终无法调用摄像头、无法上传文件等等,vibe coding 时反复修改也没效果,不如就直接「新建项目」。核心功能反映在代码上,彼此之间有所牵连,重新跑一遍,让 AI 整体性地补足,远比一点点 vibe coding 要更有效率。当然,能看懂代码就会更有效率,可以针对性地解决。 只不过,对于完全的零码选手来说,还不如直接重新抽卡。

在 AI 之前,做手势交互的应用,得先学点儿 Touch Designer,最好还懂点儿部署。这些都得一点点翻教程,反复研究,在这个过程中搞不好就被劝退了。

有了 AI 之后有多简单,自然不用多说。更关键的是,手势交互原本的门槛远比生图、做 PPT 要更复杂,却又能让小白零码选手快速领略到做应用的乐趣。

唯一留下的,是对审美的挑战。在这些案例里能看到,Gemini 有点审美,但不多,设计、配色等等都是差强人意。代码的「硬」技能它可以掌握,留给我们的,就是对于审美的挑战。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


体验豆包手机助手,它把我的手机「变薄」了

By: 李超凡
1 December 2025 at 13:37

双十一刚过不久,看着花呗账单陷入沉思的同时,我更想吐槽那几天的「非人」遭遇。为了给家里添置点大件,我在淘宝、京东、拼多多之间反复横跳,光是比价就把后台切到了手抽筋。

作为每年要体验大量新产品的科技编辑,我一度陷入沉思:手机拍摄越来越强,屏幕越来越大,处理器越来越快,为什么我还是得像个保姆一样伺候这些 App?

手机里的 App 越多,我的生活反而越破碎。

那你可能就要问了,都 2025 年了,满大街都在吹 AI ,难道就不能帮我把这些活儿干了?该说不说,现在的手机 AI 助手,大多只能定个闹钟、查个天气,真遇到复杂事儿,它比你还懵。

哪怕强如苹果,Apple Intelligence 国行版本至今也已经跳票好几次,我的 iPhone 17 Pro 到底啥时候能用上还是未知数。

没想到,字节跳动倒是先出手了。12 月 1 日,字节正式发布了豆包手机助手技术预览版。

这和我们常用的豆包 App 还不一样,它直接跟手机厂商在操作系统层面进行了深度融合,直接成为 OS 的一部分。

现阶段,豆包已经跟中兴推出了豆包助手预览版,也开放了购买,第三方开发者也能将自己的服务和应用集成至豆包手机助手。

不整虚的,我们直接按照用评测 iOS 的强度来体验一下豆包手机助手。

手机终于可以当我秘书了

咱们先来点让打工人头疼的场景小试牛刀。

以前要是想把飞书里的文档转成不同格式的文件发给领导,或者从微信几百条聊天记录里翻个文件发给同事,事情看着不难,但这些琐事往往会在你有其他工作的同时要处理。

我直接对着豆包手机助手说:「从微信聊天记录里找刚才那个文件发给xx,再把飞书那个季度总结文档转成 PDF 发到企业微信给xx。」

这时它就会自动调用「操作手机」功能,反应速度比我想象中快。它没有让我反复切换 App,也没有让我确认一堆选项,直接在后台运行,我接着忙其他事,不一会它就成功完成任务。

我甚至还能用来搞定更私人的事。比如我让它「帮我把微信收藏夹里找到我的护照照片,然后把 ID 号码发到文件传输助手。」

这也是旅游出差非常高频的需求,而且要知道我的收藏夹还有家人的护照照片,我也没有分类标注,豆包手机助手还能准确识别。

我再上点难度,让它帮我把某个微信群的的所有文件打包下载,整理分类后打包发送到企业微信给同事。

这是我最讨厌的工作场景之一,中间涉及跨应用操作、手动下载、逻辑分类、打包压缩等一系列复杂动作,豆包手机助手会怎么做?

看着屏幕上自动流转的操作,我久违地喊出了 Amazing:

1. 它精准定位到了微信群,识别出里面的文件,并开始自动批量下载。
2. 它没有把文件一锅端,而是像个真人秘书一样,自动识别了文件类型。它把 PPT 归一类,Excel 表格归一类,图片归一类,甚至还根据文件名里的关键词进行了二级分类。
3. 打包与发送:分类完成后,它自动生成了一个 ZIP 压缩包,命名清晰,然后无缝跳转到企业微信,找到指定的同事,点击发送。

▲ 豆包手机助手分类发送的文件.

我只需要动动嘴,它就帮我完成了以往需要手动操作半小时、还要在两个 App 之间反复横跳的繁琐工作。AI 要做好这些就跟真的得力秘书差不多了

豆包手机助手支持几种不同的唤出方式,但其中最自然、最让我感到「舒适」的,是「靠近直说」。

操作很简单:拿起手机直接讲,豆包手机助手就会自动执行,或者也可以按住 AI 健呼出。这个交互方式就像微信语音一样自然,不用对着空气喊出略显尴尬的唤醒词,几乎零学习成本。

如果你正忙得腾不出手,豆包还支持用智能耳机 Ola Friend 直接语音唤醒,在那些「手忙脚乱」的时刻特别好用。

比如周末做饭时发现没酱油了,直接对着耳机说「豆包,我做菜没酱油了,帮我上美团买两瓶」;又或者上班路上堵车,让豆包帮忙调整会议时间并通知对方;再或者骑车赴约时,让豆包直接回复朋友的微信消息。

这些场景的共同点是:双手被占用、不方便掏手机,但事情需要立即处理。豆包的语音操作让这些原本要「等一下再说」的琐事,都能即时解决,真正做到了动口不动手。

生活这些大小事,终于有手机 AI 接盘了

下面,我给它上点真正的强度。这也是咱们开头提到的那个痛点:

「我想买华为 Mate 80,帮我去淘宝、京东、拼多多比一下价格,要把所有能用的优惠券都算上,告诉我哪个平台最便宜,并把最便宜的那个加入购物车。」

说实话,问完这句话我都觉得自己有点欠揍。这不仅涉及三个 App 的跳转,还得识别优惠券规则,还得计算,还得加购。

像这种难度,豆包手机助手会调用「复杂任务」模式来进行手机操作。结果豆包一轮比价操作后,最后选了拼多多百亿补贴后的价格,并帮我加入购物车。

咱平时在小红书上收藏了一堆乱七八糟的攻略,真要用的时候还得自己整理,这种信息碎片化的焦虑,相信大家都不陌生。我给豆包手机助手再出了个难题:

这周末跟朋友约饭,帮我从小红书里面收藏的广州的餐厅里面挑一家,然后要拍照好看,人均在200 以内,最好是粤菜。

它不仅把我的收藏内容分类整理好了,还自动去掉了重复和过时的信息。这一套操作下来,我是真服了。它不是在简单的搜索,它是在理解我的生活流。这种将杂乱信息结构化的能力,也是 AI 功能对于用户最大的价值之一。

帮我看看闲鱼、转转和拍拍严选上,二手的任天堂 Switch OLED 版(白色,99 新)大概都卖多少钱?综合对比一下,帮我定一个容易出手但又不亏的价格,然后帮我写一段吸引人的文案,准备挂到闲鱼上去。

它会先把任务拆分成各种子任务,不会像无头苍蝇一样乱撞。然后在执行任务的过程中,把任务进一步细分为各种关键词,在各种电商平台进行地毯式搜索。

查价格、看行情、对比成色,豆包三个平台来回横跳,比人类自己切换 App 还麻溜。

由于我提出的任务非常繁琐,豆包用时 8 分钟左右,乍一看好像有点慢?但仔细想想,这个时间和人类自己手动查相差无几了,甚至可能还更快。而在给出的文案上,经典的「可小刀,但不接受大砍」也可以说是原汁原味,

我想入坑明星丁禹兮,帮我在豆瓣、微博、贴吧、知乎等等平台查查他有没有黑历史:比如查查他有没有糊弄粉丝、人设崩塌、私生活混乱、欺骗消费的黑料,别让我入错股。

明星塌房是常有的事,前一秒还是顶流,后一秒就变成了赛博案底,所以在追星之前,我的建议是,还是得对明星做一个背调。而这种需要跨平台、翻历史记录、筛选关键信息的任务,就够我头晕眼花的了。

交给豆包手机助手后,从豆瓣的长篇八卦帖、微博的蛛丝马迹、贴吧的档案、知乎的理性分析,但凡有点风吹草动,它都能给你扒拉出来。

这种全平台背调能力,说实话比私家侦探还专业。追星有风险,入股需谨慎,但有了它,应该能帮我规避掉一定程度的塌房风险。

豆包豆包,我妈逼我相亲,你帮我给相亲对象小黄打微信电话,如果她没接电话,你需要用文字帮我高情商推掉这次相亲,理由要得体但坚决。

最近朋友向我求助,不想去安排的相亲,但又不好意思直说;想推掉,但情商低的我又怕伤人面子;想找理由,但又怕编得太假被看穿。这时候,让 AI 来当这个「背锅侠」,属实是个妙招。

豆包接到任务后,先是帮我拨通了小黄的微信电话。相亲对象可能也有事在忙,拒绝接听,于是豆包立刻按照我的要求切换到 Plan B:发文字消息。

从回复来看,这情商水平,其实已经比我这个社恐本人高出三个段位。而且最关键的是,这段话既坚决(明确表示不想继续),又得体(没有让对方难堪),还平衡了拒绝和礼貌这两个矛盾点。

这还没完。豆包手机助手的全局记忆才是我觉得未来对手机系统交互影响最大的能力。

「把小红书收藏夹里母婴内容,整理成孕晚期攻略。」

甚至我以前提问过孕期食谱也收藏过类似内容,这次再问餐饮推荐时,它就会在回答时给出提示:「这家店有孕妇不适合的食材哦。」

不同 App 里提到的同类内容,在它这里自动关联了。你不需要每次都重复你的偏好,它默默把你的习惯记在了小本本上,比你自己还了解你自己。这种润物细无声的体贴,才是智能的更高境界。

可以说,以前你需要录音笔+笔记本+日历 App+待办清单四件套才能搞定的事,现在一个 AI 快捷键全解决了。

至于大家关心的隐私问题?倒也不必太担心,一方面这些记忆的数据会存储在本地,另一方面,毕竟开关始终掌握在你手里,想记就记,不想记就关,自由得很。

告别 P 图 App,「基础功能」变得不基础

你以为基础功能就是平平无奇的识个图、P 个照?错了,相反,豆包手机助手做出了旗舰机都不一定有的体验。

随手丢了张罗永浩的照片问它:「这是谁?顺便起个标题。」豆包搜索验证后给出答案:《罗与罗:双份的「彪悍」》。这命名水平,既有梗又点题,属实可以。

拍了张路边小摊的招牌照片,上面赫然写着「腚粉肠」几个大字。豆包秒速识别出来:小摊贩把「淀粉肠」写成了「腚粉肠」。我就说这肠怎么吃着吃着还挺有味道的。(doge)

看完识别能力,再来看看豆包的 P 图本事。

之前在抖音爆火的发丝发光、三宫格风格 P 图,现在都被集成到了手机里——主打一个「AI P 图自由」,不用下载一堆 App,不用开会员,直接在相册里就能搞定。

又比如我随手拍了张家里猫主子的照片,然后让豆包给它整个漫画风。很快,一张猫猫表情包就出炉了,画风也真不差,还能根据表情自动配文案「震惊」。这理解力,还挺有网感的。

马斯克说的「未来手机」,豆包已经把雏形做出来了

多年前 iPhone 用多点触控(Multi-Touch)把物理键盘成为过去式,智能手机成为新一代计算中心。

现在,豆包手机助手也本质也在尝试做同一件事:让手机交互更加自然、直观和高效。

体验完之后,我最大的感受是:豆包手机助手不仅仅是一个 App,它更像是一个覆盖在所有 App 之上的「智能图层」。

它带给我最直观的感受是,手机变「薄」了。

虽然现在手机机身越做越薄。但同时手机也越来越臃肿:你需要点开一个个 App,像钻井一样潜入深层菜单,去翻找功能、去切换界面。

而现在,豆包手机助手把所有 App 的能力都「拍扁」了,平铺在你面前。

你不再需要面对复杂的 UI 界面,只需要面对结果。

早在 2008 年,微软首席 UI 设计总监 August de los Reye 曾预言, GUI (图形界面)未来演进的方向就是 NUI自然用户界面 。

人机交互领域的先驱 Bill Buxton 也曾在一篇论文中列举了一些 NUI 应该遵循的原则,其中有一条:

简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。

这种自然用户界面的交互,我想已经在豆包手机助手上开始体现了。

无论是叫车、订餐还是查攻略,它像个极其老练的管家,帮你屏蔽了底层那些繁琐的操作逻辑,只把你要的「结果」呈上来。

过去十年,我们的注意力被手机瓜分在无数个 App 的孤岛里。

而现在,你可以重新把所有的服务、所有的信息,全部收拢到了「你的意图」这一个入口之下。

马斯克说未来的手机不需要 App,其实他是在说:未来的交互,不需要看到过程,只需要结果。

我也相信,今天这种堆满图标的手机形态会有一天被淘汰。

那在 AI 和操作系统深度融合后,到底会给我们带来什么更好的体验?当豆包手机助手之类的 AI 和手机厂商联手后,估计会迸发出更多意想不到的进化。

或许就在不远的将来,我们不再需要低头戳戳点点,只需一个眼神或一句轻语,就能调动全世界的信息为你服务。

那将是我们这一代人亲历的,再一次「重新定义人机交互」的时刻。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为Mate X7 云锦天章:高级感,从何而来?

By: 谢东成
29 November 2025 at 18:05

《红楼梦》中最盛大的一幕,莫过于元春省亲——「锦幢云幕,珠履罗衢」。

「翻阅《红楼梦》,满目皆云锦。」曹雪芹并不靠堆砌珠宝来描绘华贵,而是以织物来传达秩序之美:锦帐、妆花、帷幕层层递进,礼与雅由经纬而生。也正因如此,谈云锦,似乎天然就带着一份制度与审美同构的分寸感。

如今,华为Mate X7 的「光织云锦」背板,正是将这门古老工艺从礼制器物转译为当代材料语言的大胆尝试——让云锦在今天的工业体系中焕发新辉,把文化的经纬,织入日用之物的触感与光影。

由经纬入骨,由材质成形

早于公元 417 年,东晋于建康设立「锦署」,自此南京云锦与权力与礼制相系相生。及至元、明、清三代,云锦均为皇室御用品,龙袍、冕服皆出其间,成为礼制文明最华美的注脚。

云锦之珍稀,不独在纹样之繁复,亦在工具与手艺之精微。

「大花楼」织机通高四米:楼上拽花提经,楼下抛梭织纬,二人合拍,一经一纬,一日仅得五六厘米。

▲ 位于南京云锦博物馆的大花楼木织机,图片来自:金羊网

云锦之所以叫云锦,正因为它「灿若云霞」,其「妆花」是云锦中艺术成就最高的品类,其要诀在于「挖花盘织」「逐花异色」:在同一幅布面上,以丝线、金线、银线、孔雀羽等异材并用、分区换色,分别织出各异纹样。

换个角度看,光影会变,层次会变,仿佛织物在呼吸,生机自现。

在嘉庆年间,南京云锦织造达到顶峰,全城织机三万多台,二十多万人以此为业,秦淮河一带机户云集,机杼声彻夜不绝。只可惜,清末以降行当凋敝,织造手艺一度失传。至 1949 年南京仅存可生产织机四台。1980 年,南京云锦研究所承接北京定陵博物馆龙袍料复织之任,由复原入手,重新体悟与还原这门技艺的工序与精义。

终于在 2009 年,云锦织造技艺入列联合国人类非物质文化遗产代表作名录,云锦技艺谱系由此再度庄严确立,并得以传承。

▲ 云锦复原款,图片来自:南京云锦博物馆

若要将「云锦」这套关于经纬、叠层、秩序的复杂逻辑,与现代智能手机相结合,就必须从材料逻辑而非图案贴附入手。

正如华为Mate X7 所带来的「光织云锦」背板,就是把云锦的织造逻辑,用现代材料科学重新实现一遍。

传统云锦以无数根经纬织就纹理,经线为纵向骨架,纬线为横向填充,经纬相交、密度有别、材质各异,便生出不同的纹理与光泽。

基于这套方法论,华为Mate X7 则在背板中以纳米级纤维重现这套「经/纬」的排布逻辑。通过约 900 根经线 × 1700 根纬线的精密交织,呈现祥云纹理,让纤维具备明确的方向性与密度差,在不同视线角度下,会呈现出层次各异的光影变化。

与此同时,华为Mate X7 亦从云锦「孔雀羽」以结构色呈现鲜艳反光汲取灵感,将纳米级多层光泽膜切丝入捻,融入纤维体系。

随光而动,呈现细腻而鲜明的色彩流变——一处是丝绸的柔哑,一处是金属的冷光,间或隐现孔雀羽的幽蓝,一面之上自成多层光影。

远看是层层叠叠的金属流光,近看是细密纤维,如「金丝」勾勒星河,云纹交织万象,营造出「手可摘星辰」的诗意与浪漫质感,观感与触感彼此叠映,既克制雅致,又丰盈饱满。

▲ 华为Mate X7 云锦白、云锦蓝配色,图片来自:燕山派

华为Mate X7 把这种经纬逻辑固化到工业产线,让云锦质感得以复现,带来云锦白、云锦蓝两款极具东方美学意境的配色,并将轻量化、高强度与卓越抗冲击性巧妙融合,在确保观感与手感的前提下,也不牺牲日常所需的耐用与防护。

承托这块云锦背板的,是全新超可靠折叠玄武架构机身,外有第二代玄武钢化昆仑玻璃外屏,内有超韧三重复合叠层内屏,中间由玄武水滴铰链和超强机翼铝中框共同支撑。

这套架构的存在,让华为Mate X7 用起来更踏实,反复开合不心疼,且华为Mate X7 达到 IP58 和 IP59 防尘抗水的顶级防护水准,80℃ 热水喷淋也不犯怵。

如此一来,手机不再是把非遗技艺做成表层贴花,而是让云锦织造逻辑内嵌于材料与结构,成为既有层次与意蕴、也经得起日常使用的掌心器物。

一瞥惊鸿的「时空之门」

门,是人类为世界划出的第一道分界:门内是秩序与日常,门外是未知与远方。

折叠屏手机的每一次开合,也像是在一扇门之间来回穿梭:在灵动外屏和开阔内屏之间,在速览与沉浸之间,也在掏出记录与铺开创作之间。

信息与视野随之跃迁,叙事与效率也在开合之间里完成切换。

华为Mate X7 将这层意象做成了看得见的标志性符号,收归于名为「时空之门」的一体化镜头模组之中。

这道时空之门延续了 Mate X 折叠屏系列从寰宇舷窗、寰宇星门、寰宇星轨演变而来的寰宇系列设计语言。

立体多维的「时空之门」模组,被安排在机身中轴偏上的位置,四周通过不同材质和颜色的过渡做出一种类似「门框」的效果。

边缘有切面、有高光、有层级感,给华为Mate X7 定下一个过目难忘的视觉重心。

在视觉上,它和云锦/素皮背板形成对话。一个提供温润的、流动的、有呼吸感的背景;一个提供理性的、几何的、稳定的视觉锚点。

两者结合,让整台机器在折叠和展开时,都有清晰的设计逻辑可循。

当然,镜头模组本身,就是通往光影世界的入口,也要为了内在影像表达的功能性而服务。

华为Mate X7 搭载了「第二代红枫原色摄像头」,其「光谱感知」能力得到跨越升级,色彩分辨力提升 25%、进光量提升 96%、色彩还原能力提升 43%,在复杂的混光场景也绝不偏色。

更重要的是,主摄采用了首创四切片镜片设计,配合 0.4mm 业界超薄玻璃镜片,既提升了进光量,又缩小了模组体积,本是相互冲突的因素,在华为Mate X7 身上,得到了妥善平衡的答案。

典藏版搭载折叠屏业界最大底——1/1.28 英寸 RYYB 超光变传感器,拥有 5000 万高像素,配备 F1.49 – F4.0 十档可变光圈,超强感光,无论明暗准出片。

配备的业界最大光圈潜望式长焦镜头,则通过分群对焦镜片组与长焦微距直立潜望系统,融合多维一体化对焦防抖马达,在极限体积里实现了光学规格的跃升。

这意味着,华为Mate X7 把堪比直板旗舰的超高规格影像,成功地塞进了极致轻薄的折叠机身之中,不再需要为了轻薄和折叠结构,而作出任何妥协。

真正高端的折叠屏手机,如何表达「高级感」设计?

历经六年迭代,折叠屏手机早已迈过了从尝鲜到常用的临界点。而在这个细分品类中,华为长期稳居份额第一,已成为公认的「折叠标杆」。

在这样的基础上,华为Mate X7 再度以「集大成」的姿态,给出更完整、更立体的答案:把看得见的设计、摸得着的质感、用得住的可靠、拍得好的影像、离不开的智能,串成一整段连贯的使用体验。

它以超可靠玄武折叠架构、耐用铰链与高等级防护把「轻薄」与「耐用」同时落地;再以第二代红枫影像与更强的主摄/长焦协同,让复杂光线与远近场景都能稳定出片;而在大屏场景与 AI 体验上,鸿蒙 6 大屏 AI、分屏协作与跨设备互联,让折叠形态从「好看」走向「高效」。

在解决轻薄、耐用、性能、影像等一个个棘手问题之后,高端旗舰手机又开始回到那个基础的命题:

到底应该用什么,来定义产品的「高级感」?

这并非突发的转向,而是长期积累后的必然。

随着中国厂商在供应链、工艺与设计上的成熟与自信,他们既有能力、也有必要回答更深的问题:中国高端手机到底应该长什么样?它的质感由何承载?用什么材料与表达去呈现?

作为折叠屏手机的佼佼者,华为Mate X7 的回答,是将云锦这种承载了 1600 年历史的非遗工艺,用现代工业的方式,在一块手机背板上重新演绎。

这并非简单粗暴地把纹样贴上去,而是选择先读懂云锦的核心:

经纬如何组织秩序,多材质叠层如何生成光影,逐花异色如何堆叠细节;随后再用现代材料科学,把这套逻辑重建为纳米纤维的经纬与工艺叠层,让纹理从材质里「长」出来。

这样的尝试,在中国消费电子史上并不鲜见,失败的例子也很多:仿陶瓷、仿织造、仿书画,最后只剩「形似神离」。

但华为Mate X7 的回答,不是模仿表面,而是将文化内核写进材料与结构本身。

放眼长远,华为Mate X7 站在中国高端手机与折叠形态演进的时间轴上,是一个值得标注的坐标:它昭示着中国高端智能手机正在以非遗的材料语言,给出关于「高级感」的答案。

夜里关灯前,你合上手机,随手搁在床头。微光掠过背板,那层纳米纤维经纬轻轻起伏;你未必了解「大花楼」与纳米工艺,但在每天打开它的那一刻,触摸到与玻璃、塑料不一样的指尖质感。

这份细微差异,无法明确写进参数表,却会慢慢渗入日常。

几百年前,云锦是权力与礼制的象征;几百年后,它亦化作华为Mate X7 的机身外壳,合于掌心阅信,展为大屏协作,立在桌角静赏光影——从宫廷器物到日用之物,文化的经与纬,仍在掌心流转。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


夸克 AI 眼镜体验:超细镜腿没负担,还能给出手机旗舰级画质

By: Lin
28 November 2025 at 17:15

「看起来很普通」,这句话对智能眼镜来说却是很高的评价,而这正是夸克 AI 眼镜最亮眼的地方。

就在昨天,阿里旗下的夸克正式发布了 S1 和 G1 两个系列共六款 AI 眼镜,起步价分别为 3799 元和 1899 元。我体验的是带显示的旗舰款 S1,而它给我的第一印象是:这可能是目前最接近普通眼镜的智能眼镜。

更细的镜腿、更小的光机

智能眼镜的痛点一直是镜腿的宽度。不同于市面上其它智能眼镜「宽腿粗框」的外形,夸克 AI 眼镜最独特的地方就是超细镜腿——从侧面看,它的镜腿只有 7.5mm 宽,是全球同类产品中最窄的,戴起来就和普通的眼镜框没有什么区别。

为了把镜腿做得更细,眼镜的电池被安排在了镜腿尾部,左右腿各一个。调整眼镜重心的同时,右侧的电池还被巧妙地设计成了可插拔的「换电」功能,日常使用中能够快速地延长续航时间。

超细镜腿压缩了显示光机的空间,但夸克还是通过定制方案实现了双目双光机,亮度最高可达 4000nits,实测在户外确实清晰可见。比较特别的是合像距可调节功能,可以在手机 App 中自定义不同功能界面的「显示距离」。

系统也为不同功能设定了不同的默认距离,例如需要和人面对面交流的「翻译」界面就设定在 2m,需要留意路况的「导航」就设定在 9m,不仅能降低眼球的压力,也能保障出行安全。

手机同款影像处理能力,表现超预期

说实话,我对于这款眼镜的画质预期并不高,目前的智能眼镜囿于体积和功耗限制,很难做到显示和拍摄两头都强。但实际用下来,它有挺多亮眼的表现。

光线充足的情况下能实现快速抓拍,日间的画质表现稳定,夜景照片经过和手机上类似的 RAW 域处理后也能获得低噪且色彩还原度很高的画质。

除了能直出 1080P 和 3K 两种分辨率的视频以外,防抖效果也很让我惊喜,骑行画面没有大幅度起伏,也没有防抖处理的残影。值得一提的是,配套 App 内为视频提供「AI 超分」、「AI 插帧」和「防抖」的后处理功能,最高能将视频提升至 4K@60fps 的规格。在硬件已经使出浑身解数以后,通过软件优化,也不失为一种好思路。

阿里亲生的眼镜,打通内部生态

同样属于 AI 方面的功能还有眼镜里搭载的阿里千问闭源模型,借助五麦克风阵列和骨传导技术,夸克 AI 眼镜能在嘈杂环境里准确拾音并很快地给出响应,除了常规的语音问答和调节眼镜本身的显示和声音以外,还能直接在眼镜端发起导航,或者拍照搜同款识别价格。

由于同属阿里系,夸克 AI 眼镜与淘宝、支付宝、高德等应用的整合较为深入。眼镜内的「识价」功能可以直接识别商品并显示淘宝同款价格,手机端使用高德地图发起导航能直接在眼镜中投屏显示,支付宝的「看一下支付」也终于是迎来了第一方设备的支持。

除此之外还整合了高德打车、飞猪旅行、阿里商旅、航班/高铁管家中的行程信息,直接通过眼镜画面进行实时通知。眼镜内的听歌功能打通了网易云及 QQ 音乐的会员曲库,还能在眼睛前直接显示滚动歌词。

夸克 AI 眼镜 S1 在设计上取得了明显进步,7.5mm 的镜腿让智能眼镜真正接近了普通眼镜的佩戴感和外观,显示效果和 AI 功能完成度较高,阿里生态的整合带来了显著的差异化优势。

智能眼镜本就是消费电子行业最大的趋势,而在人工智能、手机数码、传统视光等多个领域的玩家纷纷入局以后,这个趋势可能会比预期要来得更快一些。目前来看,夸克 AI 眼镜 S1,这份阿里交出的第一份答卷,表现着实亮眼。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为 Mate 80 Pro Max 评测:堆料之王

By: 苏伟鸿
28 November 2025 at 10:22

一谈到「国产高端旗舰」,我相信不少人的脑海里都会浮现「Mate」四个字母,即使他们自己并不是华为手机的用户。

国产手机「冲高」不是一个新话题,过去几年我们也看到越来越多在性能、影像、设计上都让人眼前一亮的产品,华为 Mate 系列不一定在每个维度上都是顶尖;但总体来看,依旧是唯一一个能不加任何前缀的国产高端手机系列。

全新的 Mate 80 系列更是证明了这一点:对比前面几代各有遗憾的 Mate,这一次的 Mate 80 是一台几乎全方位都能称得上「旗舰」的手机。

聊华为旗舰手机不可能避开它的影像,爱范儿围绕华为 Mate 80 Pro Max 的影像体验专门制作了一条评测视频。

关于 Mate 80 Pro Max 的更多细节,碍于视频篇幅无法详细展开,我们将在这篇图文评测中分享更多体验。

外观:不像手机的工艺水准

今年仅凭外观就一石激起千重浪的手机有三台:小米 17 Pro Max,iPhone 17 Pro Max,以及这台华为 Mate 80 Pro Max。

摄像头 Deco 的经典星环设计回归,却「买一送一」多出了一个显眼的圆环设计,引发了不少关于「好不好看」的讨论。

即使没有预想中的磁吸功能,这个圆环设计也很明显是设计师深思熟虑的结果。

功能上,它是一个无线充电的线圈,解决了 Mate 80 Pro Max 全金属机身设计与无线充电的冲突;设计上,这个圆环和摄像头的星环形成了一个数字「8」,既和 Mate「80」呼应,也取了一个好意头——别忘了 Mate 系列的主要用户客群都是商务人士。

华为官方也推出了一个磁吸手机壳配件,佩戴上就能解锁磁吸能力。

你大可以不欣赏 Mate 80 这个突破常规的背板设计,但它背后的工艺水准确定不可置否。

Mate 80 Pro Max 的背板其实分成了三个部分:最大面积的金属背板、中央的金属圆环,以及圆环中心的圆形区域,这三个部分的工艺和材质都各不相同——圆环部分使用的是锦纤材质,摸起来更顺滑。

背板的三重拼接虽然很有水平,却很容易出现公差,爱范儿手上这台 Mate 80 Pro Max,圆环和背板之间还是能看到些许缝隙。

值得一提的是,只有 Mate 80 Pro Max 是金属机身和三重拼接工艺,Pro 版本和标准版都是锦纤材质,高端感略有打折,不过没有接缝则带来一体性更强的背板。

金属背板的工艺名为「光绘微纹」, 利用激光在金属背板进行微米级雕刻。

原本担心这种精细的纹理结构容易藏污纳垢,或者会磨指甲。实际上手后发现自己多虑了——Mate 80 Pro Max 机身的颗粒感相当细腻,不容易积累脏污,给人的手感不像智能手机,更像名表。

行业少见的高端工艺,正是当年华为 Mate 手机品牌高端化的第一个跳板,现在也已经成为了重要的护城河。用户不需要知道这些工艺细节,一上手就能感知它和其他手机的质感上的差距。

比起在工艺上整的花活,华为 Mate 80 系列的握持感是更实在的优秀体验。

今年的 Mate 80 系列全系改用了 2.5D 直屏设计,直角中框和背板之间的过渡做得相当顺滑,属于今年直屏旗舰的天花板水准,钛合金中框也做了抛光处理,观感非常吸睛高级,手感则相对温润。

Mate 80 RS 非凡大师则继续采用家族式的八边形「星钻」设计,背板也还是玄武玻璃材质,新增的槿紫配色搭配这个光亮的钛合金中框,通体给人的感觉很像一台超跑——可惜还是很粘指纹。

对于怎么在机身上营造高端感,华为已经相当驾轻就熟,能够用不同的材质,营造出具有区分度的高端感:

特别是 4000 元档位的 Mate 80 标准版,凭借精致的锦纤材质,和 Pro Max 一脉相承的设计语言,它依旧能很好代表 Mate 门面,低门槛不低质感。

影像:硬件只是入场券,感觉更重要

关于手机影像,我们已经听过太多硬件和参数的故事,在华为 Mate 80 Pro Max 拿到手那一刻,我想聊聊「感觉」。

【视频号】

这几年,各家厂商都在卷长焦、卷底大,华为却想明白了一件事:强大的硬件只是入场券,如何让拍摄的过程不再有痛点,才是「旗舰体验」的终极命题。

XMAGE 影像一直有着自己独特的色彩科学,这一次,Mate 80 Pro Max 补全了最后一块拼图,新增了两个极具反差的预设配方,让情绪的表达不再有死角。

基于明快风格的「美女」模式,走的是东方美学的路子,灵感来源于一幅留白的仕女图,它克制、淡雅,肤色处理得极度温和,不抢眼,够耐看。

而切换到基于鲜艳风格的「野兽」模式,致敬了西方野兽派艺术,色彩浓郁,撞色大胆,溢出屏幕的生命力,像极了马蒂斯笔下打破常规的油画。

撑起这种张力的是硬件的底气——这一代,全焦段 RYYB 排列配合第二代红枫原色摄像头,你会发现一个明显的感知:稳。

从超广角、主摄到两颗潜望长焦,四颗镜头的色彩一致性被调教得空前统一,彻底告别割裂感,配合夸张的 17.5 EV 动态范围,即便在大光比逆光场景,高光与暗部也能被收拾得服服帖帖。

除了拍摄,后期也是体验的重中之重。

Mate 80 Pro Max 在后期编辑上做到了链路可逆,你可以在相册里随意调整水印的样式。

以前我们常说传感器的宽容度,决定了能救回多少光影;而现在,华为用链路可逆,带来了体验上的宽容度——你永远拥有「反悔」的权利。

在以往,能做到这一点的手机品牌凤毛麟角,这种独属于手机维度的「高宽容度」,标志着华为的影像旗舰,正式从技术突进主导,转向了体验的终极完善。

如果说后期是给你兜底,那 AI 辅助构图,就是在为你帮扶。

当你面对杂乱的街道或宏大的建筑,它会敏锐识别出画面中隐藏的几何线条,并在屏幕上引导你移动取景框,直到最准最具张力的黄金点时,马达会传来一声极其轻微的震动——对,就是这里,锁定了。

这种感觉很奇妙,相比 Pura80 系列,它的模型规格翻了一倍、焦段推荐精度提升了 5 倍。借助 AI,手机填补了普通人与摄影师之间的技术鸿沟,没有摄影基础,也能轻松拍出有故事的照片。

把黑夜拍得像白昼,那是技术的暴力;能把此刻的情绪原封不动地装进相册,才是体验的胜利。

Mate 80 Pro Max 的影像系统,给我的感觉就是两个字:完善。

从硬件上,它有第二代红枫原色和 RYYB 的硬实力做底气;从软件上,它有「美女与野兽」这样极具人文张力的审美选择;从体验上,它用 AI 帮你找角度,用可逆的后期让你无后顾之忧。

配置:不仅能打游戏,还打得舒服

在聊 Mate 80 Pro Max 配置体验之前,我想先聊聊 Mate 80 标准版。

以往,不管是 Mate 还是 Pura 系列的标准版,配置对比 Pro 版本差距明显,不过今年的 Mate 80 补齐了 3D 人脸识别的缺陷,性能也比上一代有 35% 的提升,加上起售价降低 500 元,标准版一下子就相当有性价比。

至于我们手上的 Mate 80 Pro Max 和 Mate 80 RS,堆料带来的体验提升也非常直观。

在发布会上,华为很少见地主动强调了 Mate 80 系列的性能提升,并强调了它在游戏场景的进步。

华为 Mate 80 Pro Max 30 分钟极高画质打《原神》,全程基本能稳住 60 帧,没有卡顿和明显掉帧,机身温度也只是温热。

平时用小米 17 Pro Max 的老玩家表示,Mate 80 Pro Max 相比之下没有差距。

不过依旧存在优化空间:Mate 80 Pro Max 触控采样率还不够高,玩起来有点不太跟手;耗电也稍微有点快,30 分钟游玩消耗电量 12%。

除了性能,Mate 80 Pro Max 上的另一个「猛料」就是这块双层 OLED 屏幕。

这个原本是 RS 非凡大师独享的配置,今年也下放到 Mate 80 Pro Max 上,最明显观感就是一个字——「亮」。

比起在显示技术和屏幕材质上做文章,双层 OLED 的超高亮度是一种数值上的强度美,能直接解决很多户外场景的显示痛点。

这几天刚好广州天气不错,带着 Mate 80 Pro Max 和 Mate 80 RS 出去外拍,完全不用担心会看不清屏幕,拍好的样片不用带回办公室,在太阳底下就能看个仔细。

▲ 左:华为 Mate 70 Pro+,右:华为 Mate 80 Pro Max

当然,更高的峰值亮度不可避免带来更高的能耗,不过即使续航会大打折扣,机身发热却并不如预想中狂飙。

你可能已经发现了,关于这台手机各种使用感受,我经常提到「不发热」或者「不太发热」。实际上,这正是我眼中 Mate 80 最大的进步之一。

上一代华为 Mate 70 Pro+ 的体验,很大程度都受「容易发热」这个短板影响,即使是日常刷十来分钟的小红书和微博,机身也会明显有热感,打开相机更是会进一步升温。

而 Mate 80 Pro Max 以及 Mate 80 RS,不管是在平日使用、拍照、游戏,发热情况都有很明显的改善——只要不打开「卓易通」,基本不会出现烫手的情况。

这既得益于硬件升级带来的能效提升,也很大程度归功于「原生鸿蒙」HarmonyOS 的优秀优化。

鸿蒙系统:小步快跑,迈过可用门槛

华为 Mate 80 系列出厂搭载的是 HarmonyOS 6,这也是第一台只搭载原生鸿蒙的 Mate 旗舰。

今年年中,我们对纯血鸿蒙系统的使用体验和应用生态进行了一个阶段性的点评:系统非常流畅,应用生态欠缺,最大短板是微信。

过去了差不多半年,这个点评还能原封不断用到 Mate 80 系列的 HarmonyOS 6 上。

生态覆盖率超过 95% 的鸿蒙系统,已经过了快速增长期,进入长尾 App 和应用体验补齐的积累阶段。

半年前,我常用的二十个应用中只有 Apple Music、多邻国、网易云音乐、微博轻享版和订阅号助手没有原生鸿蒙版本;目前这五个应用依旧缺失,其中有三个来自国内大厂。

剩余的原生应用,功能正在渐渐补齐,不过一些页面和功能依旧缺失,例如美团「视频」「书城」界面——虽然在大部分人眼中这是一种优点。

▲ 左:iOS 美团应用;右:鸿蒙美团应用

构成我们智能手机使用时间大头的微信,则依旧在各种地方存在功能缺失:实况照片、新版公众号推流界面、微信状态、聊天文字提醒、朋友圈背景更改、视频号小窗、好友标签、红包封面、发起直播、QQ 号登陆等等……

这其中有些功能确实属于冗余,但也有不少「到用时方恨无」的痒点功能。

一些缺失的国产应用和海外应用,则分别可以用「卓易通」和「出境易」安装 Android 的 APK 版本。

运行这些应用的体验总体比较流畅,但有时候会导致手机快速发热,也无法跳转鸿蒙微信验证登录,读取手机文件也颇费周折。

不过在 HarmonyOS 6 中,一些通过卓易通和出境易安装的 Android APK 也可以收到系统通知、进入系统播放空间,应用也终于可以拖出大文件放到桌面,极大提升了 Android 应用的使用体验。

HarmonyOS 6 的系统表现让人放心,动效和流畅性方面比 Android 精致,又比 iOS 26 稳定,不过有些地方观感上还没打磨到最好,某些动效也略显赘余。

例如新的「实况窗」也紧跟潮流做成了「灵动岛」样式,设计没有以前的药丸精致,整个状态栏略显拥挤,点击的动效也比较冗长。

HarmonyOS 6 功能上的大部分技能点,主要分配给了「AI」。

小艺助手也越来越有「智能体」的样子,现在真的动动嘴就能让它帮忙做事,例如自然语言修图,或者帮忙买咖啡。

不管是对于华为 Mate 80 系列,还是放大到所有的华为硬件,当下的鸿蒙系统早已跨过了「可用」的门槛,正在不断向「好用」进发。

实际上,就流畅度和稳定性来说,Mate 80 Pro Max 的 HarmonyOS 6 已经绝对算得上行业里 T0 的级别。

操作系统和生态的养成并非一朝一夕,一个应用开发需要投入大量的资源。像是微信这样的大型应用,从零开发不仅需要追上十余年的迭代,同时还要追加新功能。

想要加速整个过程,华为就必须要将蛋糕做大,获得更大的用户基本盘

于是,在华为全面进入纯血鸿蒙时代的今年,也成为了华为史上硬件产品最精彩纷呈的一年,或许没有之一。

Mate 80,证明鸿蒙已经「成了」

今年的华为硬件都有一个特质:堆料给够的同时,形态也够创新,用这些领先行业的硬件,去托举目前还未做到满分的鸿蒙系统和生态。

这一点首先在「阔折叠」「三折叠」「折叠电脑」这些折叠产品上得以体现。形态更常规的 Pura 80 系列和 Mate 80 系列,则靠硬件堆料和各种「黑科技」来争取最多的高端用户。

▲ 华为 Pura X

Mate 80 系列在保持一贯「高端旗舰」定位,靠品牌和工艺和国产 Android 旗舰拉开距离的同时,屏幕、影像、性能上也将配置拉满。

标准版不瘸腿,超大杯堆猛料,价格还比去年降了不少。

在发布会总结的评论区,不少读者朋友们纷纷留言,询问鸿蒙系统是否支持一些特定的专业应用,这意味着不少消费者已经被华为 Mate 80 系列的硬实力所吸引,虽然对鸿蒙生态还比较陌生,也已经动了入坑的念头。

朋友圈和社交平台更多的晒单截图,以及明年才能发货的订单量,都明示着一点——可用性更高的原生鸿蒙系统,早已不是消费者选择华为手机的障碍,在价格和配置的吸引下,下单的理由更加充足。

毕竟,一台 4699 元的华为旗舰手机,真的可以称得上「性价比」了。

这不由得让人想起今年的另一大高端品牌旗舰——苹果 iPhone 17 系列,同样是标准版谈性价比,高配把配置堆上的策略。

当这些已经成功高端化的品牌开始卷价格和配置,对于正在冲高、价格相当的国产 Android 品牌来说,竞争无疑进一步升温。

对华为而言,这既是在收复前几年被迫让出的市场,也是托举鸿蒙系统的有力举措,

时至今日,我们可以下一个结论:即使仍需要时间成熟,鸿蒙系统已经取得实际上的「成功」,因为华为成功摸索出一个路径,形成了一个如鱼得水的基本盘。

做系统是一个长坡厚雪的过程,华为已经把坡做长,现在就等着落雪足够深厚,让鸿蒙系统成为高端手机竞争下半场的「撒手锏」。

 

*本文由苏伟鸿、周奕旨共同完成

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为Mate 80系列,回答了珠峰脚下最出名的问题

By: 艾 梵
27 November 2025 at 17:34

1924 年,珠穆朗玛峰脚下。

《纽约时报》的记者追问英国登山家乔治·马洛里,为何要以身犯险、执着于攀登那座死寂的雪山时,他留下了一句回荡百年的低语:

Because it’s there. 因为它在那里。

那是人类对「极境」最原始的冲动,这种冲动,随着工业革命和信息革命的轰鸣,化作了我们手中的工具,从登山镐到如今的智能手机,工具的形态在变,但内核未变——

手机,早已不是单纯的通讯工具,它是现代人的「数字器官」,在充满不确定性的世界里,探索未知的权杖。

11 月 25 日,当华为Mate 80系列正式亮相时,我看到的不仅是一款电子产品的迭代,也是一种久违的、关于「探索者」精神的回归。

在手机逐步同质化的红海里,它选择了一条通往无人区的路,并在那里,留下了两枚清晰的足迹。

当设计越来越乱,华为选择回归秩序

探索的第一步,往往是从对抗混乱开始的。

如果把视线拉回当下的手机市场,你会发现一个有趣的现象:我们一边在技术上狂飙突进,一边却在设计上陷入了「熵增」。

为了追求更激进的影像参数,摄像头模组越来越大,元器件塞得越来越满,可以说,我们目前所能看到的设计,大多数是妥协的——先让渡于功能,再乞求于美感。

这种妥协带来的代价是设计语言的崩塌:一代一个样,家族基因在混乱中逐渐模糊。

那有什么标准,可以同时承载性能野心、家族传承和美学需求呢?

华为的答案,是对称。

德国数学家赫尔曼·外尔在他的经典著作《对称》中,给了这种充满规整感的结构一个宏大的定义:

对称,是人类试图去理解和创造秩序、美与完美的一个理念。

回顾华为Mate 系列的历史,就是一部建立秩序的进化史——

Mate 20系列,源自超跑车灯的经典设计,规整地落于中轴;Mate 40系列,我们熟悉的星环设计横空出世,象征着宇宙的星环将愈发强悍的影像组件包容其中,并延续至今。

▲ 华为Mate 40系列的经典星环设计

华为始终在方寸之间,坚持着中轴对称的设计逻辑,并传承着逻辑中潜藏的美。

真正的设计,不是不能做加法,而是在这个过程中建立秩序与传承,而对称,便赋予了这种秩序一种万物稳固的底气。

到了华为Mate 80系列,这种秩序感被推向了一个新的维度。

这一次,华为没有停留在星环的舒适区,而是再次破圈,带来了全新的「双环设计」——机身中轴线上,出现了又一枚显眼的圆环。

初看,你依旧可以一眼认出这是华为中轴对称基因的延续——大气、沉稳且庄重,但当你凝视那两个交叠的圆环时,你会读出一种新的、动态的张力。

在纵向的维度上,双环一上一下,形成向上攀登的两枚足迹。试着想象一下,在从未有人涉足的皑皑雪原之上,这交叠的双环,便是先行者留下的第一行印记,把探索的精神内核,具象化为了一个颇具动感的故事——关于出发,在无路之处走出路来。

而在横向的维度上,当你转动手机,视角随之流转,这组双环便化作了神秘的无限符号 ∞,这是一个关于未来的隐喻,它象征着 Mate 系列对技术边界与美学高度的探索,未有穷期。

一显,是足迹,代表着当下的勇气;一隐,是无限,昭示着未来的可能,至此,Mate 80系列的双环,将无限探索这一抽象概念,凝练为最直观的视觉语言。

这个静止的几何符号,被赋予了关于时间的动能——它是出发的信号,也是行动的证明;是踏入无人区的第一步,继而迈出探索未来的无数步。

以至刚之躯,赴极境之约

有了探索的野心,还得有一副能扛得住风雨的筋骨。

公元前 190 年,爱琴海的悬崖之巅。

一尊名为《萨莫色雷斯的胜利女神》的雕塑被特意安置在这里,直面大海,迎着狂暴的西北风,一站,便是六个世纪的惊涛骇浪。

为什么这些古希腊的石头能穿越千年,依然给人以震撼的美感?

除了本身的做工、形态之外,还有一种力量美、强度美,这种核心的美,支撑它可以跨越数百年的雨打风吹日晒。在手机这样的耐用消费品世界里,逻辑亦是如此——很多时候,强度,本身就是一种高级美学。

在这个维度上,华为Mate 80 Pro Max 做了一件让人意外的事——凭借一己之力,在行业内掀起了一场「全金属风暴」。

它是 5G 时代唯一一款敢于采用全金属设计的旗舰手机。

十年前,金属曾是旗舰标配,但随着 5G 时代的到来,信号复杂度的提升,以及无线充电的普及,金属因为其物理上的屏蔽属性逐渐退场,我们习惯了玻璃的易碎与素皮的磨损,渐渐遗忘了金属那绝对可靠的坚韧。

这种遗忘,本质上是一种妥协。

为了打破物理魔咒,华为祭出了全金属玄武架构,从结构到防护的层层强化,让 Mate 80 Pro Max 拥有了如那尊希腊雕塑般抵抗风雨的底气。

但更令人惊叹的,是华为处理这块金属的方式——在硬度与温度之间,找到了第三种解法。

通过金属光绘微纹工艺,华为突破了传统金属加工的边界,数十万个光学级精密微结构被雕刻在背板之上,当你第一次指尖触碰它,预想中属于金属的冰冷并未袭来,取而代之的,是一种类似丝绸、又似玉石的温润触感。

光影流转间,机身流淌着星流影集般的动态光影;「Mate」 Logo 被内敛地藏于特定角度下,若隐若现。

看着硬,摸着软;视觉是冷冽金属,触感却如温润玉石,从微末中探索极致,从而解决行业难题,建立起属于智能手机的强度美,这是华为「明知不可为而为之」的美学辩证法。

但,我们为什么需要一副如此坚强的躯壳?

王安石在他的《游褒禅山记》中,已经给出了答案:

世之奇伟、瑰怪,非常之观,常在于险远,而人之所罕至焉,故非有志者不能至也。

坚若磐石的全金属机身,是我们「抵达极境的凭仗」,而「抵达极境后的收获」,就流淌在机身背后。

色彩,是光线的游戏,也是勇敢的勋章,华为 Mate 系列在色彩美学上,一直遵循着探索的叙事逻辑——向自然借色。

从 Mate 40 的秋日胡杨到 Mate 60 的雅川青,每一个配色背后,都站着一片山川湖海。

▲ 华为Mate 60系列雅川青

这一次,随着双环设计的脚步,Mate 80系列将目光投向了更遥远的「极境」。

Mate 80 和 Mate 80 Pro 从自然界的宏大景观中汲取灵感,带来了云杉绿、雪域白、曜石黑、晨曦金。

云杉绿取自生长在海拔 3000 米之上,历经风霜依然苍劲的针叶林,透着一股顽强的生命力;雪域白,去除了工业白漆的燥意,还原了阳光照射在千年积雪上的那种纯净与圣洁。




而在 Mate 80 Pro Max 上,这种色彩叙事被推向了高潮——华为将视线投向了更遥远的极地,带来了四款「极境之色」:极光青、极昼金、极地银、极夜黑。

极光青,复刻了极夜苍穹下,那抹变幻莫测的欧若拉之光,神秘而难以捕捉;极地银,如同冰川折射出的冷冽光辉,纯粹而锋利。

而极昼金与极夜黑,则定格了极境的一体两面:前者是午夜太阳洒在冰原上的一抹神圣暖意,后者则是极寒世界沉浸于深邃暗夜的厚重与神秘。

色彩,是一种跨越语言、种族与文明的通感,在这个被钢筋水泥包裹的时代,我们比任何时候都更需要那一抹来自极境的亮色,提醒我们世界依然辽阔。

带上最坚硬的装备,去把世界尽头的风景装进口袋,然后继续向前,探索下一个极境。

致敬无畏探索的勇气

每个人心中,总能选出一些具有象征意义的产品。

华为 Mate 系列也不例外,翻开 Mate 系列的编年史,你会看到清晰的精神脉络:

Mate 40系列-致敬生命的顽强;
Mate 50系列-致敬极境中的敢为;
Mate 60系列-致敬奔腾不息的力量;
Mate 70系列-致敬交融共生的力量;

时间来到 2025 年,技术进入深水区、世界充满了更多的不确定性,华为Mate 80系列的选择是什么?

11 月 25 日,那首改编版《篇章》的旋律在发布会上响起,交响乐的厚重与电声乐队的激昂交织在一起,便是最好的答案——「实力破圈,开启新篇」

如果说无限探索是 Mate 的内核,那么这一代的使命,便是从单点突破走向引领未来。

中轴线上的双环,是指引方向的图腾;坚韧的全金属机身,是抵抗风暴的底气;取自极境的颜色,是探索路途的收获——这种形与意的深度契合,使得「共赴」的愿景,在 Mate 80系列身上完美自洽。

新篇已启,华为Mate 80系列选择了致敬无畏探索的勇气。

文章的最后,我想把时钟再次拨回 1924 年,回到那个被风雪笼罩的珠峰脚下。当乔治·马洛里说出那句「因为它在那里」的时候,曾有人批评,这是一种征服者的傲慢。

但我认为,还有另一种更温柔的理解——在这个回答里,「它」 指的不仅仅是那座物理意义上的 8848 米高峰,而是人类认知边界之外的空白。

因为那里有空白,所以我们需要去填充;因为那里有沉默,所以我们需要去聆听。

人类的历史,本质上就是一部不断向未知与极境探索的历史,我们制造工具、打磨石斧、冶炼金属,不仅是为了生存,更是为了把感知的触角,伸向更远的地方。

工具的演进,其实就是人类勇气的容器。

千百年来,我们不断扩展着这个容器的边界,海洋不再是阻碍,天空不再是禁区,当天堑变通途,甚至连宇宙深处也有了人类的脚印时,华为Mate 80系列将视线收回,给出了一个更为个人的理解:

在这个时代,探索不再局限于物理维度的宏大叙事,而是回归到了每一个具体的个人。

所谓的「极境」,未必是海拔 8848 米的高山。它可能只是你在按下快门时捕捉到的那一瞬悸动,也可能是你决定走出舒适区、迈向未知的那个微小瞬间。

在这个意义上,我们都是探索者。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为 Mate 旗舰新机上手:我们用 20 倍长焦微距,找到了一个小彩蛋

By: 苏伟鸿
25 November 2025 at 20:14

刚刚新鲜发布的华为 Mate 80 手机和一系列新品,爱范儿已经第一时间开箱上手体验。来看看今年最强华为手机,有什么亮点?

首先看华为 Mate 80 Pro Max,我们拿到的是「极昼金」配色。这次采用了全金属材质的机身,背面采用全新的双环设计。

不过下面的圆环并没有我们预想中的磁吸功能,主要还是起到一个造型上的作用。华为官方则推出了一个磁吸手机壳配件,佩戴上就能解锁磁吸能力。

机身上用金属光绘,在金属表面刻出了致密的纹路,用指甲刮一下是能听到声音的,我们用长焦微距放大 20 倍,甚至还能看到表面的纹理细节,华为藏的小彩蛋,也被我们找到了。

接着是这部华为 Mate 80 RS 非凡大师,新增的紫色相比黑白红来说,会更有个性一些。

Mate 80 全系列都改直屏设计,整机线条看上去更加硬朗,但边框过渡做得很顺滑,一点也不硌手。

Mate 80 Pro Max 和 Mate 80 RS 非凡大师搭载的的双层 OLED 屏幕有点东西,在 1% APL 能做到业界最亮的 8000nits,堪称闪光弹。

Mate 80 RS 非凡大师还支持全链路的 BT.2020 广域色彩管理,SDR 的图片和视频都能实时提升至 HDR 播放,肉眼提升很明显。

最后看新的大折叠华为 Mate X7 典藏版,我们手上这台同样是很有韵味的紫色,依旧是素皮材质,不仅耐用,外观也很典雅。

影像方面,这次发布的新机都搭载了第二代华为红枫影像,无论是 Mate X7 的四摄,还是 Mate 80 Pro Max 的双潜望五摄,都能实现超广角到超长焦的全焦段色彩一致,至于具体表现有多强,爱范儿后续也会为大家带来详细的影像评测。

形态有点意思的二合一平板电脑 MatePad Edge,爱范儿已经提前拿到手体验了好几天。

MatePad Edge 配备了一块 14.2 英寸的 OLED 屏幕,窄至 4.1mm 的窄边框、94% 的高屏占比,配上 6 扬声器,娱乐体验还是很沉浸的。

更重要的是,MatePad Edge 并非只有一面,只要在屏幕上四指滑动一下,我们就能看到它的界面顺滑的从平板模式切换到了 HarmonyOS PC 一模一样的电脑模式。

这时,只需要把 MatePad Edge 吸附到新款的「星跃悬浮键盘」上,你的 MatePad 就可以秒变笔记本了——一个运行 PC 版系统的「真 · 笔记本」。

更重要的是,两套模式共享一个系统基座,让 MatePad Edge 能够兼容平板和 PC 两种应用生态,比如这个过往由 Pad 独占的「天生会画」app,这次在电脑模式下也能使用了。

两种模式共享同一套文件管理系统——电脑模式下有什么文件,平板模式下都能访问;平板模式下画好的图纸,切换到电脑模式就能直接读取,创意和效率都能兼顾。

可以说,华为的鸿蒙二合一平板电脑,终于跳出了传统「二合一」电脑的框架,无论是平板模式还是电脑模式,都能提供 100% 的体验。

最后一个新品,我先不说是什么产品,看看大家能不能猜出来它的功能:

这,就是华为最新的路由器 X3 Pro,它打破了路由器要么很大要么很丑的常态,做出一个你会很愿意将它摆在眼前的造型,把自然景观带到你的桌面。

独特的雪山造型,搭配冷暖氛围灯光,能根据时间和天气自动变换光效——晴天是耀眼的阳光,夜晚是温馨的暖光,阴天雪天则是清冷的白光。

华为路由 X3 Pro 可不是一个中看不中用的花瓶,它支持PLC 电力组网,安装使用超方便。主路由插上电源和网线后,就能把网络传输到电路上,房子里只要有电的地方就有网,插上子路由就能拓展网络覆盖,没有预留网口的地方也能信号满格。

传统的路由器,我们在家装时总是费尽心思把它藏好,但华为路由 X3 Pro 却让我们想找个好位置摆出来,它既是设备,也是装饰。希望以后,这种用心做设计的产品能再多一点。

以上就是这波华为新品的开箱,对于 Mate 80 和 Mate X7 系列手机,以及 MatePad Edge,你还有什么想要了解的吗?欢迎在评论区留言,详细评测马上就来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


荣耀 500 Pro 体验:Live 图也支持路人消除,从影像到性能全覆盖的 AI 手机

By: 梁梦麟
25 November 2025 at 18:45

近日,荣耀推出了数字系列新品,新品有荣耀 500 标准版和荣耀 500 Pro 两款,标准版定价 2699 元起,500 Pro 定价 3599 元起售。

设计部分,荣耀 500 系列的后盖采用了一体冷雕工艺,用高精度 CNC 雕刻处理成一体化的玻璃后盖。后盖表面经过细腻的哑光磨砂处理,触感光滑细腻。

DECO 部分突出的玻璃面模到后盖有顺滑的视觉过渡,一体性极强。整机支持 IP68 & IP69 & IP69K 防尘防水,保证了机身在日常环境下的耐用度。

后摄模组以横向排列为主,横向排列的好处是尽可能压缩 DECO 结构占用空间,纵向握持拍摄时不会被手挡到。

模组从左到右排列的分别是 1/1.4 英寸 2 亿像素三星传感器的超清 AI 主摄,中间是超广角镜头,右侧下方的是 3x 长焦镜头。

相机支持全档位 Live 图拍摄,用户可以在 Live 图中开启美颜功能和人像虚化,透过机身内置的多帧识别跟踪功能在 Live 图里面实现路人去除功能。

手机内置的六种胶片色彩算法能够在 Live 图拍摄中开启,荣耀还提供了一个全新的「破框而出」Live 特效。透过 2-9 张 Live 图或静态图组合,手机会将当中的人物、宠物主体放大,做出类似破框的效果。就是在 Live 图的玩法上,荣耀 500 系列已经很丰富了。

拍摄稳定性的部分,荣耀 500 Pro 支持荣耀最新的防抖方案,透过自身光学防抖结构和 AI 自适应防抖模型结合,主摄可实现 CIPA 5.0 级防抖,在弱光环境下增加快门曝光时长的同时提升稳定性,从而提升弱光成片率。

续航部分,荣耀 500 Pro 搭载了 8000mAh 青海湖电池,配上机身自身的 AI 电源管理和算法,进一步提升续航,日常使用坚持 2-2.5 天,接入网络的状态下来到 4 天后还有 43% 电量的表现算是很稳定了。

充电组合的部分,荣耀 500 全线支持 80W 有线快充,500 Pro 增加了 50W 无线快充,实测通用快充也能够达到 55W PPS,最高能够录得 71W,充电支持比较全面。

作为一台大电池手机,荣耀 500 系列支持最高 27W 反向充电,这最高瓦数会比之前 REDMI Turbo 系列提供的还要再高一点。

不只是 iPhone,这功率基本能满足大部分手机的通用快充功率启动的功率,日常作为备用机使用的时候能够给主力机快速补电还是很实用的。

性能部分,荣耀 500 Pro 搭载高通骁龙 8 至尊版移动平台,支持 OS Turbo X 技术和 Vulcan 图形引擎,提升 app 启动速度和图像活动的流畅性。

游戏部分,荣耀 500 系列加入了荣耀幻影引擎 3.0 技术并提供「幻影稳帧」功能,在游戏管家中开启后能支持《王者荣耀》、《和平精英》、《原神》、《崩坏:星穹铁道》、《绝区零》和《鸣潮》中实现更稳定的高帧率表现。

此外,除了《王者荣耀》、《英雄联盟手游》、《穿越火线》、《使命召唤手游》、《三角洲行动》和《暗区突围》等游戏,荣耀 500 Pro 都能在这些游戏中开启 120fps 模式,玩射击游戏的体验就更加流畅。

屏幕部分,荣耀 500 Pro 搭载了一块 6.55 英寸 2736×1264  120Hz 绿洲护眼屏,最高支持 6000nits 的局部峰值亮度和 3840Hz PWM 调光和照明闪烁检测,还有通过内在的 AI 功能调节亮度和对用户用眼做建议,以及根据用户需求调整显示功能。

显示技术部分,荣耀 500 系列支持 AI 臻彩显示和 AI HDR 技术,AI HDR 技术可在观看 1080P、720P SDR 画面时提升显示的动态,达到类似 HDR 的效果,优化显示表现。

最后来看看定价,荣耀 500 Pro 有海宝蓝、耀石黑、月光银和我们手上这款星光粉四种配色,提供四个储存版本:

·12GB+256GB 3599
·12GB+512GB 3899
·16GB+512GB 4199
·16GB+1TB 4799

「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


4699 元起!华为发布 Mate 80 系列:全能、直屏,还有性价比

By: 苏伟鸿
25 November 2025 at 17:21

今年华为开了很多发布会,推出了不少「又新又怪」的产品——「阔折叠」Pura X、「折叠电脑」MateBook Fold、「一目双镜」Pura 80 Ultra 等等……

但今天发布的华为 Mate 80 系列,却是一台相当「板正」的手机,少了几分探索,但分量十足,无论从外观做工还是硬件配置,都称得上今年手机行业的压轴。

除了华为 Mate 80 系列,这场发布会还带来了双折叠手机华为 Mate X7、二合一电脑华为 MatePad Edge 等,这一系列旗舰级新品,构成了华为年末冲刺高端市场的前线。

华为 Mate 80 系列:堆料到极致

华为 Mate 80 系列一共包含四款手机:

  • 华为 Mate 80
  • 华为 Mate 80 Pro
  • 华为 Mate 80 Pro Max
  • 华为 Mate 80 RS 非凡大师

这次把以往超大杯「Pro+」后缀改成「Pro Max」,虽然引起了一些舆论,但说实话,看起来直观不少,消费者一眼就知道是顶配型号。

今年 Mate 80 的标准版和几个 Pro 版本之间的差距,比以往要更少:标准版终于用上了 3D 结构光人脸识别,可以用于支付等场景;往年只有标准版独享的直角中框设计,今年全系标配。

爱范儿也提前上手 Mate 80 Pro Max,我们发现这次的中框到背板做了很精致的圆滑过渡,丝毫没有割手的感觉。

背面的双环设计,不仅是为了契合「8」这个意象,也是为了解决全金属机身的无线充电问题,好不好看就见仁见智了。

华为 Mate 80 Pro 的后盖采用一种名为「光绘微纹」的新工艺,全金属背面进行微米级雕刻,精细度是腕表级微纹的十倍。

余承东还提到了一个小彩蛋:Pro Max 版本手机上雕刻了「MATE」字样,大家拿到手机后可以用放大镜找找。

另一个重点,则是华为 Mate 80 Pro Max 的屏幕——这是一块双层 OLED 显示屏,华为将其命名为「灵珑屏」。

由于成本高、良品率低,双层 OLED 以往是最贵的「非凡大师」专属,但今年开始也下放到 Pro Max 型号,意味着相关供应链技术更加成熟。

双层 OLED 最「亮眼」的优势就是超高屏幕亮度,特别是在户外环境,比其他常规 OLED 手机屏幕要明显更透亮,1% APL 峰值亮度达到夸张的 8000nits。

除此之外,双层 OLED 屏幕还具有透亮、功耗低、寿命更长的优点。华为 Mate 80 RS 非凡大师支持业界首发 BT.2020 广色域拓展技术,适配拍照、录像、现实、设计、投屏等等场景,未来将支持第三方头部应用。

和这两年的华为手机发布会不同,华为这次强调了 Mate 80 系列的性能表现,Pro 版本对比 Mate 70 Pro+ 提升 42%,还支持硬件级别光追,每秒光线渲染 2000 万条,支持《三角洲行动》等游戏。

影像能力无疑是华为 Mate 系列的重头戏,华为 Mate Pro Max 搭载了五颗摄像头,主打高动态主摄 + 双长焦配置,除了红枫摄像头皆是 RYYB :

  • 主摄:17.5EV 超高动态,5000 万像素,F1.4-F4.0 十档可变光圈
  • 中长焦:4x 光学微距长焦,5000 万像素,F2.1 光圈
  • 超长焦:6.2x 光学超长焦,5000 万像素,F3.2 光圈
  • 超广角:4000 万像素,F2.2 光圈
  • 第二代红枫摄像头

Mate 70 首发的红枫原色摄像头广受好评,Mate 80 搭载的第二代色彩准确度提升 43%,动态范围提升了 300%。

硬件实力够强,Mate 80 系列在影像功能上也没有落下——全新的「动感摇拍」能很好抓拍动态照片,拍摄主体保持清晰,背景动态模糊。

原生色卡有了更多的选择,色彩模式新增仕女图淡雅的「明快」和野兽派强烈的「鲜艳」风格,AI 构图对比 P80 系列在效率和构图丰富度上都有所提升。

华为 Mate 80 系列出厂搭载 HarmonyOS 6 系统,AI 能力更上一层楼,支持 AI 语音修图、小艺再买一单、拍攻略自动识别等等功能。

华为一直都是手机通讯领域的探索者,除了卫星通讯,华为 Mate 80 系列也首次支持「无网应急通讯」。

行业已经有不少手机厂商在做类似的功能,而 Mate 80 系支持最远 13 公里通讯。在救援场景,Mate 80 不只能和手机交流,可作为被救端和搜救端定位,野外失联场景,可以被无人机扫描搜救。

华为 Mate 80 RS 非凡大师延续八边形「星钻设计」,影像配置与 Mate 80 Pro Max 一致,双层 OLED 屏幕支持 BT.2020 广色域拓展技术。

对比 Mate 70 系列,华为 Mate 80 标准版到 Pro Max 的价格都有所下调,和升级的配置一合计,会发现居然在 Mate 80 系列上也能讲究「性价比」了。

由于 Mate 80 系列手机版本较多,我们将售价集中列出,方便大家对比观看:

  • 华为 Mate 80,12GB + 256GB 起步,起售价 4699 元
  • 华为 Mate 80 Pro,12GB + 256GB 起步,起售价 5999 元
  • 华为 Mate 80 Pro Max,16GB + 512GB 起步,起售价 7999 元
  • 华为 Mate 80 RS 非凡大师,20GB + 512GB 起步,起售价 11999 元

华为 Mate X7 系列:稳健更新

折叠旗舰华为 Mate X7 系列,同样是一次非常稳健的更新。

外观设计上,Mate X7 摄像头 Deco 换用了新「时空之门」新设计,背板采用了「光织云锦」的新工艺。

对于大折叠手机,厚度和重量是非常重要的参数,华为 Mate X7 展开厚度 4.5mm,折叠厚度 9.5mm,整机重量 235 克。

受制于紧凑的机身空间,折叠屏手机的影像系统限制颇多。凭借模组小型化和手机内部结构优化,华为展开厚度仅有 4.5mm 的华为 Mate X7 典藏版中堆了不少料,包括 Mate 80 Pro Max 同款主摄。

华为 Mate X7 影像典藏版配置如下:

  • 主摄:5000 万像素 RYYB 传感器,1/1.28 英寸,F1.4-F4.0 RYD 传感器,17.5 超大集成电容,十档物理可变光圈,支持光学防抖。
  • 长焦微距:5000 万像素 RYYB传感器,光圈 F2.2,3.5 倍光学长焦,7 倍光学品质变焦,支持光学防抖。
  • 超广角:4000 万像素 RYYB 传感器,光圈 F2.2
  • 第二代红枫摄像头

不过,华为 Mate X7 最大的亮点不只是硬件配置,而是自研系统 HarmonyOS6 加持下,折叠大屏的独有的全新交互。

利用鸿蒙应用数据互通的特性,华为 Mate X7 可以实现左边应用点击分享右边,不需要复制粘贴和应用跳转。

像是导航和攻略的场景,左边打开小红书、马蜂窝这些应用,右边打开地图,选择地址后地图可快速识别形成路径规划。

分屏最有潜力的场景,还是 AI 助手。打开小艺分屏之后,可以直接将左边应用的内容传递到小艺,AI 助手就能结合上下文和联想进行回答。

华为 Mate X7 的配置和售价如下:

  • 华为 Mate X7,配置 12GB + 256GB 起步,起售价 12999 元
  • 华为 Mate X7 典藏版,配置 16GB + 512Gb 起步,起售价 14999 元

华为 MatePad Edge:最佳二合一方案

这台二合一产品,爱范儿已经提前拿到上手,认为它「平板和电脑用起来都是 100%」。

从名字可以看出,这是一台在平板基础上进行创新的二合一形态电脑,屏幕尺寸看齐笔记本电脑来到 14.2 英寸,边框仅有 4.1mm,是华为近年来尺寸最大的平板。

配上高低分频的 6 扬声器,在这块 14.2 寸屏幕上观影——甚至只是看手机录的视频——体验都是相当沉浸的。

MatePad Edge 默认是平板样式的 HarmonyOS,而只要在屏幕上四指滑动一下,界面就能顺滑地从平板模式切换到了 HarmonyOS PC,吸附到配套的「星跃悬浮键盘」,就是一台完完全全的笔记本。

既然能作为一台「笔记本」,性能不能落下。MatePad Edge 搭载两个散热风扇,顶配版本则使用液冷方案。

两种模式本质上是一个底层系统,应用、数据、文件都是共享的,可以互相访问,将 HarmonyOS「一次开发多端部署」的特性发挥得淋漓尽致。

MatePad Edge 售价如下:

  • 起步配置 16GB + 256GB,起售价 5999 元
  • 星跃悬浮键盘价格 1499 元
  • 液冷版本配置 32GB + 2TB,价格 12999 元,包含键盘

全方位的「旗舰手机」

华为 Mate 80 Pro Max,是一台几乎全方位都相当「旗舰」的手机。

提前上手 Mate 80 Pro Max 感受了一番,又看完了发布会,这个观点在我心中愈发强烈。

手机厂商每年都用「最强」来形容旗舰产品,消费者听多了也难免不太当真——毕竟产品迭代,本就不太可能往回走。

但出于众所周知的原因,华为 Mate 系列沉寂了好几年,Mate 50 和 Mate 60 在某种程度,都离经典之作 Mate 40 有一点差距,难担「最强 Mate」旗号。

去年的 Mate 70,更像是一次更扎实更全面的回归尝试,是一次回到顶点的努力。

今年的 Mate 80 Pro Max,通过多个维度的配置堆料,以及独特的工艺,打磨出了一台市场竞争力更甚以往的旗舰手机。

国产手机集体冲高了好几年,如果单论性能和系统,Mate 80 系列未必比其他国产 Android 旗舰更强,但手机的设计和工艺,以及由内到外由软到硬的自研基底,共同塑造了它更高的产品站位,让华为 Mate 80 Pro Max 得以脱颖而出——握在手上的感觉,是最不会骗人的。

得益于长期的技术积累以及品牌调动供应链的能力,华为能在量产机上实现诸如背板金属浮雕、双层 OLED 这类通常只停留在展示阶段的工艺。它们并不只是单纯「整花活」,而是在尝试用更具差异化的做法去定义旗舰应有的质感和存在感。

这同样体现在影像能力上。早年和徕卡合作很好立住了「影像」的招牌,后期经过多年迭代的技术和方案探索,华为将硬件和调校把控回收到自己手中,有底气自立「XMAGE」的体系,也收到了来自市场的正反馈。

华为走的这个路线,其实和苹果有相似之处,两者都通过对供应链、软件、硬件的把控能力,构建起属于自己的体系化逻辑,并由此形成独立且相对稳固的高端形象。

作为「原生鸿蒙设备」元年,今年的华为产品都有一个特质:堆料给够的同时,形态要够创新,用这些不掉队甚至领先行业的硬件,去托举目前还未做到满分的鸿蒙系统和生态。

无论是反常规的 Pura X 和 Mate XTs,还是成熟的 Mate 7,华为已经把折叠屏做成了品牌的重要延展,产品还活用自家系统,实现其他品牌暂时还做不到的场景和交互,形成差异化的竞争优势。

而面向大众市场的 Pura 80 和 Mate 70,用最没有短板的姿态承担起品牌门面的角色,争取最多的高端用户。

时至今日,我们已经可以下一个结论:即使仍需要时间成熟,但鸿蒙系统已经不会失败了,因为华为已经摸索出一个路径,形成了一个如鱼得水的基本盘。

经历巅峰和沉寂,华为不仅在品牌和生态上恢复、甚至超越了以往的号召力,而华为 Mate 80 系列就是最好的证明。

附上本次活动一同发布的其他产品:

  • 华为 WATCH ULTIMATE DESIGN 非凡大师手表「紫金」配色,售价 24999 元
  • 华为 MateBook Fold 非凡大师折叠电脑「瑞红」配色,起售价 26999 元
  • 陪聊 AI 机器人「智能憨憨」,售价 399 元
  • 华为 MateBook Pro「拂晓粉」配色,起售价 8999 元
  • 华为 WATCH Ultimate 2 非凡探索,起售价 6499 元
  • 华为 WATCH D2 腕部动态血压记录仪「星云蓝」配色,价格 2988 元
  • 华为 FreeBuds Pro 5 耳机,售价 1499 元
  • 华为路由 X3 Pro 日照金山,母路由 1299 元,子路由 799 元,一母一子套装 1999 元
  • 华为智慧屏 Mate TV Max 110,售价 64999 元

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


编程测试碾压人类!Claude Opus 4.5 深夜突袭,AI 编程进入「超人时代」

By: 莫崇宇
25 November 2025 at 07:13

最近这段时间,大模型发布就跟下饺子似的,一个接一个往外冒。

前脚 Gemini 3 Pro 刚抢了两周风头,后脚 Claude Opus 4.5 刚刚就正式发布,还是主打编程,还是那个熟悉的味道。

Anthropic 官方宣称 Opus 4.5 整体更聪明、更省心。遇到编程、搭 agents、操控电脑这些「系统级任务」依然是全球数一数二的水平。日常的研究、做 PPT、处理表格这些案头活,也都明显变强了。

今天起,Opus 4.5 已经全面开放,可以通过应用、API,还有三大主流云平台用起来。开发者只要在 Claude API 里调用 claude-opus-4-5-20251101 就行。

随发布而来的,是一整个工具链升级。开发者平台、Claude Code、Chrome 插件、Excel、桌面端改造,还有「长对话不卡顿」。从应用到 API,再到云平台,这次是真的全线铺开。

Anthropic’s New Claude Opus 4.5 Reclaims the Coding Crown – The New Stack

大模型集体「上新季」,Opus 4.5 强势压轴

从官方和测试者的反馈看,Claude Opus 4.5 对「模糊需求」的理解力得到了明显提升,复杂 bug 自行定位也更稳,不少提前试用的客户觉得 Opus 4.5 是真的能「理解」他们想要啥。

在真实场景的软件工程测试 SWE-Bench Verified 里,它是头一个拿到 80% 以上分数的模型。

Opus 4.5 的代码质量全面升级,在 SWE-bench Multilingual 涵盖的八种编程语言里,它在其中七种都拔得头筹,表现相当亮眼。

而举例而言,Anthropic 团队把 Opus 4.5 扔进了公司招性能工程师时用的高难度测试题里,结果在规定的两小时内,Claude Opus 4.5 的得分超过了所有人类候选人。

虽然编程测试只能衡量技术能力和时间压力下的判断力,那些多年经验积累出来的直觉、沟通协作能力,这些同样重要的素质并不在考察范围内。

除却软件工程,Claude Opus 4.5 的整体能力也迎来了全面开花,在视觉、推理和数学方面都比前代模型强,并且在多个重要领域都达到了业界领先水平:

更关键的是,模型的能力甚至开始超越现有的一些评测标准了。

在智能体能力测试 τ²-bench 里就出现了这么个场景:测试设定模型扮演航空公司客服,帮一位焦虑的乘客。

按照规则,基础经济舱机票是不能改的,所以测试预期模型会拒绝乘客的请求。结果 Opus 4.5 想出了一个巧妙方案:先把舱位从基础经济舱升级到普通经济舱,然后再改航班。

这办法完全符合航空公司政策,却不在测试的预期答案范围内。从技术角度说,这算是测试失败了,但这种创造性解决问题的方式,恰恰展现了 Opus 4.5 的独特之处。

当然了,在另一些场景下,这种「钻规则空子」的行为可能就不那么受欢迎了。如何防止模型以非预期方式偏离目标,这是 Anthropic 安全测试重点关注的方向。

Claude 无处不在,桌面、浏览器、Excel 全接入

随着 Opus 4.5 的推出,Claude Code 获得了两项重大更新。

计划模式(Plan Mode)现在能生成更精确的执行计划了,Claude 会在操作前主动提澄清性问题,然后生成一个用户可编辑的 plan.md 文件,再根据这计划执行任务。

此外,Claude Code 现在已经登陆桌面应用了。你可以同时跑多个本地或远程会话,比如一个智能体负责修代码错误,另一个负责在 GitHub 上检索资料,第三个就更新项目文档。

对于 Claude 应用用户来说,长对话不会再被打断了。Claude 会在需要的时候自动总结早期上下文,让对话持续下去。

Anthropic 研究产品管理负责人 Dianne Na Penn 在接受采访时表示:

「我们在 Opus 4.5 的训练过程中提升了对长上下文的整体处理能力,但光有更长的上下文窗口是不够的。知道哪些信息值得记住,同样非常关键。」

这些改进也实现了 Claude 用户长期呼吁的一项功能:「无尽对话」。这功能能够让付费用户在对话超过上下文窗口限制时也不会中断,模型会自动压缩上下文记忆,而不用提醒用户。

Claude for Chrome 也已经向所有 Max 用户开放了,可以让 Claude 直接在浏览器多个标签页之间执行任务。

Claude for Excel 的 Beta 测试范围已经扩展到 Max、Team 和 Enterprise 用户了。

对于能使用 Opus 4.5 的 Claude 和 Claude Code 用户,Anthropic 已经取消了和 Opus 相关的使用上限。
对于 Max 用户和 Team Premium 用户,Anthropic 也提高了整体使用限额,用户可使用的 Opus token 数量与之前使用 Sonnet 时大致相同。随着未来更强模型的出现,配额也会根据情况相应更新。

让模型「更聪明也更省」,Opus 4.5 迎来底层大升级

随着模型变得更聪明,它们能用更少的步骤解决问题:减少反复试错、降低冗余推理、缩短思考过程。

Claude Opus 4.5 和前代模型比,在实现相同甚至更优结果的情况下,用的 tokens 数量明显少了。

当然了,不同任务需要不同的平衡。

有时开发者希望模型能持续深入思考,有时又需要更快速灵活的响应。

所以,API 里新加了一个叫 effort 的参数,让你可以根据需求选:要么优先省时间和成本,要么最大化模型能力。任君选择。
当设置为中等 effort 等级时,Opus 4.5 在 SWE-bench Verified 测试中和 Sonnet 4.5 的最佳成绩持平,但输出 tokens 数减少了 76%。

而在最高 effort 等级下,Opus 4.5 的表现比 Sonnet 4.5 高出 4.3 个百分点,同时还减少了 48% 的输出量。

凭借 effort 控制、上下文压缩(context compaction)和高级工具调用能力,Claude Opus 4.5 能跑更久、完成更多任务,而且需要的人工干预更少了。

此外,真正的 AI 智能体需要在成百上千种工具之间无缝协作。

想象一个 IDE 助手集成了 Git、文件管理、测试框架和部署流程,或者一个运营智能体同时连着 Slack、GitHub、Google Drive、Jira 和几十个 MCP 服务器。

问题在于,传统方式会把所有工具定义一次性塞进上下文。拿连接五个服务器的系统来说,GitHub 需要 26K tokens,Slack 需要 21K tokens,Sentry、Grafana、Splunk 加起来又是 8K tokens。

对话还没开始呢,就已经占了 55K tokens 了。要是再加上 Jira,轻松突破 100K tokens。更麻烦的是,当工具名字相似时,模型容易选错工具或者传错参数。

Anthropic 推出了三项新功能来解决这些问题。

Tool Search Tool 让 Claude 按需动态发现工具,只加载当前任务需要的部分,token 使用量能减少约 85%。

Programmatic Tool Calling 让 Claude 在代码里直接调用工具,避免每次调用都要完整推理一遍。

Tool Use Examples 则提供统一标准,通过示例而不是 JSON schemas 来展示工具的正确用法。

内部测试显示,启用 Tool Search Tool 后,Opus 4 在 MCP 测试中的准确度从 49% 提升到 74%,Opus 4.5 从 79.5% 提升到 88.1%。
Claude for Excel 就是利用 Programmatic Tool Calling 来处理几千行数据,而不会让上下文窗口过载。

Anthropic 的上下文管理和记忆能力明显提升了模型在智能体(agent)任务中的表现。

Opus 4.5 还能高效管理多个子智能体(subagents),从而搭建复杂且协调良好的多智能体系统。在测试中,结合这些技术后,Opus 4.5 在深度研究类评估中的表现提升了将近 15 个百分点。

开发者平台(Developer Platform)也在持续变得更具可组合性,希望提供灵活的「模块化构建」能力,让你能根据具体需求自由控制模型的效率、工具使用和上下文管理,搭建出理想的智能系统。

虽然这次 Opus 4.5 的升级足够亮眼,但一个越来越清晰的趋势是:不同模型的「性格」差异正在被放大。

从 Claude 过往的产品线来看,Opus 这类「超大杯」依旧最擅长编程、系统级操作、结构化推理;但如果是文案工作,Sonnet 的表现和性价比往往更对路。

这次发布,也再次印证了这一点。

未来选模型,不光要看跑分榜,还得看它的「做事」方式是不是跟你合拍。换句话说,选择模型,倒是越来越像挑同事了。

附上官方博客地址:
https://www.anthropic.com/news/claude-opus-4-5

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iOS 27 首曝:缝缝补补又一年,苹果 AI 明年见?

By: 苏伟鸿
24 November 2025 at 17:15

iOS 26 的液态玻璃还没捂热,长达一年的 iOS 27 「爆料发布会」就开始了。

在最新的报道中,彭博社首次公开了 iOS 27 的一些总体信息,简单概括就是八个字:

优化为主,AI 为辅。

求稳的 iOS 27

按照苹果的规律,大更新后的下一个版本,都会以小修小补为主。

因此,iOS 27 以及其他系统的更新,苹果也将专注于提升系统的稳定性和性能,而不会引入太多新功能和新变化。

iOS 26 的液态玻璃风格好不好看属于各花入各眼,但网上随处可见对这个系统发热强、续航差、Bug 多、掉帧崩溃频繁的吐槽,和 iPhone 17 高产品力形成鲜明对比:

近年来最好的一代 iPhone,碰上了最差的一版 iOS。

这也不由得让人想起来 8 年前的 iOS 11——为全面屏 iPhone 做出不少调整,结果总体的使用体验,特别是对老设备来说却相当糟糕。

于是第二年苹果选择「求稳」, iOS 12 新功能屈指可数,主要是以底层优化为主,也成功挽回了 iOS 的口碑。

▲ 发布会上,苹果使用老设备演示 iOS 12

iOS 26 的口碑还不至于到 iOS 11 的程度,但液态玻璃是覆盖苹果全平台的改变,这套需要更多算力的新 UI,让不少老苹果设备都力不从心,iOS 27 预计能成为很好的「养老版本」。

除此之外,苹果还会继续对液态玻璃的视觉效果进行持续微调——实际上 iOS 26 目前的两个大版本更新,都在微调液态玻璃的效果,并提供更多自定义的选项。

▲ iOS 26.1 允许用户调整液态玻璃的可读性

根据彭博社,苹果的工程团队正在仔细检查苹果各个平台的操作系统,寻找可以精简的冗余功能和需要修复的漏洞,不放过任何能显著提升设备性能的机会。

我们也别忘了,以折叠 iPhone 为首,包括带屏幕 HomePod 在内不少形态各异的苹果产品将在明年推出,它们很可能都将运行基于 iOS 27 的系统——特别是折叠 iPhone,苹果会如何设计这台设备的系统交互,十分值得期待。

至于 iOS 27 的重要功能会是什么,彭博社给出爆料是——AI。

2026,苹果 AI 重振旗鼓

今年一整年,苹果都没怎么谈到 AI,iOS 26 更是用液态玻璃的大更新,转移了外界对苹果 AI 残局的注意力。蛰伏一整年,苹果将在明年推出更多 Apple 智能新功能。

首先是跳票一年半的 AI Siri,苹果目前计划在明年春季的 iOS 26.4 正式推出。

为了追赶差距,苹果正在与谷歌达成一项为期多年的协议——每年支付约 10 亿美元,换取 Google Gemini 模型为新版 Siri 提供核心 AI 能力,周边功能则仍由苹果自家的小模型处理。

协议的关键条款是:Gemini 将运行在苹果的「私有云计算」服务器上, 用户数据不会接触谷歌的系统。

此前爱范儿曾经报道过苹果内部测试的聊天机器人应用「Veritas」,一个基于文本的 Siri 重构的测试平台。

即使苹果目前还没有推出聊天机器人的计划,Veritas 只是给 Siri 陪练的开发平台,不过有了相关技术积累,苹果日后进军这个领域也会更加顺利。

而且苹果也已经改变了对这种对话式 AI 机器人的负面态度,内部正在酝酿一个类似 Perplexity 的 AI 搜索引擎。

彭博社爆料了苹果内部已经组建了一个新的团队,名为「答案(Answers)、知识(Knowledge)和信息(Information)」,简称 AKI 团队,将打造一个 AI 检索答案的「答案引擎」 ,类似 Perplexity 和 ChatGPT 的搜索功能,并将集成到 Siri 之中。

比起更为强大的聊天机器人,单纯做 AI 搜索引擎能帮助苹果规避很多风险:更多只是网络现存资源的智能聚合,AI 自由创作的空间不多,能够一定程度规避幻觉的影响。

这个 AI 答案引擎和 AI Siri 正在协同开发,预计也是明年春季,或者随着 iOS 27 一同推出。

除此之外,苹果还在开发一个专注于健康的 AI Agent,能够针对每个用户的健康数据,AI 会给出个性化的分析和建议——新的「睡眠评分」,其实已经用到了 AI 来生成个性化分析。

这个功能将包括在全新的「健康+」服务,作为 iOS 27 新功能。

比起其他先一步探索 AI 健康的企业,苹果可能在 AI 技术上不够突出,却能凭借自己在医疗健康积累十余年的技术和海量数据,取得领先的地位。

对苹果来说,AI 已经成为了重中之重,公司各工程团队都在积极开发,不仅要填上 AI Siri 挖的大坑,还要同时开发新功能加强竞争力。

苹果自己也清楚,如果 iPhone 跟不上这一波 AI 浪潮,iPhone 很可能会在十年内过气,成为下一个 iPod。

和 iOS 27 一起曝光的,还有一个消息:OpenAI 在过去一个月里为其硬件团队招聘了 40 多名员工,不少都是从苹果跳槽,涉及苹果几乎所有硬件部门。值得一提的是,OpenAI 收购了苹果前首席设计师乔纳森 · 艾维的 AI 创业公司 io,两者将合作开发 OpenAI 首个硬件。

被苹果视作明日之星,并主导了 iPhone Air 设计的工业设计师 Abidur Chowdhury 上周也被曝离职,虽然并非跳槽 OpenAI,但也加入了一家 AI 初创公司。

有能力的人,都想去创造下一个能改变世界、定义未来的产品,iPhone 的竞争对手,很快也不再是其他智能手机,而是各种新兴的 AI 硬件。它们未必能消灭 iPhone,但能将其边缘化,商业价值大幅缩水。

苹果在 AI 上落后,但仍然是地球上最重要的终端公司之一,这给他们带来了极大的优势。苹果没能在去年把握住机会,将 Apple 智能的招牌立住,重振旗鼓一整年,明年又将是一场「大考」。

而留给他们的时间,已经不多了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Nano Banana终于不是文盲了,但我可能会变「傻」

By: Selina
24 November 2025 at 14:29

过去一个周末 Gemini 3 Pro Image 的能力被反复「折磨」,花样越来越多——噢,你问这是什么,它的另一个名字是 Nano Banana 2。这么跟个恶搞一样的名字,居然被保留下来了。

Nano Banana2 各方面能力超群,甚至是「友商」Sam Altman 也要点头的程度。

▲ 图片来自:The Information

夸夸只是夸夸,Nano Banana 第二阶段,其实标志着 AI 图像生成领域的一个重要转折点:从基于概率的「以此类推」,转向了基于理解的「逻辑构建」。更承载着一个特殊的意义:AI 不再只是冲着你的眼睛去,还冲着你的智商去。

大语言模型不再「文盲」

一直以来 AI 生图都有个绕不过去的问题:才华横溢,信手拈来,但有时候就跟喝高了一样控制不住,这从 Midjourney 时期就开始了,往后走逐渐好转,不过始终存在。

其中最大的 bug 之一就是文字。这导致在很长一段时间里,鉴别一张图是否由 AI 生成,最简单的办法就是看图里的字。

这是基于扩散模型(Diffusion Model)的先天缺陷:它将文字视为一种纹理,而非符号。

Nano Banana 2 最直观的突破,就在于它「识字」了。即所谓的 Text Rendering 文字渲染。

我的随手测试「生成一张复古电影海报,标题是《香蕉的复仇》,副标题用红色衬线体写 2025 年上映。」

如果是在以前尝试这个指令,大概率会得到一张极具艺术感的图「BANANA REVENGE」的某种变体尚且能保持清晰和正常,但小字往往经不住看了,甚至有时候主标题都会拼写成「BANNANA」。但在 Nano Banana 2 里,这些字符被准确、清晰、且符合排版美学地「写」在了画面上。

So what?这仅仅是省去加字的时间吗?

对普通用户来说可能是,而且还是一种「表情包自由」。你终于可以生成一张精准吐槽老板的图,配上精准的文案,不用再单独拉一个文本框。

而对于商业世界,这意味着 AI 图像生成从「素材(Material)」阶段,正式跨入了「成品」(Deliverable)阶段。

▲ 图片来自 X 用户@chumsdock

当 AI 能够准确地处理符号信息,它能交付的成果就更多样也更实用,包括但不限于电商海报、PPT 配图、甚至是数据图表。以前设计师用 AI 只能生成背景底图,关键信息还得自己贴。现在,AI 可以直接生成原型图,乃至带有数据标注的饼状图,或者一张文字完美贴合透视关系的广告。

这是商业交付的「最后一公里」,也是生图模型在信息传递层面的巨大进步。

从「猜概率」到「懂物理」

字渲染的成功是 Nano Banana 2 底层技术跃迁的一个极具代表性的缩影,更深层的变化在于:这只「香蕉」,长了脑子

也就是我们所说的基于「推理」的图像生成。

大模型本质上是一个概率统计机器。当你要求画一只「坐在玻璃桌上的猫」时,模型通过学习数亿张图片,在生成时,它只是重现像素的统计规律。

Nano Banana 2 的不同之处在于,它引入了 Gemini 3 语言模型的推理能力。在生成图像之前,它似乎先在「大脑」里构建了一个物理模型。它知道「猫」下面通常会有模糊的影子,以及玻璃板上、下的物品有不同的光线关系。

在我的另一个随手测试中,当要求它生成「一个复杂的化学实验室,桌子上放着装有蓝色液体的烧杯,背景是黑板上的分子式」时,它表现出了惊人的逻辑性:

烧杯里的液体会有正确的弯液面;玻璃器皿对光线的折射符合物理直觉;最重要的是,背景黑板上的分子式不再是乱画的线条,而是看上去像模像样化学结构的式子(虽然还是有瑕疵)。

当画笔有了「大脑」,交互方式变了

之所以如此强调文字生成这个本领,是因为 Text Rendering 是外在表现,反映的是 Reasoning 作为内在引擎。合在一起, Nano Banana 2 带给用户的最终体验,就是一块「会思考的画布」(The Thinking Canvas)。

Google 将这个模型深度整合进了它的生态系统,不仅仅是生成图片,更是「修改」现实,下一步,就是走进更严肃的领域:信息图、教案、讲解素材,等等等等。

整体上,图像生成往往用户给 20% 的指令,剩下 80% 靠 AI 脑补——以前是靠概率脑补(随机填色)。现在则是靠因果脑补,不仅画出了「结果」,还隐含了「过程」,这能够让画面的叙事性和感染力指数级上升。

它不再只是为了取悦你的眼睛,它开始试图取悦你的智商。像上面这种结构图,虽然吧不敢说 100% 符合机械工程标准,但钉是钉,铆是铆。「逻辑上的正确」,是它推理能力的直接体现。

然而任何事情都是一体两面的,当换一个角度看,这就可能意味着创造力的同质化

当 AI 能够完美地生成「符合商业标准」的图表、海报和插画时,它实际上是在拉平审美的平均线。所有的海报都排版正确、光影完美,但可能也因此失去了曾经设计中那些因为「不完美」而诞生的神来之笔。

▲ 图片来自X用户@dotey

更深层的问题在于真相的消逝。当上面所说的那种逻辑正确、信息「干货」多的内容,可以被批量生产,取悦智商从未如此容易,也从未如此轻飘飘。如果它决定了我从图片信息到文字信息的所有摄入,那……会是怎样的景象?

还有 Deepfake 这个老大难问题,已经是老生常谈了。虽然这次 Google 加上了 SynthID(一种人眼不可见的数字水印)来标记 AI 内容,但在视觉冲击力面前,技术的防伪标签往往是苍白的。制造「真实」变得如此廉价和便捷,我们对「眼见为实」的信仰将被彻底重构。

至于它叫「Nano Banana」还是「Gemini 3 Pro」,其实已经不重要了。重要的是,从这一刻起,我们在屏幕上看到的每一个像素,每一行文字,都可能不再来自人类的手指,而是来自机器的思考。

这既令人兴奋,又让人在某些时刻,感到脊背发凉。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


乔布斯尘封三十年访谈公开,值得 AI 时代的打工人和创作者看看

By: 苏伟鸿
21 November 2025 at 18:36

为了纪念皮克斯《玩具总动员》上映 30 周年,史蒂夫 · 乔布斯档案馆分享了一段未公开的乔布斯访谈,这次采访发生在 1996 年 11 月 22 日,刚好是第一部《玩具总动员》上映一年后。

有意思的是,上周皮克斯发布了《玩具总动员 5》的第一支预告,里面出现了一个新角色——Lilypad,一台平板电脑。

乔布斯未必能预见 iPad 进入《玩具总动员》,但在采访中他也相信,一个好的故事会不断被讲述,并且在新一代人身上被重塑。

乔布斯还谈到了一些管理学上的想法:领导者的角色是为艺术家和工程师的工作提供便利,让他们真正参与到最终成果之中,让杰出人才在不受官僚主义阻碍的情况下蓬勃发展。

虽然乔布斯未经历当下的生成式 AI 浪潮,但他的观点依然很有启发:有才华和能力的人一直会被需要;即使技术不断进步,讲好故事依旧是颠扑不破的真理。

这次访谈结束的几周后,苹果收购了 NeXT 公司,乔布斯重回了苹果,在皮克斯的经历使他成为了一个更成熟的 CEO,不仅带领苹果走向了巅峰,创造的科技产品也如同皮克斯电影一样,影响着一代又一代的人。

访谈原视频:https://www.youtube.com/watch?v=R0XmBKsRJF8&t=1s

以下为经过编译调整的部分访谈内容:

人才才是企业的核心

主持人:你个人为了成为一名电影人,在学习和成长上需要做哪些事情?与此同时,作为企业负责人,你又做了哪些努力,才能把公司带到今天这种地位——在行业里遥遥领先,并且真正开始像一家成熟的电影工作室那样运作?

乔布斯:皮克斯是一个工作室,但我不是一个电影制作人。我不会像约翰 · 拉塞特(皮克斯创始人之一)一样执导我们的电影——我认为他是当今动画界最好的导演。

▲ 拉塞特和乔布斯

我试图帮助创造一个环境,让所有这些不可思议的人都能拍电影。我们有一个完整的创意团队,现在大约有 100 人,也有令人难以置信的技术团队和制作团队。我们想出了一种让所有这些人像同行一样一起工作的方法,在这个行业里,这是一件非常独特的事情。

最好的创意人才只会去少数几个地方工作:迪士尼、皮克斯,可能还有梦工厂,但工作室很难去主动找到有才华的人。同样的道理,计算机图形学领域最优秀的科学家,也只会在少数地方工作,皮克斯就是其中之一。

大部分工作室都没有这些人才,因为他们没有那种技术文化水平。我认为皮克斯是世上唯一能够从这两个领域雇佣最优秀人才的地方。

我们已经努力了十年,找到了一种让这两个领域的人才一起工作的方式,这并不简单,因为他们分别来自好莱坞和硅谷,文化背景非常不同,我认为我们从两者中保留了最好的。

主持人:你在多大程度参与了(皮克斯)的技术或者创意?时至今日你乐意常去这家工作室吗?

乔布斯:我喜欢在那里尽我所能提供帮助,我最大的快乐是,当有人比我更擅长某件事,我可以把这个事情抛在脑后不去管,然后去做其他我能提供帮助的事情。

皮克斯发生的事情,其实和科技行业一样。在创意方面,你有很多有才华的人,但他们有自己的需求,也十分罕见。如果你不去善待他们,他们可以在 10 分钟之内找到工作,不是吗?

奇怪的事情发生了:权力的等级发生颠倒,CEO 其实处于底层的地位。所以我觉得,其实我在为皮克斯中的大多数人工作,因为他们才是所有杰出成果的缔造者。这在软件业中也一样,人才十分难得,管理层的工作就是去支持他们,因为他们在第一线工作,这就是我们管理工作室的方式。

主持人:你们是怎么做到的?

乔布斯:我们通过创造合适的环境来实现——一个丰富多元的工作环境,并替员工消除障碍,组建合适的团队完成正确的项目,需要在人员、战略和项目方面保持非常高的质量水平来实现这一目标。

举个例子,我们的工作室今年发展迅速,一开始只有 175 人左右,到今年年底将增加到 300 人左右。我们的主要挑战之一是不要降低质量标准,而我们成功地实现了这一点。

主持人:关于组建团队和工作环境的问题,我听说皮克斯没有合同制,和大多数好莱坞制片厂不同,这背后的哲学是什么?

乔布斯:这是好莱坞和硅谷文化的融合。好莱坞使用「大棒」的模式,也就是靠合约约束;硅谷则是「胡萝卜」模式,用股票期权留住员工。

……在这种情况下,我更喜欢硅谷模式,给员工提供公司股票,我们都有相同的目标,创造股东价值,也鞭策我们让皮克斯成为最伟大的公司,这样就没人愿意离开了。

我们不会把所有人都视为理所当然,因为如果他们不想在皮克斯工作,那么无论他们有没有合同,都应该离开。

所以,我们能看到硅谷的规模比好莱坞大 4 到 5 倍,并且成长速度更快,并且它们采取不一样的模式,我们认为这是一个很好的模式。到目前为止,它运作得非常好。

▲ 皮克斯动画工作室

好故事才是永恒的魅力

主持人:作为一种商机,我们经常谈论计算机动画在过去 20 年的发展方向,以及效果如何超出其他任何领域。那么对于一家计算机动画企业来说,业务发生了什么样的变化?

乔布斯:嗯,你知道的,大多数做电脑动画的人,从来没得到过报酬,更多是出于热爱。那些有利可图商业模式,都是制作广告、商标和特效,这些都是人们将爱好变成职业获得报酬的主要方式。皮克斯也做了一段时间的电视广告,还赢得了奖项。

做广告和特效的问题在于,过去这几年这些业务模式都已经被侵蚀了,做这些雇佣工作,你不会传播你创意中好的方面,只能获得一次性的报酬。所以说,如果因为我们的广告帮助李斯特林卖出更多漱口水,我们也不会获得更多的钱。而且整个行业的利润率都在下降。

皮克斯运营高端广告业务,因为我们能做到行业很少见的角色动画。尽管如此,我还是觉得这是一个相当糟糕的行业,也很难摆脱这些生意。

我们今年退出了行业,其实我们喜欢做广告,因为制作它们很有趣。但我们明明有这么多创造自己作品成果的机会,却还要让 25 个有才华的人去做广告来挣钱,我们只能不情愿退出了,因为人才难觅,我们也负担不起让这 25 人去继续做广告了。

▲ 皮克斯制作的李斯特林广告《拳击手》

主持人:那么,这一切都将走向何方?你知道,技术让娱乐产业从好莱坞的高度中心化,实现了大规模分散,而你是其最大的影响因素之一,你推动了技术的民主化,让高科技直接放到人们的桌面上,还推动图形用户界面开发,让技术更透明。这一切会走向何方呢?

乔布斯:我不知道。我注意到卖内容和卖电脑最大的区别是,就拿我自己的经历举例,现在你几乎找不到 Apple II 电脑了,偶尔还能在学校见到,但也仅限于此。至于五年后 Macintosh 电脑还能不能开机,也并不可知。

所有的这些科技产品,如果寿命有一两年,那就很幸运了,如果有五年的寿命,那更是非同寻常。每隔一段时间,就会有一些寿命长达 10 年的东西诞生,我也很幸运能与其中一些产品有关联。但它们迟早都会成为沉积层的一部分,这是创新的基础。

迪士尼在 1937 年发行了第一部动画长篇《白雪公主》,那已经是 60 年前的事情了,几年前,他们重新发布了这个电影,售出 2800万份,在首次发布 60 年后可能获得了大约 2.5 亿美元的利润。

我有一个年幼的儿子很喜欢这部电影,他看了差不多四十遍,我真的很震惊。世界上每片大陆我都有认识的人,我想他们都知道白雪公主的故事。看着我的儿子观看《白雪公主》,我真的很震惊,这些故事随着每一代年幼的孩子而更新。

……我认为 60 年后人们看《玩具总动员》,不是因为计算机图形多先进,而是因为这是一个关于友谊的故事,这对我来说真的很神奇,这与我工作过的行业都不同。能够有机会,通过不断努力和幸运,把这样的故事带入我们的文化之中,是一个难得的机会,我认为皮克斯的每个人都非常非常荣幸能拥有这个机会。

这就是我们所关心的。我们希望制造出这些产品,希望它们能长期存在。

主持人:所以,这一切还会走向何方?什么东西会让我们惊讶?

乔布斯:你知道,在视觉技术方面,当 10 年前我们拍摄具有里程碑意义的《顽皮跳跳灯》时,短片的每一帧平均需要大约三个小时的时间来渲染。

快进到今天,制作《玩具总动员》的计算机速度快了 100 倍,但制作这部电影时,每一帧平均仍需要三个小时来渲染,原因是每一帧的复杂度增加了 100 倍。很多情况下,我们投入了 5 到 10 倍的计算能力。在我们的第二部电影(《虫虫危机》)中,所需计算量比《玩具总动员》还大,但每帧渲染依然需要三个小时。

我认为这是一个常数:我们的视觉野心增长的速度,与技术能支持的速度相匹配。因此,随着时间推移,我们能够创造的视觉世界会变得更加丰富。

然而,在创意方面,我认为讲故事这门艺术,是非常古老的。无论多少技术,都不能把一个糟糕的故事变成一个好故事。这是约翰 · 拉塞特教我的,也是我们在皮克斯的铁律。

所以我认为讲故事是一门真正的艺术,这也是我们一直、一直会非常努力去做的事情。我认为这一点长期以来没有改变,也不太可能改变,我认为这和技术进步没有任何关系。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Live Photo 的十年故事,将被如何续写?

By: 艾 梵
21 November 2025 at 10:00

微信最近有了点新「动静」。

点开朋友发来的最新旅游打卡照,照片中的人能自己动起来,快门前后的几秒动态就这样跃然屏上。

在实况照片发得最多的小红书上,还能看到一种更新的玩法:三张动态照片被拼在一起,就像电影的分镜头那样。

实况照片(Live Photo)不是个新东西,满打满算也已经出现 10 年了,但直到最近两年,实况照片才火遍社交媒体,成为一种影像的新范式。

而这背后,是一个枯萎技术被重新发明灌溉开花的故事。

实况照片的文艺复兴

2015 年,苹果发布 iPhone 6s,将实况照片带到了这个世界上。

不过,以现在的眼光来看,实况照片这个功能更像是为 3D Touch 屏幕压感技术这碟醋包的饺子——用力按下屏幕,照片就会动起来。

但随后几年里,实况照片并没有引起用户太多注意。其中最大的问题有三个:

  • 没有太多能分享的平台,在小红书兴起之前,微博是硕果仅存支持分享实况照片的平台
  • 占用存储空间大,由于收录了视频和音频信息,实况照片是传统照片的几倍大小
  • 后期空间小,当时技术仍未成熟,封面帧算法落后,实况照片拍出来更容易糊片

很多摄影爱好者都是「到手关」这个功能,避免影响拍照体验,还占用宝贵的存储空间。在这七八年的时间里,实况照片都是这样一个食之无味、弃之可惜的功能,没什么再创作的空间,也一直缺乏分享的方式。随着 3D Touch 被砍掉,实况照片被遗忘在历史的角落。

转折点出现在了 2022 年,小红书正式支持了实况照片的发布,两年后成为「影像」内容搜索绝对量最高的关键词,和「长焦」「滤镜」等影像功能并列成为新的创作趋势。

▲ 左图来自《小红书「影像赛道」趋势详解,挖掘1.8亿数码人群中的生意机会》
右图来自《Trends 趋势|小红书《五大影像功能洞察图鉴》首发》

对于小红书而言,支持实况照片更多是图文平台适应短视频潮流的求变,是为了留住核心 iPhone 用户的手段,是无数更新中极小的一环。

但对实况照片而言,这却是一场文艺复兴——因为人们表达自我的方式,已经悄无声息地发生了改变。

2012 年到 2022 年之间,是智能手机和移动社交媒体快速崛起的年代,手机逐渐取替相机,成为最广泛的拍照设备,而如何用手机拍出一张好照片并且晒出来,成为上一个时代社交媒体内容的主流,一言以蔽之就是:精致,构图、修图、文案都要经过精心处理和选择。

但随着「精致」的内容泛滥,真实的内容可见度越来越低,当大家对精美的东西习以为常的时候,朴实无华的分享,就成了稀缺品。在当下,「活人感」成为了最受热捧的氛围。

又有什么能比 Live 图更「Live」呢?

画面可以不美,构图可以不巧,「此时此刻」的状态和情绪最重要,自然流露才是实况照片的感染力所在。

照片单调,视频漫长,实况照片则居二者之间,捕捉转瞬即逝的个个瞬间。

但当大家重新捡起来实况照片这个玩法,才发现手机上七八年前的功能,其实已经相当落后——实况照片分辨率低、Android 手机不能分享、封面帧还会掉算法,当用户想好好发点 Live 图的时候,工具已经跟不上创作欲了。

需要有人重新发明实况照片。

实况照片,如何被重新发明

手机厂商们很快就嗅到了机会,纷纷在新机中落地实况照片功能,并持续打磨、创造新的范式,让这个原本有些掉队的老功能焕发新生机。

而 OPPO 则是其中最具代表性的存在。

第一场改变发生在 Reno 系列上。OPPO Reno12 手机首次引入了实况照片功能,并且与小红书达成合作,成为了首台能够将实况照片分享到第三方平台的 Android 手机。

这个「首台」的意义不仅限于 OPPO Reno12 本身,更重要的是在这个曾经专属于苹果的分享生态,撕开了一个口子,整个行业立马跟上,不能拍实况照片的手机,一下子就过气了。

除了能拍,更重要的是能拍好。

为此,OPPO 将在静态影像上累积的能力都塞入实况照片之中,并且还能让每一帧都能成为自然的封面帧,和 iPhone 形成了差异化的竞争。

而在后来的产品中,OPPO 也从「画质」和「玩法」两个维度上,持续迭代实况照片的「价值」。

针对实况照片容易糊的痛点,OPPO 连续三代持续提升实况照片分辨率:OPPO Reno13 首发 2K 实况图,今年年初的 Reno14 则做到 4K 视频转实况照片,上个月发布的 Find X9 实现拍摄 4K 实况,还能直发小红书分享。

创作玩法方面,OPPO Find X8 和 Reno13将当时出圈的胶片风格滤镜融入实况照片之中,实现「会动的复古胶片」效果。

而从去年年底开始,小红书上兴起了一种全新的潮流——实况拼图。

简单来说,就是将多张实况照片以横版的形式纵向拼接在一起,有一种镜头蒙太奇的感觉,让本身就是动态的实况图更具「电影感」。

要实现这种再创作,用户一般离不开第三方的视频或者图片后期工具,不仅过程有点麻烦,还时常会遇到压画质的问题。

OPPO 很敏锐地捕捉到这种趋势,最新的 Reno15 系列,相册就能够实现系统级的「三拼实况图」。但他们不满足去追逐潮流,他们打算自己做出一种风格,答案就是进阶版的「出圈实况拼图」。

在原本三拼实况图的基础上,OPPO Reno15 允许用户选中带有人物或宠物的实况图进行「出圈」,将被拍摄对象的动态单独抠出放大,形成一种突破背景的效果。

整个过程并不复杂,简单概括就是「一拍二拼三出圈」,零基础也能快速上手。

这个功能不需要用户进行前期大量构思,只要挑选三张实况成片进行处理,画面就能如漫画分镜般生动有力,无论怎么玩都很出片。

如果你有很好的奇思妙想,预先构思了成片的效果去进行拍摄和创作,最终的出片就会更妙趣横生。

一言蔽之:「出圈实况」是一种通过创意构图保证能出好片,又因为可玩性够高而很有上限的拍摄方式。

而在看似简单的界面背后,其实藏着一整套颇为复杂的技术逻辑。

实况照片就是一个很短的视频,「出圈」本质上就是要一键实现视频抠图,容易糊或者跳闪,背后离不开 AI 大模型的助力——OPPO 选用了 10 亿参数量的自研大模型底座,实现了较高的抠图精度,并利用云端算力保证了出图效率。

最后这个功能呈现的效果,是用户只需轻点几下,屏幕上的动态人像就会被精准抠出「出圈」,无需繁琐的交互和长时间等待。

不仅限于玩法本身,OPPO Reno15 也继续优化实况照片最基础的成片效果。搭载专属最新算法「Nature Tone」,专门优化实况照片中人脸的质感,非常适合人像实况图。

OPPO Reno15 的出圈实况,出的不仅是相框,更是传统智能手机影像「参数至上」的怪圈,是用户需求洞察的结果,也是灵光一闪的创新。

捕捉情绪比堆砌参数更重要

从前,我们对一台手机的标准,往往都只聚焦在像素、光圈、传感器尺寸这些硬参数上,希望他们能够拍出够清、够远、够好看的照片。

很快,短视频时代到来,Vlog 大火,大疆 Pocket 这种口袋录影机成为了新宠。

而现在,不管是手机还是大疆 Pocket,甚至单反相机,实况照片都成为了我们期待的功能。

与此同时,实况照片的浪潮也在各个平台蔓延开来:从小红书、微博,到如今的微信——这款最重要的社交应用,也让实况照片走进了朋友圈与聊天之中。

有意思的是,这种传播媒介的变迁,不是技术在背后推动,相关技术甚至在十年前就已经就位,更多只是人们的表达欲发生了变化。

绘画捕捉「感觉」,摄影凝固「当下」,录像记录「过程」,而实况照片留住的,是「瞬间」。

这种转向,也为厂商带来了一个思考:继续在硬件上做突破,拍到更清更远的照片固然重要,如何更好地回应用户日益增长的创作需求,同样不可忽视。

和绘画、摄影、录像不同,实况照片是一种全新的创作方式,它诞生于智能手机,繁荣于移动互联网,是技术演进赋予这个时代特有的表达方式。

而真正的技术不是让表达更复杂,而是让情感更自由地流动。

OPPO 工程师在访谈中表示,原本他们只是想在静态照片上做「出圈」,但有同事提出了做成动态的想法之后,整个团队的兴趣被点燃,不断实现技术攻关才有了现在的「出圈实况」。

为 Android 发实况破开了口子,又不断提升实况照片的标准,现在,「出圈实况」这种新玩法正在引领新的风格潮流,这场实况照片的「文艺复兴」,OPPO 从来不是一个被动的追随者,而是走在前面的引路人。

这本就是一种用户与技术的彼此塑造,从技术的附庸,再到情绪的载体, 十年 Live 图的枯木逢春,正是一个关于 Life 的故事。

显然,OPPO 还会把这个故事续写下去。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Nano Banana Pro 深夜炸场,但最大的亮点不是 AI 生图

By: 莫崇宇
21 November 2025 at 02:49

奥特曼,迎来至暗时刻。

Google 的 AI 攻势没有半点减弱的迹象。如果说前几天 Gemini 3 Pro 的镰刀伸向了「前端」领域,今天,被颠覆的行业轮到了设计行业,刚刚发布的 Nano Banana Pro(Gemini 3 Pro Image)再次在图像生成能力上重拳出击。

初级设计师的饭碗,怕是要端不稳了。

核心功能如下:

  • 分辨率支持:可输出 1K、2K、4K 分辨率图像
  • 多轮编辑:支持对话式、多轮次的图像编辑工作流
  • 多图像合成:最多可将 14 张输入图像组合为 1 张输出图像
  • 搜索增强:集成 Google 搜索能力,提供更精确、最新的知识支持

不再「瞎猜」,Nano Banana Pro 终于学会了先思考再画画

Nano Banana 的招牌能力是角色一致性强、对话编辑方式,而 Nano Banana Pro 的核心进化在于它把 Gemini 3 的深度思考能力完整接进了图像生成流程。

它生成一张图之前,会先做一轮物理模拟和逻辑推演,而不只是凭视觉模式「胡猜」。

▲提示词:请绘制一张四宫格图片,四张图依次表现同一位戴着斗笠的年轻男子分别发音「我」「上」「早」「八」,人物外貌保持一致,口型准确对应每个字的发音,整体风格统一,16:9,4K

跨模态理解也在 Nano Banana Pro 身上展现得更为彻底。

凭借 Gemini 3 增强的多语言推理能力,你可以直接生成多种语言的文字,或者一键本地化、翻译你的内容。

朋友丢来一页漫画,让模型给漫画上色并把气泡里的英文翻成中文。Nano Banana Pro 上色干净,光影自然,文字识别准确,英文排版也和气泡形状严丝合缝,整个过程从识别到翻译再到重排一气呵成,表现得就像在真正「理解」这张图。

▲提示词:将图片上的文字翻译为中文,并上色,其他不变

又或者,设计师过去需要反复调整的多语言漫画、国际化海报以及宣传物料,现在可以直接让 AI 一步到位。比如让模型将英文海报中的英文翻译成中文。这种从识别、翻译到设计的连贯处理方式,正是原生多模态架构最具威力的一面。

而在文字生成能力上,Nano Banana Pro 更是表现出色,无论是一句短标语还是一整段文字,都能清晰可读,甚至支持多种纹理、字体与书法风格的精细排版。

▲提示词:仿古籍线描插图风,关羽坐于油灯旁,身披宽袖战袍,神态专注沉稳。桌案上摆着《春秋》竹简、鎏金小刀、毛笔等器物,以纤细线条勾画,保留古印刷风格。背景仅以几笔勾勒墙角、屏风与兵器架,简洁却富古雅气息。色彩以浅赭、灰墨、淡青为主,呈现古书插画的文化韵味与历史感,4:3。

64k 的输入 Token 上限意味着它能理解极长的文本提示词。无论是详细的分镜脚本,还是复杂的多语言排版需求,都能更好理解。

▲提示词:生成一幅 4K 古画,画上写着:明月几时有?把酒问青天。不知天上宫阙,今夕是何年。我欲乘风归去,又恐琼楼玉宇,高处不胜寒。起舞弄清影,何似在人间。转朱阁,低绮户,照无眠。不应有恨,何事长向别时圆?人有悲欢离合,月有阴晴圆缺,此事古难全。但愿人长久,千里共婵娟。

针对前代分辨率偏低的老问题,Nano Banana Pro 把画质一步拉到 4K,还允许自由设定任何长宽比。电影海报、宽屏壁纸、纵向分镜,统统能直接生成。

Nano Banana Pro 还支持最多 14 张输入图像的组合编辑,同时保持最多 5 个角色的外貌一致。

配合多轮对话能力,用户可以不断调整、融合多个素材,直到达到理想效果。不论是把草图变成产品,还是将蓝图转换成逼真的 3D 建筑,都能轻松实现概念到成品的跨越。

▲提示词:哆啦A梦和李白在月下对酌。圆月高悬,古代亭台楼阁,哆啦A梦穿着唐朝服饰,李白持酒壶,石桌上摆着酒具,仙气飘飘,中日混合画风,精致细节

更进阶的是专业级创意控制能力。

你可以选择、微调或变换图像中的任何部分,从调整镜头角度、改变焦点到应用高级调色,甚至改变场景光照——把白天变成夜晚,或创造散景效果,这些过去需要在 Photoshop 里精细操作的工作,现在只需要一句话。

▲提示词:Transform the [camera] from the uploaded photo into a bold, colorful cartoon illustration style, while keeping the rest of the photo realistic and unchanged. Cartoon style details: thick black outlines, vibrant flat colors (such as bright cyan, magenta, yellow, pink), dripping paint and splash effects, playful comic-book energy. most drips flow downwards.The cartoon object should look like it is melting or bursting with colors, blending naturally into the real photo. Keep all other elements (background, other objects, environment) photorealistic with no alterations. High resolution, pop-art aesthetic, surreal contrast between realism and cartoon.

搜索 + 生成 = ?Google 给出了终极答案

如果说搜索是 Gemini 3 的「左脑」,那么图像生成就是其「右脑」。

这也是 Nano Banana Pro(Gemini 3 Pro Image)架构中被低估但最具颠覆性的能力。传统搜索是用户搜索、搜索引擎给链接、用户点进网站、网站提供界面。而 Nano Banana Pro 引入了搜索增强功能(Grounding with Search)。

当用户要求生成一张可视化的图片,展示在广州旅游的 2 天行程」时,Nano Banana Pro 生成的图片,包含了详细的行程地图、中英文注释、以及景点图片等。

再比如 Nano Banana Pro 能根据提示词要求,从搜索中获取最新天气状况,再把温度、风力、湿度、天气趋势等关键数据转化为鲜明、富有设计感的视觉内容。

▲提示词:搜索广州实时天气信息,制作一幅中文波普艺术风格的信息图,4:3

这项能力之所以重要,是因为它让创造过程具备了事实基础、实时性和可验证性。只能说,搜索不愧是 Google 的看家本领,无论是技术积攒的厚度,还是在理解上就已经领先一个身位。

在产品定位上,Google 采用了双模型策略:旧版 Nano Banana 用于快速有趣的日常编辑,而 Nano Banana Pro 则专注于复杂构图与顶级画质的专业需求。用户可以根据场景自由选择。

对于消费者与学生,Nano Banana Pro 已在 Gemini 应用中全球开放,只需选择「生成图像」并启用「Thinking(思考)」模式即可使用。免费用户会获得有限额度,超出后将自动切回原版 Nano Banana。

而 Google AI Plus、Pro 和 Ultra 订阅用户则拥有更高额度。在美国地区,Google 搜索的 AI 模式中,Pro 与 Ultra 用户已经可以体验 Nano Banana Pro。NotebookLM 中的 Nano Banana Pro 也面向全球订阅用户开放。

值得注意的是,Google 在 AI 透明度问题上采取了双重策略。

所有 AI 生成的内容都会嵌入不可见的 SynthID 数字水印,用户现在可以在 Gemini 应用中直接上传图像,询问它是否由 Google AI 生成。这项能力将很快扩展到音频与视频。

既然 Nano Banana Pro 已经强大到这个地步,那么问题来了,普通人该如何最大化发挥它的能力?

Google DeepMind 的产品经理 Bea Alessio 给出了一份详细的使用指南,其中透露出不少关键信息。最基本的使用方式当然是随便说一句话,让模型自己猜你想要什么。但如果你想达到专业水准,就需要像导演一样思考。

一个完整的提示词应该包含六个要素:主体(谁或什么)、构图(如何取景)、动作(正在发生什么)、场景(在哪里)、风格(什么审美)、编辑指令(如何修改)。

而如果你想要更精细的控制,还需要进一步明确:画幅比例(9:16 竖版海报还是 21:9 电影宽屏)、镜头参数(低角度、浅景深 f/1.8)、光线细节(逆光的黄金时刻,拉长阴影)、调色方向(电影级调色,偏青绿色调)、以及具体的文字内容和样式。

附上官方博客地址:https://blog.google/products/gemini/prompting-tips-nano-banana-pro/

这种「摄影指导式」的提示词写法,正是 Nano Banana Pro 和传统图像生成模型的分水岭。因为它真的能理解这些专业术语,并把它们准确地转化为视觉输出。

看到这里,再回过头看 Google 这几天连环发布的产品,就不难明白它想传达什么。

无论是前几天发布的 Gemini 3 Pro 预览版,还是今天亮相的 Nano Banana Pro ,Google 试图向世人证明:通往 AGI(通用人工智能)的道路,必须是多模态原生的。

只有一个能看、能听、能理解结构、能处理逻辑的模型,才可能对世界进行完整地「思考」。

从技术层面看,Nano Banana 系列模型让图像生成正式进入了「先理解再表达」的阶段。

当 AI 开始理解迷宫的路径、物体的结构、文字的含义甚至 UI 的交互逻辑时,它就不再只是一个画图工具,而是一个具备视觉思维能力的智能体。

从商业层面看,极低的推理成本和生成式 UI 的出现,将彻底改变内容生产和信息分发的逻辑。过去的互联网由一个个固定网页构成,而未来的互联网更可能是一块块随着你需求即时生长的界面。

设计将不再只是人的手艺,界面也不再是由团队层层打磨的成果。越来越多的视觉内容,会先交给 AI,再由人去补充或微调。Google 显然已经提前看见了那个新世界,并且开始把入口推到所有人面前。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


突发!iPhone Air 设计师离职,加入神秘 AI 创业公司

By: 肖钦鹏
18 November 2025 at 10:24

iPhone Air 可能是这几年来,苹果最命运多舛的产品——在传出 iPhone Air 2 因销量不佳、延期发布的消息后,另一个坏消息接踵而至。

彭博社报道,在 iPhone Air 宣传片中作为设计师代表、担任主讲人的苹果设计师阿比杜尔·乔杜里(Abidur Chowdhury)被曝已经从苹果离职,加入了一家不具名的 AI 创业公司。

这意味着,苹果的设计师团队又失去一名干将。

▲ Abidur Chowdhury

彭博社的 Mark Gurman 表示,阿比杜尔·乔杜里的离职与 iPhone Air 的销量不佳无关——事实上,iPhone Air 的设计在苹果内部颇受好评,而阿比杜尔·乔杜里在其中发挥了关键作用。

出生在伦敦的阿比杜尔 · 乔杜里,现居于旧金山,是那种一看就会被人记住的年轻设计师:成长于多元文化的城市,和 Jony Ive 一样受英国工业设计体系的严格训练,却始终在思考下一代的产品设计,他在个人官网用这么一句话来阐述自己的设计理念:

没什么比创造让人无法割舍的创新产品更让我兴奋。

他曾在英国的剑桥顾问公司和 Curventa 公司实习。之后,乔杜里在伦敦的 Layer 设计公司担任工业设计师。从 2018 年到 2019 年,他经营自己的咨询公司 Abidur Chowdhury Design,与设计机构、创新公司和初创企业合作,提供产品、体验和设计策略。

2019 年 1 月——就在 Jony Ive 离开苹果公司之前,阿比杜尔 · 乔杜里加入苹果公司,担任加利福尼亚州库比蒂诺的工业设计师。

短短六年间,乔杜里参与设计了苹果一系列最具创新性的产品,其中就包括 iPhone Air——在苹果发布会上,乔杜里如此介绍这款 iPhone 的设计理念:

我们的初衷,是打造一款属于未来的 iPhone。

现在,阿比杜尔 · 乔杜里去追逐他的未来了。

自 2019 年以来,苹果的设计团队一直比较动荡。许多元老级设计师要么已经退休,要么离开苹果加入其他公司——其中就包括苹果前首席设计官乔纳森 · 艾维(Jony Ive)创立的设计公司 LoveFrom 和 AI 硬件公司 io。

在艾维离开后,埃文斯 · 汉基(Evans Hankey)短暂接手了苹果的设计师团队,直至 2022 年离职。后来,埃文斯 · 汉基与乔纳森 · 艾维以及多位苹果前员工创立了 AI 硬件公司 io,并于今年 7 月份以 65 亿美元的天价被 OpenAI 收购——迄今为止,io 还未发布任何一款硬件产品。

现任苹果设计总管莫莉 · 安德森(Molly Anderson)是为数不多自 Jony Ive 时代至今仍留在苹果公司的设计师,强调本质直觉的产品设计哲学。

她曾在采访中表示,在设计过程中不要受到现有产品的限制,而是专注于设计出最适合用户需求的工具,注重软件和硬件的融合——最新的超薄款 iPad Pro 以及 iPhone 17 Pro 的设计,就由自莫莉 · 安德森主导。

就在上周,苹果公司二号位、首席运营官杰夫 · 威廉姆斯(Jeff Williams)退休卸任。此前,苹果设计团队由威廉姆斯掌管,而后续将直接向苹果 CEO 蒂姆 · 库克(Tim Cook)直接汇报。

对于苹果而言,公司吸引力下降,人才流失严重,以及年轻团队青黄不接,是目前公司面临的一大挑战,而明年正是苹果成立五十周年的关键节点。

《金融时报》报道,苹果 CEO 库克正在加速推进其接班人计划,下一任苹果 CEO 有力竞争者、现任苹果硬件高级副总裁 John Ternus 将挑起大梁。

而这位 iPhone 的掌舵人不得不面对的,就是如何稳住大局、凝聚人心,带领苹果走向百年老店的下半程。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌