Reading view

There are new articles available, click to refresh the page.

对话 Hypershell:人人都能成为「钢铁侠」,是可以触及的未来!丨多样性公司

编者按:

当我们想喝可乐的时候,在极长的时间都只有两个选择:百事可乐和可口可乐。当我们选择手机的时候,有 90%的概率在苹果和华米 OV 等品牌里辗转。当我们买运动服饰的时候,第一时间想到的,大概率是 Nike、Adidas。

 

但世界之所以缤纷多彩,是因为在这些巨头之外,有一些不遵从传统,力求创造不同,注重设计和功能,着眼于明日的公司存在。

 

它们有着非主流的商业模式,设计与产品能提供独特的用户价值,和足够的社交谈资。重点是,它们没有大公司的包袱,敢于不顾一切的进步。它们,是「多样性公司」。

 

多样性,是开放世界的关键。爱范儿相信,只有真正关注和理解多样性公司才能比更多人更早地看见未来。在同名栏目中,爱范儿将以专访的形式,与你一同见证这些多样性公司,如何重塑未来,定义新常态。

本文为「多样性公司」栏目的第 6 篇,我们和 Hypershell 的创始人 Kelvin Sun 和联合创始人 Penn Yu 进行了对谈。

Hypershell【极壳(qiao)】是世界上第一家把机械外骨骼产品从医疗和工业领域带到消费者领域的创业公司,现在每个人都有机会去体验机械外骨骼产品给人类躯体带来的力量和体能提升。这有点像钢铁侠在山洞里造出了 Mark I 装甲一样,人类对于「自身」的想象力可以进一步扩展,更重要的是,这种科幻想象,真的有机会变成未来的现实。

Hypershell 目前一共有 3 款产品在售,分别是基础款 Hypershell Go X,功率更高的 Hypershell Pro X,更轻更耐久,采用了碳纤维和钛合金材质的 Hypershell Carbon X,这些产品可以在登山爬楼,徒步骑行等 10 多个场景提供腿部助力。理论上,拥有 1 马力功率的 Hypershell Pro X 可以提升 40% 的腿部力量,抵消 30 公斤的负重,节省 30% 的体能。

极壳首款产品年初在海外正式上市后,已在全球范围拥有超过 1 万名用户,在快速增长的成绩加持下陆续获得了来自 IDG、红杉等资本的青睐,已累计获得数千万美元融资。

Hypershell 也在积极开拓中国市场,八月将在国内前沿潮品渠道 DrivePro 开启体验与销售。

▲ Hypershell 团队

「我的生命没有一分钟被浪费,都在为 Hypershell 做准备」

Q: 为什么给公司取名叫 Hypershell?有什么特别的意义?

A:很大程度上是受一些文化作品的影响,对我们影响最深刻的就是《攻壳机动队》,Ghost in Shell,在这个动漫里 Shell 其实有蛮特殊的含义,指的是灵魂的容器,就是人除了自己的自由意志之外都是 Shell。

这个就跟我们做的事情强相关,我们想要最新的机器人技术和 AI 技术赋能人本身,增强人的自由意志。所以 Hypershell 其实也是指更好的 Shell,更好的人类自由意志的容器。

第二层意思来说,我们做的事情跟户外也是强相关,可以说我们的产品也是一种新的户外装备,过去户外装备有软壳 Soft Shell,硬壳 Hard Shell,Hypershell 也会是一种新的户外装备形态。

我们觉得 Hypershell 很能代表外骨骼这个品类,我们和用户测试了很多名字,比如 Exoskeleton,比如 Power Suit,最后大家普遍觉得 Hypershell 很有代表性,就像吉普车就是吉普车,不用叫四轮越野车一样。

Q: Hypershell 创始人 Kelvin Sun 之前创业的领域是在开发板领域,还有一些机器人项目,为什么这次创业选择了机械外骨骼赛道,毕竟这是一个非常新兴且未被验证的赛道。科技领域创业,你认为是应该更多基于趋势判断,还是源于某种使命感或个人直觉?

A:之前我做开发板其实也是一种机器人的控制器,做的一些机器人产品也是各种机械臂,然后还有 3D 打印以及机器人移动底盘的创业项目,它们都是非常典型的跨学科机电产品。

要说为什么选择外骨骼这个赛道,最真实的答案一定是基于我自己的愿景,我想要实现的东西,和当下趋势之间的双向奔赴,只有这样,事情才有机会做成。

每一代人创业的方向一定是很大程度上受他们小时候的各种因素和看过的文化作品的影响,我非常理解马斯克想让人类上火星,是因为他小时候看的都是《银河系漫游指南》之类的。我们这代人小时候看的都是高达,EVA,当时你会发现这些东西非常酷,但因为太科幻而很难成为现实。现在我会觉得这些东西极尽自己所能,能一点点地拉进现实世界里,这就是非常有意义的方向。

我初中做的第一个 DIY 项目,是一个肌电传感器,现在看,做外骨骼最难的地方在于人,怎么去理解人的运动意图,肌电信号恰好是个有效途径。

到了现在这个时间点,我会发现过往所有的精力其实都是在为此刻而存在。

外骨骼是一个包含机器人,人工智能,还有人机工程学的复杂领域,我觉得过去做的大量的各个方向的工作,都是在为这样一个目标做筹备。

回过头看,我的时间没有一分钟被浪费,这是一种很活得很真实的感觉。

▲ Hypershell 早期设计草图

Q: Hypershell 众筹的成绩非常不错,首月 2638 名支持者,123 万美元众筹金额,对于你们来说,众筹的作用是不是验证这款产品在消费级市场的潜力?

A:拿到第一笔融资过了半年,23 年年初的时候,我们第一版全功能的原型机出来了,等于是我们已经验证了这个产品的可行性,从脑子里的虚拟物件变成了实际的产品,还能给很多人去体验,大家都觉得功能上超出了预期。

当然我觉得原型机距离真正能够量产的产品差距还非常大,缺了很多工程细化和可靠性的优化,以及各种 corner case(边角案例)的推敲。

我们定义了消费级的外骨骼能够有最大 1 马力的功率,在很多场景够用了,然后续航还很长,接近 20 公里,同时它真实地融入 AI 能力,能够自适应多种多样的地形。

更重要的是,我们把这些能力打包起来,还有一个很亲民的价格,几百美元,相比于传统工业级外骨骼价格有数量级的降低。

当时对内来说是验证了概念的可行性,但我觉得一定要去验证这个品类的需求。很多做这种创新类消费硬件的公司,往往死在了闭门造车,拿着锤子找钉子,我们过去的创业经历也犯了大量这种错误。

众筹对我们的价值其实是进一步的 PMF(Product Market Fit)验证,是产品和市场需求之间匹配度的验证。

Q: 对于 Hypershell 这样在新兴领域的初创公司,目前公司面临的最大挑战是什么?

A:外骨骼是一个很需要技术创新和产品创新的赛道,这个品类的迭代一定不是依靠内卷和高压去实现的,而是要尊重时间,需要团队花时间沉下心,去思考,去理解,去不断摸索。

这种时间和过程的不可压缩性,和我自己的紧迫感是有矛盾的。

做外骨骼肯定是个长期的事情,需要未来几十年去努力和迭代,但整个硬件行业的竞争又非常激烈,节奏非常快。

甚至我们还没法依靠堆人力来解决问题,因为行业里不存在现成的外骨骼方向人才,我们筛选到合适的人也需要很长的培养周期,才会对外骨骼有系统性的理解。

另外我们也是在跟物理规则做对抗,相比于软件开发,Hypershell 的产品跟人有强相关和接触性,既要极致轻量化,又要极致高强度,这里面需要权衡和选择很多东西,外骨骼不仅前沿,链条又很长,需要从实验室环境牵引到产品化,中间还要在链路上的关键技术点做突破。

我们研发团队的构成,一半偏学术型,一半偏产品化,我们跑在靠前位置就是需要做大量实验室阶段的工作。

Q: 目前做机械外骨骼产品的初创企业有好几家,产品形态看上去也比较接近,Hypershell 的差异性和竞争力在哪里?

A:Hypershell 第一代产品上线之后,算是证明了这个品类的潜力,还有用户的需求。所以确实也能看到最近一年不断有类似形态的产品出来,不过我觉得做一个长得像的产品并不难,因为这个东西的复杂度看上去好像也没那么高,无非就是两个电机,中间几个杆子连起来,加一些布带子绑起来。

无人机在物理形态上也贼简单,4 根树枝绑 4 个电机也能飞,但是看着接近和真实好用的产品之间的差异非常大。

外骨骼需要在人体工程学,可穿戴设计,机器人,到动力系统和 AI 算法上都研究得很深入,还要抠得很细,最终体验上才比较好。

我们的优势就是除了做了很多前沿性的探索之外,在做外骨骼这件事上足够认真,以及抠得足够细。

竞品确实很容易抄一个形态,但是对于这个形态的底层逻辑很难有具象化的概念,当他们在每一个环节都做得差一点的时候,最终叠加出来的整体体验肯定是比较糟糕的。

比方说,十几年前花 1000 块就能买一个扫地机器人了,但是当时扫地机器人的策略是随机乱撞,回家还要找机器人随机到家里哪里去了,这种产品在我妈的印象里就很傻很垃圾,这个观念在她脑袋里存在了十几年。最近换了自动上下水,带激光雷达和 AI 规划算法的扫地机器人,她才觉得扫地机器人现在很聪明很方便了。

所以对于外骨骼这个品类来说,一定不能让一代人因为一两款垃圾产品就觉得这个品类不行。

实际上我们众筹真实交付的产品也不是众筹展示的那个版本,我们把众筹那一代砍掉了,重新做了第二代发货,因为我们觉得第一代的构型存在很多瑕疵。我们甚至觉得如果这一代产品发给用户,那消费级外骨骼行业就凉了,这代人可能都对这个品类有不好的印象。

「AI 是 Hypershell 产品最核心的两个能力之一」

Q: 一些外骨骼公司从工业或康复市场切入,更偏 B 端,而你们选择了面向日常用户,聚焦户外助力,为什么会有这样的决策?

A:我觉得这不是一个很难的决策。

就是如果你真的选择一个出发点是基于愿景和使命感的创业项目,这就是一个自然而然的决策,最终都是 people mission fit (人和愿景匹配)的问题。

你让我去做医疗或者工业领域的外骨骼,我觉得我也做不好。

我自己就是一个户外爱好者,我喜欢徒步,生态游,自驾,我很能理解这些场景下用户需求和用户痛点是什么,我也很想去打造极致的产品,让我自己也很享受使用这个产品的过程。

这就是我做这个品类的基础,我能同理心用户。

Q: 对于目前的机械外骨骼市场来说,绕不过的就是体积重量和功率之间的矛盾,为什么 Hypershell 的初代几款产品,选择了 2KG 左右,32 N·m 扭矩,800W 峰值功率,1 马力的尺寸?为什么不做得更重更强?或者说 Hypershell 内部是把 1 马力作为目标,然后尽可能极限地做小做轻?

A:其实这个 1 马力是反向虚标,它真实的功率其实是 1.1 马力左右,800 多瓦。

因为我们我觉得用户很难具象化理解多少瓦是什么概念,但是马力很好理解,就是一匹马的力量,人显然没有马的劲儿大,我们调研发现 1 马力用户很好理解。

选择这个性能很大程度是在这在这种构型下,800 多瓦的功能不单能应对日常出行场景,同时还能在一些跑步冲刺,还有极限登山场景也能有很好的助力,是一个非常够用的性能指标。

800 瓦就是我们算出来合理够用的功率范围,1 马力是更好的用户沟通选择。

然后 800 瓦会决定大概的扭矩是多少,扭矩会决定产品结构的刚性和可靠性,然后再去决定用什么材料,要不要上碳纤维或者钛合金,怎么去设计产品的疲劳寿命。

其实就是这样的推导过程,确实就是先把目标定好再来想办法实现,但这个目标也是来自于我们的理论推导,对场景的理解还有实际的测试。

Q: 作为一款「助力」设备,Hypershell 的机械外骨骼产品,AI 对于人类动作意图的理解和预判,是否和本身的机械能力一样重要?

A:Hypershell 产品里一个「小脑」叫 MotionEngine ,融合很多种不同的传感器,还有不错的算力。

为什么有这个东西呢,是因为我理解阻挡外骨骼产品走向更泛化更多样的场景的,不光是硬件性能,或者价格很贵,很大程度上是因为 AI 能力不够。

从实验室角度来看,两个人身材接近,但脚的码数不同,走路步态也会完全不一样,这种情况下什么样的助力方式是有效的?结果其实是千人千面,这个策略对我有效,但是对你就完全没有效果。

另外不同的场景和运动形式,走路,上小坡,爬楼梯,走碎石路,登雪山,或者力量训练,或者骑自行车,用户需要的助力方式也完全不一样。

在用户千人千面,场景纷繁复杂的情况,让 Hypershell 的产品能够无缝地去自适应切换,其实是 MotionEngine 要解决的问题。

我们的机器上只有一个按键,就是开关机,我们的理念是你除了开关机之外,整个设备在使用过程中都不需要任何的按键操作,而是通过 MotionEngine 帮你做了识别,然后帮你做预测、调整和适应。

这是让外骨骼走向现实生活,应对复杂的非结构性场景的必由之路。

行业里最主要的一个难点就是对于人的意图识别,就像我刚才说的,刚好我在初中的时候就开始做肌电传感器了。

所以我的理解是,MotionEngine 背后的 AI 能力,是 Hypershell 产品核心的两个能力之一。

Q:机械外骨骼这个名字形容 Hypershell 的产品恰当吗?你们希望用户把 Hypershell 看作一款什么样的产品?是运动辅助器?是下一代可穿戴?还是未来的人体增强工具?

A:这个问题我们最近也在不断地去探讨和思考,就今天来看,Hypershell 的产品在不同场景有不同的作用,比如在自行车场景下能让所有自行车变成 E-Bike,徒步场景呢,又是 E-Hike,工作场景里,比如要爬好多楼梯的巡逻巡检也会更轻松。

坦白讲,我们对 Hypershell 产品定义的认知仍然在一个迭代的过程中,我们认知它是一个比较 multipurpose 多用途的东西,我们不希望它这个场景或者用户群被限缩,还是希望去保持它的这种延展性和多样性。

不过更抽象地讲,我会说 Hypershell 的产品是一种物理层面的增强现实。

这是我前段时间才有的理解,它是人和物理世界中间连接的一层「介质」,它可输出、可编程、可数字化,可以去提升人的能力,对吧?

也可以去模拟一些体验,让你感觉好像在月球走路,或者让你在感觉在更重的环境走路,比如泳池里面,然或者让你模拟碰到了什么墙,踢到了什么东西。

我觉得人的很多能力和体验其实都可以在这层介质的基础上去重新思考。

Q: 目前 Hypershell 产品主要还是腿部助力,未来会不会有手部助力产品的规划,应对搬运等场景?

A:我觉一家公司的产品拓展方向必须具备两个维度的考量,第一是你的底层的技术能力模块是否能够很好的重叠和复用,第二是用户群是不是同一波用户群。

最完美的拓展方式应该是两个都符合,就是同一种技术路径,然后同一种人群可能存在着不同需求,那这是一个很好的品类拓展路径。

对我们来说,搬运这些场景,我们觉得是一个很刚需很现实的需求,但和我们当下用户人群的重合度很低,加上上肢的外骨骼其实更难做,上肢的动作维度更多更高,很难被标准化,属于很难做一个产品匹配不同场景的领域,这里更适合做高度定制化的产品。

Q:从目前的产品情况来看,是否可以接入一些智能手表等可穿戴设备,根据当前的心率水平,血氧含量等身体数据动态调整 Hypershell 产品的输出功率?

A:这是一个非常好的 idea,Hypershell 产品其实具备基础的这种能力,根据你的动作,还有当下的能耗水平,实时地去调整助力的策略和功率。

这也是为什么它能实现单键操作,用户只需要开关机就行。

刚才你说的这个方向,我们也在做一些准备,最近的探索就是 Apple Watch 端的 app 很快就会上架,和可穿戴设备结合确实是我们关注的方向,通过 Apple Watch 检测身体状态之外,手表也是一个更适合我们产品的人机交互界面,比如户外场景下,抬手就能看到自己和设备的状态。

「成为钢铁侠,是可以想象可以触及的未来」

Q: 已经有马拉松选手穿戴你们的产品参加了马拉松赛事,提升了他的最好成绩,马拉松属于重在参与的运动,不过事实也是 Hypershell 因为便携性轻量化加上助力特性,一定程度上能提升运动表现,你如何看待外骨骼技术在提高个体能力的同时,可能带来的效率悬殊以及公平性的问题?尤其在劳动或竞技场景中。

A:首先我觉得这是一种 trick,一定算是作弊。

当然那个用户的成绩属于可讨论的范畴,他没有影响奖金和名次,更多是提升自我成绩。

对于我们来说,他也是通过这种参加马拉松的方式去测试 Hypershell 产品的有效性,一个运动员在剧烈的,竞争态势的竞赛环境里长时间跑步,能够看到这款产品真实的有效性如何。也不光是为了省力,也能帮助运动员挑战自己的极限。

从运动本身长期来看,外骨骼产品肯定会被禁掉,今天它还处于大家没留意的地步。但是外骨骼产品也可能会催生新的比赛种类,就像之前北京举办的机器人马拉松比赛一样,说不定未来也有外骨骼铁人三项,大家在竞技场里公平竞争,反而也会引导行业,还有人类去突破极限,就像现在的 F1 比赛一样。

Q:人与机器的距离越来越近了,我们好像正处在一个人机融合得微妙临界点,你怎么看待「赛博格」这个概念逐渐成为现实,尤其在人机协作与身体延展的语境下?

A:大家似乎看到了一些影子,比如说这两年马斯克的脑机接口 Neuralink 项目有些进展,还有我们 Hypershell 这样的产品能做人类物理层面的增强,大家似乎看到了人和机器融合的可能性,但是我觉得真要说「临界点」,还需要大量的基础突破才有可能。

比如说智能义肢的研发,就比外骨骼更难,我和一些研究团队沟通过,他们的研发状态就是开发了很多智能义肢,但整体和人的适配度非常低,很多案例里只有一两个人穿戴的时候有不错效果。

我觉得这是一个缩影,真正可用的连接神经的人机接口我觉得还得 20 年往上,今天来看还是体外的工具型设备更现实,更普适,门槛更低,比如说电机的能量密度,已经是人类肌肉的 100 倍。

Q:手机、耳机、智能手表,包括智能眼镜都在变成日常随身设备,还有新兴的潮流是 360°全景相机,乃至一些 AI 记录设备都具有随身性,机械外骨骼产品有这样的潜力吗?就是人们把它变成一种很酷的电子产品日常使用。

A:今天看当然还差很远。

为了实现这样的目标,也需要很多的底层技术创新,对场景不断的拓展。

之前外骨骼产品仅限于行业级场景,到今天不少人在爬山徒步骑行等等日常场景里用,我觉得已经是行业里挺大的进步了。

可能努力个十几年二十年,一代一代的迭代更新,产品爬坡,场景破圈,最终会在某个节点下形成质变。

质变的节点可能是这样的,它一定是在更泛化的场景里面,并且正面作用越来越大,负面作用越来越小,就像 Vision Pro 一样,现在看它观感非常震撼,但实在太笨重了,如果未来负面作用很小,它不压头,同时卖 1 万块以下,我觉得它就质变了。

外骨骼也是类似,今天它对人的耐力提升只有百分之几十,随着技术不断迭代,质变到能提升 100%,甚至 200% 的体能,然后穿戴起来又很无感,平时都意识不到它的存在,关键时刻才有感知,同时成本也不断降低,价格更便宜的时候,我就觉得行业的机会点到了。

Q:我之前采访了一些不同行业的科技公司创始人,从新能源汽车,到无人机和扫地机器人行业,他们无一例外都把企业的长期愿景放在了「具身智能」上,即强 AI 绑定高自由度的机器人,实现更多场景的无人化。对于 Hypershell 来说,在有人的场景里,人类又该如何适应这样的未来?人类的机械化,是不是一个必然选项?

A:用不同的技术去增强人类本身,一定是人类文明的下一个演进阶段,这趋势我觉得是正确的,只是技术类型有很多,AI 也是一种对人的增强,只是它增强的是人的脑力,人的信息获取能力还有逻辑推导能力。

人类增强这件事是未来 10 年,20 年非常重要的技术方向,我们在做的其实只是其中一个细小的分支。就像我说的,外骨骼其实就是人和物理世界进行交互的介质,可输入,可编程,可数字化,它要实现的就是我们在物理世界的增强现实,来实现人的自由意志。

人的自由意志可以被各种技术综合起来去呈现,去放大,这也是我们公司的长期愿景。

如果更具象一点的话,像钢铁侠那样的装甲和人工智能,在未来是可以想象,也可以触及的。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对话理想辅助驾驶团队:辅助驾驶,如何从「猴子」进化到「人类」

去年这个时候,爱范儿和董车会在理想北京研发中心与理想辅助驾驶团队进行了一场交流,当时理想辅助驾驶的新技术架构「端到端+ VLM 视觉语言模型」即将上车,理想辅助驾驶团队当时的表述是:

「端到端+ VLM 视觉语言模型」背后的理论框架,是自动驾驶的「终极答案」。

随着「端到端+ VLM 视觉语言模型」的技术架构过渡到了 VLA(Vision-Language-Action,视觉语言动作模型),我们离「终极答案」又进了一步。

按照李想和理想辅助驾驶团队的说法,这是理想辅助驾驶能力从「猴子」阶段,进化到「人类」阶段的关键一步。今天同期,我们又来到了理想北京研发中心,继续和理想辅助驾驶团队聊这个领域的新动向。

▲ 理想汽车自动驾驶研发高级副总裁郎咸朋

辅助驾驶里,猴子和人类有什么区别?

去年理想辅助驾驶方案切换到「端到端+ VLM 视觉语言模型」之前,采用的是业界通用的 「感知 Perception — 规划 Planning — 控制 Control」技术架构,这个架构依赖工程师根据现实各种各样的交通情况来编写对应的规则指导汽车的控制,但难以穷尽现实所有交通情况。

这是辅助驾驶的「机械时期」,辅助驾驶只会应付有对应规则的情况,没有思考和学习的能力。

「端到端+ VLM 视觉语言模型」是辅助驾驶的「猴子时期」,相比于机械,猴子要更聪明,也有一些模仿和学习的能力,当然,猴子也更好动更不听话。

「端到端+ VLM 视觉语言模型」的本质就是「模仿学习」,依赖大量人类驾驶数据进行训练,数据的数量和质量决定性能。并且因为安全考虑,在这个架构中,负责复杂场景的 VLM 视觉语言模型并不能参与控车,只是提供决策和轨迹。

VLA(Vision-Language-Action,视觉语言动作模型)则是辅助驾驶的「人类时期」,拥有了「能思考、能沟通、能记忆、能自我提升」的能力。

猴子经历了漫长的变化才变成人类,理论上「端到端+ VLM 视觉语言模型」的「模仿学习」也可以在漫长的岁月里学会人类几乎所有的驾驶数据,做到行为上几乎像个人。

但代价就是「时间」。

理想汽车自动驾驶研发高级副总裁郎咸朋说:

我们去年实际的端到端 MPI(平均接管里程),去年 7 月份第一个版本 MPI 大概在十几公里,当时已经觉得挺不错的,因为我们的无图版本迭代了很长时间,综合 MPI(高速+城市)也就 10 公里左右。

 

从 100 万到 200 万 Clips(用于训练端到端辅助驾驶的视频片段),再到 1000 万Clips,随着数据量上升,今年年初,MPI 达到 100 公里,7 个月 MPI 翻了 10 倍,平均一个月翻一点几倍。

 

但是到了 1000 万 Clips 之后,我们发现一个问题,只增长数据量是没有用的,有价值的数据越来越少。这就跟考试一样,不及格的时候,随便学一学分就提升非常快。当考到八九十分了,再往上提 5 分、10 分,是很难的。

 

这时候我们使用了超级对齐,强制让模型输出符合人类要求的结果。另外,我们也筛选了一些数据补充到超级对齐里,让模型能力进一步提升,这样做是有一定效果的,但我们大概从今年 3 月份到 7 月底,花了 5 个月时间,模型性能才提升了 2 倍左右。

这是「端到端+ VLM 视觉语言模型」技术架构在飞速进步后遇到的第一个问题:越往后,有用数据越稀少,模型性能进步的速度也越慢。

而其本质问题也随之暴露出来,郎咸朋说:

本质来看,现在端到端的这套模仿学习并不具备深度的逻辑思考能力,就像猴子开车一样。喂猴子一些香蕉,它可能会按照你的意图做一些行为,但并不知道自己为什么要做这些行为,一敲锣它就过来,一打鼓它就跳舞,但不知道为什么要跳舞。

 

所以说端到端架构不具备深度思考能力,顶多算是一个应激反应,就是给一个输入,模型给一个输出,这背后没有深度逻辑。

这也是为什么要在端到端大模型之外再加一个 VLM 视觉语言模型的缘故,VLM 视觉语言模型具有更强的理解和思考能力,能提供更好的决策。但这个模型一是思考得慢,二是和端到端大模型耦合得不够深,很多时候端到端大模型理解和接受不了 VLM 视觉语言模型的决策。

去年这个时候,理想辅助驾驶团队就说过:

以后两个趋势,第一是模型规模变大,系统一和系统二现在还是端到端加 VLM 两个模型,这两个模型有可能合一,目前是比较松耦合,将来可以做比较紧耦合的。第二方面也可以借鉴现在多模态模型的大模型发展趋势,它们就朝这种原生多模态走,既能做语言也能做语音,也能做视觉,也能做激光雷达,这是将来要思考的事情。

趋势很快就变成了现实。

郎咸鹏也说了为什么要从端到端+VLM 切换到 VLA 的原因:

去年做端到端的时候一直也在反思,是不是端到端就够了,如果不够的话我们还需要再做什么。

 

我们一直在做 VLA 的一些预研,其实 VLA 的预研代表的是我们对人工智能的理解并不是一个模仿学习,一定像人类一样是有思维的,是有自己推理能力的,换句话说它一定要去有能力解决它没有见过的事情或未知的场景,因为这个在端到端里可能有一定的泛化能力,但并不是足以说有思维。

 

就像猴子一样,它可能也会做出一些你觉得超越你想象的事情,但它不会总做出来,但人不是,人是可以成长的、可以迭代的,所以我们一定要按照人类的智能发展方式去做我们的人工智能,我们就很快从端到端切换到 了VLA 方案去做。

VLA(Vision-Language-Action,视觉语言动作模型)就是去年的趋势思考,以及当下成为现实的技术架构。

虽然 VLA 和 VLM 就差了一个字母,但内涵差异非常大。

VLA 的 Vision 指各种传感器信息的输入,也包括导航信息,能够让模型对空间有理解和感知。

VLA 的 Language 指模型会把感知到的空间理解,像人一样总结、翻译、压缩、编码成一个语言表达出来。

VLA 的 Action 是模型根据场景的编码语言,生成行为策略,把车开起来。

直观的差异就是,人可以用语言去控车,说话就可以让车慢点快点左转右转,这主要是 Language 部分的功劳,人的指令大模型收到的 prompt,VLA 模型内部的指令也是 prompt,等于是打通了人和车。

此外,视觉和行为之间,也没有阻碍了,从视觉信息输入到控车行为输出的速度和效率都大大加快,VLM 慢,端到端不理解 VLM 的问题被解决了。

更显著的差别是思维链(Chain of Thought,CoT)能力,VLA 模型的推理频率达到了 10Hz,比 VLM 的推理速度快了 3 倍多,同时对环境的感知和理解更充分,可以更快更有理有据地进行思维推理,生成驾驶决策。

除了思维能力和沟通能力之外,VLA 也具备一定的记忆能力,可以记住车主的偏好和习惯;以及相当强的自主学习能力。

▲ 理想 i8 是理想 VLA 技术的首发车型

理想辅助驾驶的《飞驰人生》

现实世界里,人类想要成为老司机,肯定先得去报个驾校考个驾照,然后贴「实习标」蹒跚上路,在真实道路上开几年时间。

此前辅助驾驶的训练也是如此,不光需要真实世界里的行驶数据用作训练,也需要在真实世界里进行大量的路试。

在一些小说里,有些天赋异禀的选手可以通过读书,读成武力境界超高的实战高手,比如《少年歌行》里的「儒剑仙」谢宣,《雪中悍刀行》里的轩辕敬城。

但是在传统武侠小说里,只会有《天龙八部》里王语嫣这样精通武学典籍,自身却是毫无实战能力的战五渣。

▲ 《飞驰人生》剧照

当然,也有介于中间态的情况:在赛车电影《飞驰人生》里,落魄赛车手张弛在脑海里不断复现巴音布鲁克地区的复杂赛道情况,每天在脑海里开 20 遍,5 年模拟开了 36000 多遍,然后回到真实赛道的时候,成为了冠军。

虚拟开车,不断精进,超越自己过去的最好成绩,这是「算法」。

不过张弛回归赛道,再次成为冠军车手之前就已经在这条赛道多次证明过自己,积累了大量的实际驾驶经验。

实车实路,积累经验,直到了解这条赛道所有的路况,这是「数据」。

郎咸朋说,想要做好 VLA 模型,需要四个层面的能力:数据,算法,算力和工程能力。

理想强调自己数据多,数据优秀,数据库好,以及数据标注和数据挖掘准已经很久了,关于数据,理想也有新技能:生成数据训练。

通过世界模型进行场景重建,然后在重建的真实数据之上,举一反三,生成相似场景,比如理想在世界模型里重建一个出高速 ETC 的场景,在这个场景下,不仅可以用原来的真实数据情况,比如白天晴朗地面干燥,也可以生成出白天大雪地面湿滑,夜晚小雨能见度不佳等等场景。

理想训练 VLA 模型算法的更迭也跟生成数据息息相关,郎咸朋介绍说:

2023 年我们还没做端到端,一年用实车的有效测试里程大概 157 万公里,每公里花 18 块钱。

 

我们开始做端到端的时候,就有一部分在做仿真测试了,2024 年全年的仿真测试仿了 500 万公里左右,实车也测了 100 多万公里,平均下来成本降到了 5 块钱一公里不到,差不多也是花了 3000 万左右。但是同样花 3000 万,我能测 600 万公里了。

 

今年半年时间(1 月 1 日-6 月 30 日),我们测了 4000 万公里,实车只有 2 万公里,就跑一些基本的场景。所有的测试,大家看到的超级对齐、现在的 VLA,我们都是用仿真测的,5 毛钱一公里,就是付个电费,付个服务器的费用。并且测试质量还高,所有的 case、所有的场景都能举一反三,可以完全复测,分毫不差。我们的测试里程多了,测试质量好了,研发效率就提升了。

 

所以很多人质疑我们不可能用半年做个 VLA,测都测不过来,实际上我们测试非常多。

仿真测试的优点除了成本低之外,还能完美复现场景,真实场景测试情况下,一个场景很难被 100% 还原,对于 VLA 模型来说,场景复现差之毫厘,驾驶表现可能就失之千里。

以此而言,理想训练 VLA 模型的形式,与电影《飞驰人生》里主角在真实驾驶经验基础上,不断地虚拟训练的模式,有一些类似。

当然,最后 VLA 模型的训练,也需要背后巨大算力的支撑,理想现在的总算力为 13EFLOPS,其中 3EFLOPS 给了推理,10EFLOPS 给了训练。换算成显卡数量,是等效 2 万张英伟达 H20 用作训练,等效 3 万张英伟达 L20 用于推理。

关键 Q&A

Q:智能辅助驾驶存在一个「不可能三角」,也就是效率、舒适和安全三个目标之间是互相制约的,目前阶段可能难以同时实现。理想汽车的 VLA 目前在当前阶段最先优化的指标是哪一个?刚刚提及到 MPI,是否可以理解为目前理想汽车最终的指标是提升安全性以有效减少接管?

郎咸朋:MPI 是我们衡量的指标之一,还有一个指标是 MPA,也就是指发生事故的里程,理想车主的人驾数据是 60 万公里左右出一次事故,而在使用辅助驾驶功能的情况下是 350 到 400 万公里发生一次事故。这个里程数据我们还会持续提升,我们的目标是将 MPA 能提升到人类驾驶的 10 倍,也就是比人驾安全 10 倍,做到 600 万公里才出一次事故,但这必须等到 VLA 模型提升之后才能做到。

针对 MPI,我们也做过分析,可能一些安全风险问题会导致接管,但有时候舒适度不好也会导致接管,比如急刹、重刹等,因为并不一定每次都会遇到安全风险,但是如果驾驶舒适度不好,用户依然不想用辅助驾驶功能。因为 MPA 可以衡量安全性,在 MPI 方面,除了安全性之外,我们重点提升了行车舒适度,如果体验了理想 i8 的辅助驾驶功能,会体验到舒适度比之前的版本有很大提升。

效率是排在安全和舒适之后的,比如走错路,虽然效率有所损失,但我们不会通过一些危险的动作立刻纠正,还是要在安全和舒适的基础上去追求效率。

Q:VLA 模型的难点在哪里?对企业的要求是什么?如果一个企业想要落地VLA模型会面临哪些挑战?

郎咸朋:曾经也有很多人问过如果车企想做 VLA 模型是不是可以跳过前面的规则算法,跳过端到端阶段,我认为是不行的。

虽然 VLA 的数据、算法等可能跟之前不太一样,但是这些仍然是要建立在之前的基础上的,如果没有完整的通过实车采集的数据闭环,是没有数据能够去训练世界模型的。理想汽车之所以能够落地 VLA 模型,是因为我们有 12 亿数据,只有在充分了解这些数据的基础上,才能够更好的生成数据。如果没有这些数据基础,首先不能训练世界模型,其次也不清楚要生成什么样的数据。

同时,基础训练算力和推理算力的支撑需要大量资金和技术能力,如果没有之前的积累是不能完成的。

Q:今年理想实车测试是 2 万公里,请问大幅减少实车测试的依据是什么?

郎咸朋:我们认为实车测试有很多问题,成本是其中一方面,最主要的是我们在测试验证一些场景时不可能完全复现发生问题时的场景。同时,实车测试的效率太低了,在实车测试过程中要开过去之后再复测回来,我们现在的仿真效果完全可以媲美实车测试,现在的超级版本和理想 i8 的 VLA 版本中 90% 以上的测试都是仿真测试。

从去年端到端版本我们就已经开始进行仿真测试的验证,目前我们认为它的可靠性和有效性都很高,所以我们以此替代了实车测试。但仍有一些测试是无法替代的,比如硬件耐久测试,但和性能相关的测试我们基本上会使用仿真测试替代,效果也非常好。

工业时代来临后,刀耕火种的流程被机械化替代;信息时代后,网络替代了大量工作。在自动驾驶时代也是一样,端到端时代来临后,我们进入了使用 AI 技术做自动驾驶的方式,从雇佣大量工程师、算法测试人员,到数据驱动,通过数据流程、数据平台和算法迭代提升自动驾驶能力。而进入了 VLA 大模型时代,测试效率是提升能力的核心因素,如果要快速迭代,一定要把在流程中影响快速迭代的因素迭代掉,如果这其中仍有大量的实车和人工介入,速度是会降低的。并不是我们一定要替代实车测试,而是这项技术,这个方案本身就要求要使用仿真测试,如果不这样做,并不是在做强化学习,并不是在做 VLA 模型。

Q:VLA 其实没有颠覆端到端+VLM,所以是否可以理解成 VLA 是偏向于工程能力的创新?

詹锟(理想汽车自动驾驶高级算法专家):VLA 不只是工程方面的创新,大家如果关注具身智能,会发现这波浪潮伴随着大模型对物理世界的应用,这本质就是提出了一个 VLA 算法,我们的 VLA 模型就是想把具身智能的思想和路径引用在自动驾驶领域。我们是最早提出,也是最早开始实践的。VLA 也是一种端到端,因为端到端的本质是场景输入,轨迹输出,VLA 也是如此,但算法的创新是多了思考。端到端可以理解为 VA,没有 Language,Language 对应的是思考和理解,我们在 VLA 中加入了这一部分,把机器人的范式统一,让自动驾驶也能成为机器人的一类,这是算法创新,不只是工程创新。

对于自动驾驶而言,很大的挑战是必须要有工程创新。因为 VLA 是一个大模型,大模型部署在边缘端算力上是非常具有挑战的。很多团队并不是认为 VLA 不好,而是因为 VLA 部署有困难,把它真正落地是非常具有挑战性的事情,尤其是在边缘端芯片算力不够的情况下是不可能完成的,所以我们是在大算力芯片上才能部署。所以这不仅仅是工程创新,但的确需要工程部署大范围优化才能实现。

Q:VLA 大模型在车端部署的时候是否会有比如模型裁剪或蒸馏版本?如何在推理效率和模型之间做好平衡?

詹锟:在部署时的效率和蒸馏上我们做了非常多平衡。我们的基座模型是自研的 8×0.4B 的 MoE 模型(混合专家模型),这是业界没有的,我们在深入分析英伟达芯片后,发现这个架构非常适合它,推理速度快的同时模型容量大,能够同时容纳不同场景、不同能力的大模型,这是我们在架构上的选择。

另外,我们是大模型蒸馏出来的,我们最早训练了一个 32B 的云端大模型,它容纳了海量的知识和驾驶能力,我们把它做出的思考和推理流程蒸馏到 3.2B 的 MoE 模型上,配合 Vision 和 Action,使用了 Diffusion 技术(扩散模型,可以生成图像、视频、音频,动作轨迹等数据,具体到理想的 VLA 场景,是利用 Diffusion 生成行车轨迹)。

我们用这样的方法做了非常多的优化。从细节上来看,我们也针对 Diffusion 做了工程优化,并不是直接使用标准 Diffusion,而是进行了推理的压缩,可以理解为一种蒸馏。以前 Diffusion 可能要推理 10 步骤,我们使用了 flow matching 流匹配只需要推理 2 步就可以了,这方面的压缩也是导致我们真正能够部署 VLA 的本质原因。

Q:VLA 是一个足够好的解法了吗?它抵达所谓的「GPT 时刻」还需要花多长时间?

詹锟:多模态模型之前说没有达到 GPT 时刻,可能指的是 VLA 这种物理 AI,而不是 VLM,其实现在 VLM 已经完全满足一个非常创新的「GPT 时刻」标准,如果针对物理 AI,现在的 VLA,特别是在机器人领域、具身智能领域可能并没有达到「GPT 时刻」的标准,因为它没有那么好的泛化能力。

但在自动驾驶领域,其实 VLA 解决的是一个相对统一的驾驶范式,是有机会用这个方式做到一个「GPT 时刻」的,我们也非常承认现在的 VLA 是第一版本,也是业界第一个往量产上要推的 VLA 版本,肯定会存在一些缺陷。

这个重大尝试是想说我们想用VLA来探索一个新的路径,它里面有很多尝试的地方,有很多需要去落地的探索的点,不是说不能做到「GPT 时刻」就一定不能去做量产落地,它有很多细节,包括我们的评测、仿真去验证它能不能做到量产落地,能不能给用户「更好、更舒适、更安全」的体验,做到以上三点就可以给用户更好的交付。

「GPT 时刻」更多指的是具有很强的通用性和泛化性,在这个过程可能随着我们自动驾驶往空间机器人或往其它具身领域去拓展的时候会产生出更强的泛化能力或者更综合的统筹能力,我们也会在落地以后随着「用户数据迭代、场景丰富、思维逻辑性越来越多、语音交互越来越多」逐渐往 ChatGPT 时刻迁移。

像郎博(郎咸朋博士)说的,到明年我们如果到了 1000MPI,可能会给用户这种感觉:真的到了一个 VLA 的「GPT 时刻」。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


专访 Nothing 设计总监 Adam Bates:手机行业有一些共识,但我们并不在乎

Nothing 手机并不在中国大陆地区进行销售,但它在这里仍然有不少的拥趸。大概是因为市面上已经有很多做工精湛、工艺良善的手机,也有很多性能强劲、影像出色的手机,但说到「酷」,Nothing 手机是行业里的独一份。

当手机正面都几乎一致,背面设计被「方」和「圆」两种元素统治的时候,Nothing 手机不光是能让人在机海里一眼认出,更能让人眼前一亮。

这里的「亮」是个双关,除了设计出色且出位之外,灯光效果亦是 Nothing 手机的设计重点。

▲ Nothing 设计总监 Adam Bates

Glyph 2.0 不是屏幕,是 Nothing 关于「创造力」的自留地

与 Nothing 设计总监 Adam Bates 沟通的第一个问题其实显得不太友好,对于多数看到 Nothing Phone (3) 的人来说,自然会注意到手机背部的那一块圆形的「屏幕」,但在我的印象里,前后双屏手机的销量都不算好,同时,双屏设计也没有延续下去的例子,诸如魅族 Pro 7 系列,vivo NEX 双屏版,以及小米 11 Ultra 等等。

为什么 Nothing 明知有前车之鉴的情况下,还要采用这样的设计呢?

Adam Bates 说:

我对你说的这些产品没有获得积极的市场反响一点儿也不惊讶,我们觉得这些手机没什么意思。

 

 

还有一点必须要说的是,我们不把自己和这些手机归为一类,我们不认为那是个屏幕,准确来说,那是一个 LED 灯光阵列。

 

这是 Glyph 2.0,之前的 Glyph 光效界面是以几个灯带形式,分散在 Nothing 手机背部,这次我们把灯效集中到了手机的一个区域,所以我们并不认为我们做了一个屏幕。

 

我们创造了一个灯效界面,并且它会随着 Nothing Phone (3) 面世而获得发展,因为 Nothing 社区的用户会基于这个 Glyph 2.0 界面来开发创建属于他们自己的「玩具」,有用户的参与,这个事情就会变得更有趣。

辩论这块圆形的 LED 灯光阵列是不是「屏幕」意义并不大,我们关心的事情其实和 Adam Bates 一样,就是这个东西是否有趣。

▲从左至右分别是 Phone (1)、Phone (2)、Phone (3) 的 Glyph 灯光效果, 图片来自:Design Milk

Glyph 1.0 时代,灯效跟随手机背部的灯带,以及用户设置而变化,用户可以根据灯效判断是否有重要来电,重要通知等信息。

Nothing 对于这个 Glyph 的定义是,「酷」且有用,并且不必要让人时时刻刻盯着屏幕。

Glyph 2.0 更酷更好玩,也更有用,并且一定程度上可以取代屏幕,当然前提是你不把它当作屏幕。

酷是显而易见的,相比于像素精细的 OLED 或者 LCD 材质屏幕而言,LED 灯珠构成的点阵更具有前智能时代的「数码感」,它像电子宠物机,或者俄罗斯方块,经历时代跃迁,这种怀旧的感觉反而衍生出了新鲜感。

Adam Bates 给我们介绍了 Glyph 2.0 的更多玩法:

LED 灯光阵列给我们提供了机会去做更图形化的事情,比如这里可以是个指南针,如果你想要个时钟,那这儿也可以有个时钟。我们还可以用它玩「转瓶子」的小游戏,来决定谁去买点饮料,或者做点什么事儿。

 

这里还有电量显示,秒表,以及很多很多这样有趣的小玩意儿,比如显示太阳此刻在天空的位置,以及日出和日落的时间等等。

 

Glyph 2.0 的灯效阵列想让各种灯光效果看起来统一且系统,但仍是 Glyph 一直以来的感觉。

在这个 Glyph 2.0 的基础上,Nothing 开发了一个 AIGC 技术:根据通讯录里的姓名,生成独一无二的专属的 Glyph 铃声与灯效。 Adam Bates 认为,在不需要翻转手机的情况下,用户就能根据铃声和灯效获取基本信息,从而避免过度的手机信息干扰。

Nothing 和 Android 系统的关系相当密切,Google 投资了他们,他们还收购了智能手机初创公司 Essential,不过 Nothing Phone (3) 上的 Glyph 2.0 界面更像是 Nothing 的一块自留地,它在形态和气质上区隔于 Android 系统,然后开源给 Nothing 社区的用户,让用户为 Glyph 2.0 开发更多的第三方玩法。

Adam Bates 说:

Nothing 的用户社区能让 Glyph 2.0 朝我们无法预测的方向生长。

除了灯效阵列带来的视觉,Glyph 铃声带来的听觉之外,Nothing Phone (3) 背部还有一小块按钮具有压力敏感属性,能够为 Glyph2.0 界面提供带有触感的交互。

综合起来,这就构成了 Adam Bates 和 Nothing 的真正想法:尝试创建一个新的界面和一种与技术互动的新方式,让用户自己去定义,甚至是去开发。

一切都关乎「创造力」,在智能手机行业里体量并不大的 Nothing 筛选出了有创造力和好奇心的用户群体,反过来,Nothing 也提供了这个小小舞台给这群用户来自由发挥。

手机行业有一些共识,但 Nothing 并不在乎

智能手机出现的时间太久了,以至于几年前 Nothing 进入到这个行业的时候,看好的人并不多,因为一个正处于成熟期的行业并非创业者的好选择。

当我们以商业的视角去看那些在智能手机行业激烈竞争中活下来的企业时,总会分析出一些行业共识出来,然后得出他们是尊重了行业共识所以成功的结论。

比如手机设计的趋同化就是一个行业共识,对于中国市场来说,手机要么像 iPhone,要么像华为 Mate 系列就是最具卖相的,实在不行也可以像三星 Galaxy S 系列。

Nothing Phone 自始至终都不像任何一家品牌的任何一款手机。

比如说 Nothing Phone (3) 的背部摄像头分布完全不规则,不守规矩,也不成方圆,为什么会这样?

Adam Bates 告诉爱范儿:

我当然明白大家设计越来越像的原因,不过我们是从工程的角度去思考设计问题的。作为工程师,我们思考的是如何以最佳的方式安排这些组件,从而获得最好的性能。

 

我们的出发点不是试图去复制苹果三星或者华为,所以最终我们做出了不一样的东西。

 

这几家公司有自己严格的设计准则去排布摄像头,这产生了他们产品的辨识度和消费者认知,但我们不会跟随他们,我们只是想要创造我们能力范围内最好的产品。

 

所以,我们完全不害怕偏离那些巨头品牌的做法。

「工程(engineering)」对于 Nothing 以及 Adam Bates 来说有些特别的意义。

Adam Bates 之前在戴森工作,许多知名的产品出自他的手笔,比如戴森 Supersonic 吹风机和无线吸尘器等等,戴森在业界便是以工程能力和设计水平相得益彰而出名。而 Teenager Engineering 则是以一家公司的身份,成为了 Nothing 的联合创始人,并且主导了 Nothing 第一款手机的设计,还奠定了 Nothing 产品的整体的设计风格。

以上,或许就是 Nothing 可以免于流俗,无视行业共识的底气所在。

比如行业还有个共识,就是塑料材质属于中低端手机才会用的材质,高端手机必须用玻璃和金属,所以哪一款平价手机要是用了金属边框玻璃背板,那便是发布会上值得说一嘴的存在。

Adam Bates 并不认为材质应该分高下:

我们对待材质的方式很简单,那就是在特定场景用最合适的材质。

 

比如说我们 Ear(a)耳机的设计,它的充电盒像一个透明泡泡,这个时候,使用透明塑料就非常好,这个时候塑料轻便又耐用,也不需要任何涂层,还方便塑形。

 

在 Nothing Phone (3) 的中框上,我们就用了铝合金,因为铝合金兼具了轻巧和兼顾。

 

我们很注意这样让材质出现在最适合的地方,并且,我们非常确信,只要我们坚持这么做,那么就不会担心产品看起来高端或者不高端,因为只要你用好了材质,产品质感就不言自明。

Adam Bates 还介绍了 Ear (a)上一个塑料可能胜于玻璃的小细节:在它的充电盒上盖内侧,有两个圆形凸起用来固定耳机,想要在玻璃上打磨出这样的凸起极为困难,但在塑料身上却是轻而易举。

当然,Adam Bates 这段话只说了 Nothing 材质哲学的一半:前一半是不同场景用不同材质,后一半是不同材质需要有不同的生产制造工艺。

比如透明设计是 Nothing 的招牌设计语言,但为了为了塑料具有更高的透光度,更好的耐磨性,以及更不易老化变黄,Nothing 也付出了更高的工艺成本。

我和 Adam Bates 关于反行业共识的共鸣在于如何看待手机这样的产品。

现在多数手机和 app 在产品定义的时候,出发点仿佛是「制造一个没有出口的迷宫」,想要尽可能地让用户在手机上多花时间、精力以及金钱。

优雅一点儿地说,就是提高「用户黏性」。

前面在讨论 Glyph 2.0 的时候,Adam Bates 就已经提及了设计这个界面的一个初衷:用户不必翻转手机,也能从 Glyph 2.0 界面上获得信息。

Nothing 并不想这样提高用户的黏性,Glyph 2.0 增加的 LED 灯效阵列,以及压力触感交互,实际上导向了一个产品哲思:手机和用户之间,谁是主体,谁是客体?

当我们一天盯着手机屏幕超过 8 小时,在短视频应用上不断上滑,沉醉于无尽的信息流之中,看似我们是交互的主体,但实际上很多操作并非主动,而是被设计和引导好的。

Adam Bates 希望用户在使用 Nothing 手机,尤其是和 Glyph 2.0 界面交互的时候,获得简单且愉快的体验:

我们设计 Glyph 的初衷就是想用更简洁的信息呈现事物。如果你能在手机背面看到来电,或者看到一些像通知这样的基本信息,也许你就不需要陷入手机、邮件、TikTok 等等所有这些应用的世界了。

 

我认为面对科技产品时,用户应该更有主动权和愉悦感,这就是 Nothing 试图做的事情,即在人与技术之间建立积极的关系。

「我们做了一个头戴式耳机,因为我们自己也需要它」

单纯把 Nothing 称为手机厂商或许有点偏颇,因为在他们在音频产品线上的丰富程度,不仅不输自家手机,也不输其他任何一家手机厂商的耳机线。

这次和 Nothing Phone (3) 一起发布的产品,还有一款 Nothing Headphone (1),一款旗舰头戴式耳机。

以手机厂商对于市占率和 ROI 的追求来看,做头戴式耳机不是一个好选择,因为 TWS 耳机才是市场主流,曾经尝试过头戴式耳机的华米 OV 如今并不再更新,主流手机品牌里,只有苹果的 AirPods Max 头戴式耳机仍在售。

为什么 Nothing 要做一个头戴式耳机呢?

Adam Bates 给了作为设计师角度的答案:

我们一直对音频内容感兴趣,我们的员工喜欢听音乐、播客、书籍和广播,当然看视频也需要耳机。

 

作为一个很有想法的科技公司,踏入到音频领域,做一款头戴式耳机似乎是很自然而然的一步,并且,我们真的认为我们可以给头戴式耳机领域带来一些有趣的,有价值的东西。

 

并且,我们做到了。

按照很惯性的思维,Adam Bates 提到的「有趣的东西」,应该也是给耳机装上 LED 灯效阵列,让耳机能发光能显示,再带一些交互。

但事实就是,Nothing 在 Nothing Headphone (1)上延续了透明、工程化的设计风格,不过没有任何灯光效果。

还有个问题就是,Adam Bates 说的「有价值」的东西是什么?

以及,为什么 Nothing Headphone (1) 是这个样子的?它用到了耳机设计里并不常见的圆角矩形形状,以及两个平面构成的阶梯状结构,而市面上主流的耳机线条和形状都是柔和的圆形或者椭圆形。

对于消费电子产品来说,工业设计不仅仅关乎机器外观,更关乎人机交互。明白了这一点,就明白了 Nothing Headphone (1) 的所有疑问。

Adam Bates 解释了 Nothing Headphone (1) 为什么会长这样,以及为什么没有灯光效果:

我们研究过很多友商的耳机,做成椭圆形主要是为了从侧面看起来小巧,我们则认为,从正面看上去「薄」也非常重要,所以我们决定把所有元器件分散处理排布,而不是垂直堆叠在水平方向,这样就可以塑造出正面看上去最薄的轮廓。

 

至于为什么没有灯效,因为对于我们来说,Glyph 不是一种表面装饰元素,它是手机上的新的交互界面和方式,你用手机的时候可以看到它,但你戴耳机的时候,你看不到耳机,所以耳机上的灯效元素没法给任何的信息反馈。

 

耳机的交互方式是实体的,关于触觉和听觉的。

负责 Nothing Headphone (1) 的设计师 Frank Lin 进一步解释了耳机外观设计和交互方式之间的关系:

采用矩形和平面的元素好处在于,我们可以在耳机上添加具有差异化的控制按钮。我们设计这款耳机最重要的出发点就是让用户可以方便地用实体按键和旋钮完全掌控音频内容。

 

矩形和平面的形状意味着按钮更容易被布置,定位,触及和操控。因为当你戴着耳机的时候,你的视觉不起作用,抬手就能轻松分辨每个东西的位置就显得非常重要。

Nothing Headphone (1) 有 3 个主要按钮:一个滚轮用来控制音量,一个拨片用来切歌,还有按键用来切换音频源(比如从 Spotify 听歌切到 Audible 上听书,无需拿出手机操作)。

这就为什么说工业设计师不仅要处理产品外观,更要处理人机交互,很明显,滚轮操控音量,拨片切歌是一种符合直觉的交互方式,用户触碰到按钮就知道该怎么操作,无需做「确认」的多余动作。

不少耳机采用全按键设计,比如用其中两个按键来控制音量,用户需要先确认按键的上下关系才能进一步操作增减音量。

当整个消费电子行业,尤其是手机行业,甚至是汽车行业都朝着「如无必要,勿增实体,如有需要,做个软件」的方向奔去的时候,「实体」的概念有些式微了,屏幕和图标带着触控与语音交互席卷一切。

当我问 Adam Bates 为什么在苹果和华为都浅尝压力敏感交互方式(3D Touch)又放弃之后仍然在 Nothing 背后的一小块区域做触感尝试时,他的回答或许是整个采访中最提纲挈领的:

We don’t set out to make things easy. We set out to make the best things we can.

 

我们的目标不是让事情变简单,而是创造我们所能做到的最好产品。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小鹏 G7 创下行业最高 AEB 刹停速度,但我们更应该关心速度之外的东西


「安全才是最大的豪华」,看了无数场旗舰车型发布会后,这句话几乎成了旗舰车型讲解安全特性时必选的一句台词,无论是被动安全里的笼式车身,高强度金属材料使用量,电池的枪击测试和针刺测试;还是主动安全里的 AEB自动紧急制动,高速爆胎安全控制系统等等,都值得大书特书一下。

但,非豪华车型呢?在非旗舰车型的发布会上,尤其是平价车型的发布会上,我们不会看到这样的表述,更多的是关于配置同级领先,空间越级挑战之类的表述。

小鹏最近发布的 2 款车以及 1 个测试,则把一个重要的议题摆到了台前:动力、空间、配置平权之后,科技与安全,是不是也该平权了?

小鹏 G7 创下行业最高 AEB 刹停速度

前不久,已经开启预售,即将正式上市的小鹏 G7 进行了一次 AEB 自动紧急制动测试,在白天静止事故车辆/行人前向两个场景下,刹停速度均达到了 130kph,这也成为了行业最高的 AEB 的紧急刹停速度。

另外,在夜间高速、湿滑路面和前向事故车和前向行人的两个场景下,小鹏 G7 的 AEB 成功刹停速度为 120kph。

在黑夜行车,隧道内起雾,湿滑路面,前向事故车的较为极端场景下,小鹏 G7 的 AEB 成功刹停速度为 80kph。

AEB 并不算是一个特别新的技术,但却是一个技术密集程度高,并且仍在不断迭代的技术,简单讲,AEB 是通过车辆的感知传感器,包括但不限于毫米波雷达,摄像头和激光雷达等等,对驾驶环境,主要是前向方向进行感知,当传感器感知到障碍物,并且系统判定可能产生碰撞的时候,AEB 系统就会计算车辆可能撞上障碍物的时间还有多少,这个时间业界叫 TTC(Time To Collision),然后根据 TTC,以及当下的车速等情况,提醒司机进行制动,或者直接给到制动系统命令进行车辆制动。

「高算力和强模型」和 AEB 有何关系?

今年 5 月 28日,小鹏 MONA M03 Max 新车上市,小鹏 MONA M03 推出了 4 款全新版型,分别为小鹏 MONA M03 502 长续航Max、小鹏 MONA M03 600 超长续航 Max,以及小鹏 MONA M03 515 长续航 Plus、小鹏 MONA M03 620 超长续航 Plus,官方指导价 11.98—13.98 万元。

其中 Max 版本标配有双 Orin-X 芯片,总算力升至 508TOPS,这是 13 万级别车型里面罕有的配置,同级产品的算力基本上在 100TOPS 左右。

小鹏图灵 AI 智能辅助驾驶采用了纯视觉路线之后,不需要激光雷达元器件,这个技术路线和特斯拉一致。

少一种传感器数据,就能节省不少算力,进而能够升级视觉感知模型的容量、参数量和推理的频率,因为视觉摄像头的获取数据的帧率(24fps)大大高于激光雷达(10fps),所以反应速度也会更快,这对需要在高速条件下做感知做决策的 AEB 至关重要。

而才预售没多久的小鹏 G7 是目前小鹏体系内智能辅助驾驶算力最高的车型,其旗舰 Ultra 版本搭载了 3 颗小鹏自研的图灵 AI 芯片,有效算力超 2200TOPS,小鹏表示,这样的算力储备,是为后续的 L3 级别智能辅助驾驶做好准备。

在智能辅助驾驶方案上,小鹏 G7 行业首发了「大脑+小脑」VLA-OL 模型和VLA+ VLM 大模型,多模态大语言模型技术的出现,让智能辅助驾驶的上限得到不小提升,包括主动安全在内的下限也随之提升,相比于依靠编写规则的智能辅助驾驶方案,大模型支持的端到端方案能够像人类一样「看得更明白,想得更清楚」,并且和人类大脑一样,这套方案具有理解和学习的能力,车能够越开越聪明。

这里面,「大脑+小脑」 VLA-OL 模型能让智能辅助驾驶可以理解、推理和决策,有「主动思考」和「理解世界」的能力,例如看到前方塌陷,或者遇到救护车的时候,能够像人类司机进行避让。这种小概率的场景,在以往依靠工程师写规则的辅助驾驶方案里很难覆盖到。

论述了这么多小鹏新车和智能辅助驾驶端到端方案,是因为它们和 AEB 息息相关。因为 AEB 就是典型的「感知+决策」场景,感知准不准,决策快不快,决定了 AEB 的效果如何。

理解了这层逻辑,就会明白为什么小鹏 G7 演示的小鹏 AEB 能力为什么能够大幅进阶,因为本质上讲,AEB 是一个验证小鹏纯视觉智能辅助驾驶方案在主动安全可靠性的典型场景。

纯视觉智能辅助驾驶方案背后,是依赖「高算力和强模型」,强大的模型可以提升感知到的信息的处理效率和精度,而高算力可以让大模型在车端跑得更顺畅,也就是「感知+决策」能够准且快。

进一步讲,小鹏使用一段式端到端模型,从感知到决策再到规划控制,可以一步到位,计算简化让端到端模型的延迟大幅降低。

在本地部署过 DeepSeek 不同参数大小模型的人会清楚,参数越小,运行和反应速度也快,对硬件要求也低,但答案质量也会更差,而参数越多,比如 671B 大小的满血版 DeepSeek R1 生成的答案质量最好,但对硬件要求很高,同时运行反应速度也会慢。

所以说想要又准又快,其实也是个很矛盾的事情,想要智能辅助驾驶决策快,尤其是 AEB 感知准决策快,那模型肯定就需要在本地,因为云端通信的时间太不可控,干扰因素太多,本地运行的话,那模型肯定也不能太大,不然反应也慢,但是模型不过大的话,那也不够聪明,反过来会影响感知的效率和精度,以及决策的准确性。

小鹏的做法是,先把大算力芯片准备好,图灵 AI 芯片最高可以运行 30B 大模型,这是能力的上限,也为未来的智能辅助驾驶留有了巨大的冗余。

因为,在小鹏的逻辑中,高算力是智能辅助驾驶的先决因素,算力不够,强模型跑不动,后面一切都是空谈。

在车端模型侧,小鹏汽车通过云端蒸馏小模型的方式将世界基座模型部署到车端。「蒸馏」技术能够让车端的 VLA模型在继承原本云端基座模型能力的前提下,有效地减小模型体积。

其实今年春节期间火爆的 DeepSeek 背后的大模型就是基于 Llama 和 Qwen 系列开源大模型进行强化学习和知识蒸馏而来的。

至此,我们就可以理解小鹏图灵 AI 智能辅助驾驶采用的端到端大模型方案,VLA 模型和 VLM 模型,图灵 AI 芯片,以及 AEB 测试成绩之间的逻辑关系了。

小鹏寄希望于在蒸馏 72B 云端基座大模型的前提下,保留更多的模型能力加上更强大的车端算力,这样才可以保证纯视觉智能辅助驾驶方案「高算力和强模型」的基础足够稳固,进而保证各种「感知+决策」场景下的实现能力。

AEB 就是这种能力的具体体现。

用户用得到的,才有用户价值

在讲小鹏智能辅助驾驶的时候,我特意讲到 13 万的小鹏 MONA M03 里的 MAX 车型都配有双 Orin-X 芯片,算力有 508TOPS,这一方面是说小鹏在尽可能多的车型上部署「高算力和强模型」,另一方面也是说,即便是小鹏体系内的入门款车型,在智能辅助驾驶能力上,也是和更高端车型处于同一梯队的。

而小鹏 G7 里面搭载了 3 颗图灵 AI 芯片,有效算力超 2200TOPS 的 Ultra 版本车型,则着眼于更长远的未来。

不管如何,小鹏从之前 G6 开始的阳谋就再明白不过:智能辅助驾驶要平权,这个路线贯彻得最彻底的产品就是 MONA M03。

这次 AEB 测试,以及释放出来的信息,就是让主动安全技术也要平权。

最近,小鹏汽车高管@托马斯电火车就在微博上说,在内部会上,他问何小鹏,不少二三十万的车智驾算力远不如 MONA,是不是小鹏汽车选择错了?因为这些车其实也可以宣传「智驾」。

何小鹏的解释是,小鹏 MONA M03 Max 版本为什么要配与小鹏G6、G9 还有 P7+ Max 版本同样的算力,就是因为算力不同,智能辅助驾驶和主动安全的能力也会千差万别,并且也关系到这辆车几年后能不能继续获得能力上的「思考与成长」。

想要安全平权,前提是算力平权,因为安全关乎每个人,每个场景。

AEB 技术的应用场景非常广,不仅是高速路上前方车辆事故场景,或者行人乱穿马路场景,也有不少属于是日常用车场景,还有就是人类视觉盲区场景。

比如说那个黑夜行车,隧道内起雾,湿滑路面,前向事故车的较为极端场景,人类视觉是受限的,但是纯视觉方案里面其实很大部分的感知工作,是通过毫米波雷达和超声波雷达进行的,这两种雷达在光线条件差,以及烟雾遮挡情况下,能够弥补摄像头感知上的不足。

比如在广州,电动两轮自行车(本地俗称「电鸡」)保有量巨大,并且占用机动车道,闯红灯,乱穿行情况十分严重,是造成本地道路事故的主要原因,面对这种情况,AEB 能发挥作用,面对乱入的电鸡能够有效进行主动制动防止碰撞。

另外就是在停车场停车,以及狭窄区域倒车场景,AEB 也能提供额外安全防护,防止误操作导致的事故。

AEB 巨大的用户价值,以及在 13 万档位上就支持的技术基座,就构成了小鹏「安全平权」的阳谋。

这也说明了,为什么何小鹏的微博里,「安全」一直是一个高频词汇。

自去年小鹏 P7+,以及小鹏 MONA M03 发布上市,还有今年 X9 和 G6 焕新,让小鹏连续 7 个月交付量超 3 万台。2025 年 1-5 月,小鹏汽车累计交付新车共 162578 台,同比增长 293%,同时用户对拥有城区 NOA 能力的 Max 版本车型更为青睐,销量和用户偏好更加印证了小鹏在「安全平权」这件事上的价值。

当然,最后还是需要着重说明强调一点,AEB 最高刹停速度代表能力水平,在极限场景下是作为兜底的功能,并且高速刹停对造成驾驶员和乘客很大的身体冲击和负担,我们更应该关注的是 AEB 能否在日常和高频场景发挥作用。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小米 YU7,是真正的「Model Y 杀手」

特斯拉 Model Y 就是汽车界的 iPhone。

正如智能手机行业在上十年前不断地祭出一款又一款号称「iPhone Killer」的产品但又被 iPhone 在销量和产品力上一次又一次双杀一样,汽车行业也总想整出一款 「Model Y Killer」出来,但,Model Y 依旧是全球单车型销冠,以及 SUV 品类里的高峰。

在社交网络上向来谦逊的雷军,于小米首款纯电 SUV 车型小米 YU7 正式上市发布的前夕,写下了一条微博:

很多朋友问我:小米 YU7 有没有机会超过 Model Y 在国内的销量?Model Y 是行业公认的「史诗级神作」,连续多年全球销冠,击败一轮又一轮的挑战者,非常厉害!

 

但我们依然制定了「离谱」的目标:小米YU7 要继续挑战 Model Y!

 

就产品力来说,我特别有信心。至于销量,就看发布后大家的感觉。

「Model Y Killer」前赴后继,不是 6,就是 7

在 2025 年年初 Model Y 小改款之前,2024 年 Model Y 在国内的平均月销量是 4 万辆,在去年 12 月销库存阶段甚至卖出了 61881 辆。

而它的大多数对手,在 20-30 万元区间的纯电 SUV,比如乐道 L60,极氪 7X,阿维塔 07,月销量基本上都在 5000-9000 辆区间。

如果放宽能源限制,把能够烧油的增程车型也算进去,那么竞争就会更激烈一些,理想 L6、问界 M7 和智界 R7,去年平均月销量都在 1 万以上,其中理想 L6 甚至很接近月销 2 万的门槛,是不折不扣的爆款车型,但,离 Model Y 仍有不小差距。

虽然在宝马等传统品牌的车型体系里,7 代表不折不扣的旗舰车型,但是在国产新能源的体系里,7 却是绝对的主力系列,所以我们看到了这么多国产「7」系,带着少数的「6」去围剿 Model Y。

对于国产新能源的坏消息是,单打独斗大家都没干过 Model Y;好消息是,群殴效果还不错,Model Y 在国内新能源 SUV 里的销量占比逐年下降,从 2021 年 1 月特斯拉开始在中国交付 Model Y,当年 Model Y 在中国新能源 SUV 的市占率达到了 16% 左右,而 2024 年,这个数字跌到了不到 10%。

2025 年对于在国内销售的 Model Y 来说,也不算一个好年份:由于车型改款,再叠加上春节的影响,其 2 月销量罕见地跌到 4 位数,仅卖出了 8006 辆。

虽然在 3 月,Model Y 国内销量再次突破 4 万,以 48189 辆的成绩重回单车型销量第一,但在 4 月和 5 月又下滑至 19984 辆和 24770 辆。焕新 Model Y 的统治力远远不如 2024 年。

一个例证就是,交付能力依旧受到产能约束的小米 SU7 在 5 月卖得比 Model Y 还好,这个月又卖了 28013 辆,连续 2 个月销量超过了 Model Y。

虽然说拿轿车和 SUV 相比是关公战秦琼,不在一个维度上,但一般而言,同价位段的车型里,SUV 大概率是卖得比轿车好的。

既然现在小米 SU7 都能比 Model Y 卖得好,那么更具卖相的小米 YU7 岂不更是优势明显?

在这场「Model Y Killer」前赴后继,不是 6,就是 7 的战争中,小米 YU7 确实就是那个最有望成为「Model Y Killer」的选手。

打败 Model Y,小米需要做什么?

2013 年,雷军成为了特斯拉 Model S 的车主,并且两度会面特斯拉 CEO 马斯克,还留下了经典的双手插兜合影。

在移动互联网和智能手机行业蒸蒸日上的时间点,雷军恐怕还没想过,有朝一日小米和特斯拉会在汽车行业短兵相接。

但在消费电子行业触及天花板之后,手握大量现金,恰逢新能源浪潮行至过半的小米宿命般的进军了汽车行业,并且是以极为谦逊的姿态。和传统汽车行业的对外形象上的虚张声势不同,雷军和小米在移动互联网时代练就的营销、市场和品牌能力,堪称乔峰使出太祖长拳,看着招式简单,但实战威力巨大。

也就是在雷军的榜样作用下,诸多车企老板纷纷从幕后走向台前,「亲力亲为」起市场营销和品牌建设的活计,但有成效者寥寥。

这是行业里又一个「从看不上,到看不懂,再到追不上」的故事。

汽车市场是一个高度依赖品牌价值的市场,在今年 5 月发布的衡量品牌价值的 BrandZ 2025 百强名单里,汽车里排名最高的品牌就是特斯拉,品牌价值 860.43 亿美元,名列总榜第 28 名。

小米的整体品牌价值为 219.17 亿美元,排在百强榜里第 96 名,需要着重说明的是,相比于 BrandZ 2024 榜单,小米品牌价值在一年之间增长了 103 %,BrandZ 给出的理由是,小米品牌价值增长,是它在「寻找增长新空间」上树立了典范。

这个新空间毫无疑问,就是小米汽车。

▲BrandZ 2025 百强名单

这个榜单里,第 100 名的守门员品牌是奔驰,介于特斯拉和小米之间的汽车品牌是名列第 77 名的丰田,品牌价值 293.29 亿美元。

虽然小米品牌涵盖了手机平板电视汽车等等等品类,但足以说明就品牌力而言,小米绝不会拖累销量,反而有莫大的助力。

这个由总部位于英国伦敦的市场调查和市场咨询公司凯度 Kantar 发布的榜单还记录了一个趋势:

目前美国品牌占据全球百强品牌总价值的 82%,较 2006 年的 63% 显著上升。同时,中国品牌价值在过去 20 年间翻了一番,目前占全球百强品牌总价值的 6%;而欧洲品牌价值目前仅占总价值的 7%,较 2006 年的 26% 大幅萎缩。

欧洲的面积和总 GDP 目前都是略高于中国,品牌价值的状况也是差不多的情况,但往后就不好说了。

▲ Kantar 强势品牌组合的增长显著高于标准普尔 500 指数和 MSCI 全球指数

过往 20 年,是科技、消费电子和互联网行业飞速发展的 20 年,美国的苹果、Google、微软、Facebook、Instagram 等科技和互联网品牌成为品牌价值增长的最大受益者。

2020 年之后的世界,新能源汽车和 AI 成为主流叙事,所以英伟达和特斯拉实现了品牌价值的飞跃,与此同时,涉足了汽车行业的华为和小米,并且都获得巨大成功,因而在这一年间都获得了超 100% 的品牌价值增长,华为有所不同的是,它获得了「坚韧」的形象加成。

今年特斯拉在欧洲市场遇冷,和售价,产品质量这些因素没有关系,纯粹就是因为与特斯拉品牌强绑定的马斯克因为深度参与了政治活动,引起了欧洲消费者的反感。

这就是品牌影响销量的实际例证。

用了十几年培育品牌和潜在用户的小米,加之在国内主场作战,就已经可以认作是为打败 Model Y 在蓄力了。

试图在空间、动力、续航、价格、外观内饰、配置上对特斯拉 Model Y 进行六维度包围的产品并不少,但最终一一在销量上战败,品牌力上的差距实在是难以弥合。

小米,在国际上意义上品牌价值最接近特斯拉的中国汽车品牌,而在中国本土,其中的差距只会更小。

是 SU7 给了 YU7 信心

在小米 SU7 之前,以运动取向的纯电轿车其实并不好卖。

这和中国人买车的逻辑有很大关系,因为家庭取向的混动大空间 SUV 才是这个市场里的标准答案,运动、纯电和轿车三个关键词都不利于卖车,并且,SU7 还不便宜。

或许小米知道自己造车卖车的结果不会差,但是 SU7 如此成功还是超过了小米起初规划好的产能,以及自己当时的预期。

▲ 开售 18 小时,小米 YU7 锁单量已突破 24 万台

也正如小米汽车官方微博发布的《小米汽车答网友问(第 160 集)》里提到的那样:

Q:这次小米 YU7 上市,相比去年小米 SU7,你们的把握是不是大了很多?

 

A:这一次,我们的信心确实更足了。 自小米 YU7 上个月技术发布以来,用户朋友们的热情远超我们预期,小米 YU7 用户留资量达到了小米 SU7 同期的 3 倍。在此,我们由衷地感谢各位朋友的支持。我们有信心,小米 YU7 将和小米 SU7 一样火爆。

虽然多少有点赛前开香槟的意思,但现在的情况就是,没人怀疑 YU7 会失败。

这是一个比 SU7 更成熟的产品,也更具卖相的产品,当然也是在空间、动力、续航、外观内饰、配置几个维度包围 Model Y 的产品,也取消了在规划 SU7 时候保守的那一部分。

比如说 SU7 标准版,售价 21.59 万起,虽然最便宜,但也被认为是 SU7 几个版型里性价比最低的,400V 架构,无激光雷达,仅 84 TOPS 的辅助驾驶算力,73.6 kWh 电池等等配置,都比 SU7 Pro 和 SU7 Max 低一大截。

SU7 标准版的较低配置和较低售价,可以理解为小米在做产品规划时候的保守,需要留一个低价产品来降低购入门槛。

在 YU7 标准版上,我们看到了小米的信心。在前期宣传上,小米着重突出了「全系标配」字样,SU7 标准版的配置短板被全面补足,YU7 全系标配了激光雷达和 700TOPS 辅助驾驶算力,800V 碳化硅高压平台,连续阻尼可变减震器等,标准版的 CLTC 续航也来到了 835km。

实际从配置来看,YU7 标准版还比 SU7 Pro 还略微高一点,因而起售价的拔高也就再所难免了。所以还没发布的时候,雷军就表示「YU7 标准版只比 SU7 标准版贵两三万」是不可能的。

也就是说,小米和雷军想用 Model Y 相近的价格来打败 Model Y,小米产品过往的「性价比」概念得到了升级,如今小米汽车的性价比是「更贵,也更值」的意思,而不是「很便宜,也还行」的意思了。

当一个品牌的大众认知是「更贵,也更值」的时候,这个品牌的价值,就实现了跃升。

小米 YU7 成为真正的「Model Y 杀手」,就差这一次品牌价值的跃升。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


乐道旗舰 L90 快要来了,这辆车让我们重新理解乐道

乐道公司上下对于乐道 L60 这款车型是有相当大程度的惋惜的,毕竟这是一款应当卖爆,但各种原因没有卖爆的车。接下来的乐道 L90 就成了这个品牌没有理由的关键战役,这是一辆必须卖好的车。

如果说乐道 L60 有一个明确目标,想要扮演 Model Y 杀手的角色,并且力求在六维图上全方位超越 Model Y 的话,那么乐道 L90 的身份则是杀入今年异常激烈的三排六座大 SUV 竞争之中。

前不久爱范儿和董车会在蔚来公司看过乐道 L90 实车,并和乐道总裁沈斐,乐道产品负责人俞斌沟通完之后,也对这款乐道旗舰车型有了更为清晰的理解,实际上也解答了 3 个问题:

  • 乐道 L90 想要解决用户什么问题?
  • 乐道 L90 想要解决乐道的什么问题?
  • 同是旗舰,乐道 L90 和蔚来 ET9 有何异同?

乐道 L90 想要解决用户什么问题?

如我们之前所言,三排六座混动大 SUV,是 2025 年中国汽车市场的「版本答案」,虽然乐道 L90 是纯电加换电车型,没法烧油,但基本上可以认作是同一赛道竞争。

混动车型,尤其是增程车型之所以在市场上热卖,从「落后技术」到「真香」的认知转移,还是这类车型消除了电动车遗留下来的续航焦虑。

相较之下,蔚来旗下车型的换电补能体验甚至还在加油之上,三五分钟就能从没电到满电出发,只是换电的认知教育任重道远。

虽然混动(包括增程)全尺寸 SUV 能够解决续航焦虑问题,但是在蔚来和乐道看来,增加了发动机和油箱,毕竟会失去一些什么,比如前备箱空间,以及第三排的舒适性和可用性。如此一来,绝大多数的混动三排六座全尺寸 SUV 就会出现坐满 6 人,但行李未必装得下的矛盾,并且第三排的 2 人也会牺牲舒适性。

乐道 L90 作为纯电车型的优势就出现了:巨大的前备箱,和理论上更舒适的第三排。

这就是为什么在上海车展预热期阶段,乐道 L90 优先展示的特性就是那个巨大的前备箱,一个足以坐下 2 人,装下数件行李的 240L 巨大空间。

之所以能留出这么大的前备箱空间,除了纯电车型的先天优势之外,也有蔚来乐道在整车集成能力上的进步,尤其是「自研集成式热管理系统 ETMS 3.0」给前备箱挤出了大量的空间。

这就是乐道 L90 想要解决的用户遇到的第一个问题:它能同时装 6 个人和 10 个旅行箱,满足三代人同时远行的需求,并且第三排也有相当好的舒适性。

当然,乐道也列出了一些混动,尤其是增程车型的惯有痛点,比如虽然它们都能烧油,但烧油的成本比用电高太多了,所以混动车型的车主主要还是靠电出行,问题又来了,混动车型的电池小,车身重,反而需要更频繁地充电。

到万不得已要烧油的时候,混动车型的动力又会衰减一大截,没法随心超车变道。

以及,混动车型还要同时维保电机和发动机两套系统,这里的成本也会更高。

简言之,在乐道看来,混动尤其是增程三排六座 SUV 车型是相对于燃油车车型的巨大进步,但仍有不少问题,而这些问题都是作为纯电加换电车型的乐道 L90 能够扬长避短的。

目前可以公开的信息是乐道 L90 车长 5145mm,轴矩 3110mm,相比之下,三排六座全尺寸 SUV 里的代表车型理想 L9 的车长 5218mm,轴距 3105mm,问界 M9 车长 5230mm,轴距 3110mm。也就是说,相比业界旗舰,乐道 L90 车身更短,但轴距比理想 L9 更长,和问界 M9 相当。

当然,冰箱彩电大沙发等等舒适性配置也不会缺席,在乐道 L60 上表现相对平淡的内饰,在 L90 身上也会更好的表现,包括之前用户吐槽乐道 L60 标配的 60 度电池偏小,这一次 L90 则标配更大的 85 度电池。

还有两个重点配置:一是蔚来 ET9 同款的电机(后驱 340kW),二是配上了空气悬挂。这两点保证了乐道 L90 的动力下限和舒适性下限。

基于这些可以公开的信息,我们大致可以断定,乐道 L90 在用户层面不会有什么短板体验:动力表现,驾乘舒适性,乘坐空间,行李空间,舒适性配置在价位段上会是上佳表现。

在此,我们也可以猜想价格,乐道 L90 之前定位在 30 万+全尺寸 SUV,这说明起售价很可能在 30 万左右,叠加了 BaaS 租电池方案之后,价格还要少 8.6 万(参考 L60 85 度电池的租电方案),这意味着乐道 L90 采用 BaaS 方案之后的价格,大概率只要 20 万出头(BaaS 月租金 899 元)。

万一,我是说万一,乐道心一横,L90 采用 BaaS 方案之后,价格干到 19.99 万,那用户最大的问题也解决了:价格问题。

▲ 乐道 L60

乐道 L90 想要解决乐道的什么问题?

之前乐道高管表示过,乐道 L90 也会拉动乐道 L60 的销售,这个逻辑其实也是通的。

蔚来和乐道之前遭遇了一些信心危机,并不算快的销量增长率,以及一直持续的亏损,让不少人担心这家公司的前景,然后犹豫选购蔚来和乐道的汽车。在威马、高合、极越和哪吒纷纷暴雷的背景下,新势力车企能不能赢得外界的信心至关重要。

卖得越多,财务状况越好,那么信心自然也就来了。

按照爱范儿和董车会目前的观感,乐道 L90 目前的卖相不错,放在今年这场异常拥挤的三排六座 SUV 当中依然属于相当有竞争力的选手。

只要保证交付的能力跟上,它是可以带给乐道品牌极大信心的。

▲ 乐道 L60

按照蔚来对于乐道品牌年底 L60,L80(年底上市的五座大 SUV)和 L90 三款车型合并销量达到 2.5 万辆的预期,L90 必然也会是走量车型,所以它的销量预期也不会低,大几千是及格水平。

类似的,领克 900 发布之后,作为领克家族售价最贵的车型,它摘得了 5 月领克家族的销量冠军。

所以 L90 比 L60 贵并不是它不会卖得比 L60 差的理由,L90 应该放到市场里,和理想 L8、L9,问界 M8、M9,深蓝 S09,魏牌蓝山,腾势 N9、领克 900,极氪 9X,小鹏 G01,吉利银河星舰 9 等等车型去横向比较。

碍于车型单一,宣传内敛,不爱搞认知作战等因素,乐道虽然定位于家庭用车,但实际上这个定位的认知度是不够高的。对于乐道来说,L90 有着更明显和更容易传播的家庭属性,这也是这款车肩负的责任:让乐道的家庭定位更深入人心一些。

当然,这款车也需要证明乐道在三排六座大 SUV 这个红海市场里证明自己的产品能力,还有市场和营销能力以及,纯电车型的潜力。

下半年纯电 SUV 的明星车型,除了乐道 L90 和 L80 之外,还有理想 i8 和理想 i6,无论是换电,还是 5C 快充,都在试图通过补能体系建设,还有补能速度,来回应混动车型:纯电车型也不必有里程焦虑。

充换电网络建设上,上个月蔚来实现了广东 122 个县级行政区的换电县县通。全国范围来看,截至 4 月 29 日,蔚来全国范围内的换电站达到 3289 座,充电桩 26106 根,覆盖近 1000 个区县。高速换电网络已打通「9 纵 9 横 14 大城市群」,其中还贯通了著名的 318 国道。

乐道 L90 需要证明自己的产品力,增加外界对乐道的信心,以及证明蔚来换电体系的正确性,在蔚来的商业模型里,车型销量和充换电站建设,是一套飞轮,二者相互影响,相互促进,当然也相互拉扯,只有换电车型的销量上去了,换电的逻辑才通顺。

如果说蔚来 ET9 作为整个蔚来公司的技术旗舰,承担的并非走量任务,而是树立蔚来品牌的高端形象,以及承担技术探索和落地任务的话,那么爱范儿和董车会认为,乐道 L90 的定位是「产品旗舰」。

它用到了 ET9 同款的全域 900V 架构和高功率电机,也比蔚来 ES8 更大更长,同时需要成为一个「六边形战士」,因为它面向的是三代同堂的家庭用户,需要满足 6 个人同时的需求和个性的需求,它还需要做成本控制,来保证一个有竞争力的价格,也需要在同类产品里被一眼认出来,有一句话就能被理解的特点。

做技术,需要一味地往上,而做产品,则需要极致地取舍权衡。

所以,在这样一辆车上,我们能够看到这个阶段乐道做产品的能力上限。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌