Reading view

There are new articles available, click to refresh the page.

蔚来需要的第二次胜仗靠 ES8 打赢了,但蔚来的改变才刚刚开始

因为乐道 L90 的成功,在蔚来 ES8 还没有发布的日子里,蔚来的品牌已经在不少人眼里降级成了「乐道旗下的豪华品牌」。

虽然是句玩笑话,但若是蔚来品牌依旧没有爆单的车型出现,那么蔚来的品牌确实并不安全。乐道 L60 产能跟不上交付的问题再现,加上萤火虫天崩开局,以及蔚来 ET9 无法上量等因素叠加,让去年年末今年年初的蔚来又陷入到了「下一个倒闭的会不会是蔚来?」的讨论当中。

居安思危当然重要,但一直在危险当中,活得也憋屈。应该上量的产品没能上量,这个时候偏偏又推出 ET9 这样的仅为秀技术立品牌的旗舰车型,此时的蔚来,高端得有点自说自话。

前不久在采访另外一家车企负责人的时候,对方说了一句话倒也非常契合还未发布 ES8 的蔚来,这句话是「一个汽车品牌能不能立起来,只需要连续打两场胜仗;一个汽车品牌倒下去,也只需要连续打两场败仗」。

于是乎,蔚来 ES8 肩负的任务就异常艰巨:

  • 要在乐道 L90 之后,再打一次胜仗
  • 作为蔚来旗舰 SUV,不仅要立住品牌,还要承担走量任务
  • 要成为蔚来集团从活下去,到活得好的转折点

就像蔚来内部形容 ES8 的发布上市是「淮海战役」一样,胜则一路平推,败则从长计议,所以蔚来为 ES8 修改了 NIO Day 的发布时期,把一年中蔚来最重要的时间节点给到了这款车型的正式上市。

蔚来需要的第二次胜仗

管理学上非常看重「打胜仗」,因为打胜仗可以掩盖很多问题,反过来,能打胜仗又能佐证管理的正确性。

因为不够成功,李斌是过去几年时间里最需要花时间去解释什么是「正确」的车企创始人,没有之一。

而当乐道 L90 和三代蔚来 ES8 都成为了爆品之后,李斌就不需要解释那么多了。

其中颇为玄妙的地方在于,因为蔚来素来不公布官方预定量,所以订单情况如何外界并不知晓,但这两款车外界都相信已经成为了爆品,或即将成为爆品。

唯一的订单信息是,李斌在三代 ES8 预售发布后的次日采访中说,ES8 同时间段订单数量高于乐道 L90。

而 ES8 的预售价格比乐道 L90 多十多万,看起来蔚来 ES8 确实能够承担起作为旗舰车型树立品牌,又承担走量的任务。

这是蔚来公司体系内绝无仅有的一次突破,在此之前,蔚来公司里的主力销量代表是 5566,即蔚来 ET5t,ET5,蔚来 ES6 和蔚来 EC6 四款车,均属于蔚来旗下轿车和 SUV 里的入门车型,至于更高端的二代 ES8,ET7 和 ET9,销量加起来常在 2000 台以下。

当然,三代 ES8 的超预期可以说是一次精妙的预期管理,产品风格上,此前蔚来的旗舰产品给人的感觉是科技和简约有余,但是豪华感不足,这固然和蔚来新锐的品牌形象挂钩,但是动辄 40 万往上的产品,受众也往往年纪到了 40 左右,对豪华感是有天然追求和需要的。

所以这一次三代 ES8 就在肉眼可见的地方把豪华感给做到位了,做到几乎极限的体积,贯穿到后备箱的软包裹,璀璨的日行灯,隐私玻璃,更大面积的 Nappa 真皮和更老钱风的木饰,还有内饰配色以及缝线压纹等等,都告诉购车者,这款车开出去坐进来,都有面子。

在之前蔚来 ET9 发布的时候,有句话传得非常广:花八九十万买 78S,车替我说话;花八九十万买 ET9,我得替车说话。

或许是蔚来厌倦了「解释」这件事,或许是蔚来悟了,反正三代 ES8 是不需要解释了。

在提前看车的时候,我甚至会因为车内配置堆得太多而感觉到这么硕大的车身里空间感有点不够。

这是第一个预期反差,源自之前蔚来 ES8 等旗舰产品与当下三代 ES8 产品观感上的巨大差别,从简约到豪华,价值感更为外显。

第二个预期反差更为粗暴,那就是价格,二代 ES8 起售价为 52.8 万元,如今三代 ES8 预售价是 41.68 万元起,考虑到一般来说,预售价会比正式售价高 2-3 万元,所以后续蔚来三代 ES8 的正式售价很可能是 38.68 万元或者 39.68 万元。

一个比二代 ES8 更大更豪华的三代 ES8,还便宜了至少 12 万元,这完全是超预期的。

毕竟 40 万在蔚来体系内,甚至还买不到 100 度电池的 EC7。

三代 ES8 的胜仗,当然属于产品定义和定价策略的胜利,也可以是蔚来一直说的「长期主义」的胜利,李斌在采访中提到了这个定价是否有利润,为什么可以便宜那么多:

一代和二代 ES8 技术都用了当时行业最先进的技术,成本很高,但这次全新 ES8 成本低了。定价综合考虑各方因素,也是竞争的需要,目前的预售价还是有毛利的。

 

目前的定价对老用户以及他们车的残值是很伤的,但还是要做出对整个公司和整个社区一个对的决定。但蔚来活下去是最重要的,这样蔚来承诺的权益才能有保障。

 

全新 ES8 的车身铝的含量没有那么高了,但并不意味着整个安全性下降,还是按超 5 星的安全标准设计。900V 平台的研发和生产成本,可以在 ET9,L90 上分摊,包括自研神玑芯片可以省很多钱,规模提升到一定程度,研发的芯片、技术创新、智能系统都能分摊成本,而老款车型技术用的太早,规模没到,导致成本高。

 

老车型定价高,主要是蔚来在技术上做了很多第一,如果当时少做一些第一,就可以便宜一些。二代 ES8 在成本结构上犯了错误,产品定义阶段很多东西没定清楚,当时 ES8 和 ES6 之间差价过大,在 40 万的高端主力区间缺乏产品,只能靠后续的补贴来让二代 ES8 站在这个 40 万的区间。

 

三代 ES8 则是一出生就站在这个位置,发布上市天生就是 40 多万的大三排 SUV,这也是第一代 ES8 的价格位置,三代 ES8 则是回到了属于它的合理价格区间。

汽车是一个天生需要规模的行业,除了极少数超跑品牌之外,规模意味着成本摊薄和效率提升,但此前蔚来恰恰就是缺规模。

三代 ES8 看起来能有一个不错的规模。

于整个行业而言,三代 ES8 也有望证明,高端纯电大三排 SUV 是可以卖好的,在此之前,这个领域一直是混动主销,哪怕是问界 M9 的纯电版,也卖得并不是很好。

蔚来产品体系重构

就在三代 ES8 预售后的一周,蔚来品牌宣布旗下所有产品,都将标配 100 度电池,同时起售价不变,意思就是用原来买 75 度电池版本的钱,现在可以买 100 度电池的车型了,考虑到其中 3.8 万元的差价,基本上相当于蔚来把 100 度电池包车型降价了 3.8 万元。

这次变相降价之前,蔚来也调整了 100 度电池包的价格,从之前的 12.8 万元,降低到了 10.8 万元。

▲ 调整后的蔚来车型售价

毫无疑问,这一系列的动作,都是在提升蔚来现有车型的价格竞争力,尤其是目前销量中坚的 5566。因为三代 ES8 的出现,原有蔚来品牌车型的价格梯队产生了巨大的震动。

预售 41.68 万,正式售价一定低于 40 万的三代 ES8 作为蔚来品牌里的旗舰 SUV,竟然还比定位更低,车型更小的 EC7 便宜好几万,比 EC6 也贵不了多少。

当然,作为蔚来旧体系的车型,蔚来的两款轿跑 SUV 销量都比较低,不具备参考价值。

而 ET5t,ET5 和 ES6 三款真正的销量中坚车型,本身和三代 ES8 的售价区间区隔较大,也因为 100 度电池包的降价和标配增加了性价比,受到了冲击可能相对有限。

并且就在刚刚的成都车展上,蔚来总裁秦力洪表示,2026 年内,5566 车型不会推出 NT3 版本。

目前 ET5t,ET5 和 ES6 在今年都有小改款,不过基于 NT2.5 平台,未能拥有诸如 900V 高压架构等技术,而蔚来 ET9、乐道 L60,乐道 L90 和三代 ES8 则都是基于 NT3.0 平台。

接下来,蔚来还有一款已知的乐道 L80 大五座 SUV 在年底发布,以及一款真正的蔚来旗舰 SUV ES9 准备在明年上半年亮相,这两款车型都会基于 NT3.0 平台。

除去本该一炮打响的 NT3.0 先锋乐道 L60 之外,我们可以看到蔚来似乎在布局一场自上而下的产品更新迭代战略,以蔚来 ET9 和乐道 L90 为先锋,再到 ES8 和乐道 L80,还有之后的 ES9,产品定义逻辑也之前的蔚来公司产品完全不一样。

之前提到蔚来的汽车,大家的印象是「车主服务好,品牌高端」,但也会承认产品有溢价,技术和豪华感不够明显的。

而目前基于 NT3.0 的产品,则会回归到技术先进和品质豪华,或者物有所值的评价维度,乐道 L90 和三代 ES8 就是代表。

这里可以推测一下蔚来产品体系的更新路径:颇具卖相的乐道 L80 大五座 SUV 助力蔚来公司在今年年底明年初的汽车销售黄金期冲高并实现盈利,接着明年上半年 ES9 填补 50 万乃至更高价位段旗舰 SUV 的位置,中间可能插一个 ET7 的换代,再接着就是 2027 年 5566 的大换代,直接销量起飞。

从目前的乐道 L90 和三代 ES8 的情况来看,蔚来新产品的传播路径一定是伴随着产品力感知,和价格惊喜一起出现的,这种强感知和惊喜感在三代 ES8 上尤为明显,如前面所言,是因为预期管理铺垫得漫长又全面,也是因为上代 ES8 的性价比着实不高。

所以这套策略的大体路径会是从大车到小车,从不那么好卖的车型,到肯定好卖的车型。

▲ 梗图:三代 ES8 发布之后蔚来车主的心理状态

蔚来品牌势能的释放

蔚来固然是一家走了很多弯路的公司,但若说哪里做对了,那么一定是坚持蔚来品牌的高端化。

例子当然有很多,比如五花八门的车主服务,高档明亮的 NIO House,品牌逆风的时候坚持发布技术旗舰 ET9,花很大力气去运营车主,在字体等审美细节舍得投入等等等。

很多品牌缺少这样的定力而屈服于性价比。

我们也可以这么说,蔚来的定力也是一种蓄力,哪怕是蔚来月销只有六千的时候,大家也不会说它不是一个高端品牌。

如果蔚来的换电体系是一种实体基建的话,那么蔚来的品牌建设,就是一种虚拟的基建。这里的投入,终会有回报。

三代 ES8 的反响,就是蔚来过往积累的品牌势能的一次集中释放,以往遥不可及的车型,没什么性价比的车型,这一次居然以更好的产品力和低得多的价格袭来,遥不可及变成了触手可及。

这一切的大前提,都得是「蔚来是个高端品牌」。

只不过,蓄力完毕,势能释放,乐道 L80 乘胜追击之后,蔚来公司整体可能又和「性价比」有所关联,毕竟我们也要承认,三代 ES8 赢得了销量,不过也拉低了蔚来旗舰车型的价格,并且冲击了整个蔚来的产品和价格体系。

目前看有 EC6 和 EC7 两款不走量的车型作为缓冲,加上标配 100 度电池不加价的策略,蔚来基本盘 556 不会受太大影响,但外界对于蔚来产品的预期和认知,已经发生了巨大的改变。

如果基于 NT3.0 平台的 ES8 卖不到 40 万,那后面的基于 NT3.0 平台的 ET7 该多少? 30 万?

如果这个时候的 ET7 应该卖 30 万,那再后面的 ET5 系列该卖多少钱?20 万?那还有 ES6 呢?

当下的蔚来,面临的问题就是用户预期已经发生了根本性的改变,如何管理这种预期,是蔚来从活下去,到活得好转变的关键。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对话领克穆军:我们的目标是「中国第一混动品牌」丨多样性公司

编者按:

当我们想喝可乐的时候,在极长的时间都只有两个选择:百事可乐和可口可乐。当我们选择手机的时候,有 90% 的概率在苹果和华米 OV 等品牌里辗转。当我们买运动服饰的时候,第一时间想到的,大概率是 Nike、Adidas。

 

但世界之所以缤纷多彩,是因为在这些巨头之外,有一些不遵从传统,力求创造不同,注重设计和功能,着眼于明日的公司存在。

 

它们有着非主流的商业模式,设计与产品能提供独特的用户价值,和足够的社交谈资。重点是,它们没有大公司的包袱,敢于不顾一切的进步。它们,是「多样性公司」。

 

多样性,是开放世界的关键。爱范儿相信,只有真正关注和理解多样性公司才能比更多人更早地看见未来。在同名栏目中,爱范儿将以专访的形式,与你一同见证这些多样性公司,如何重塑未来,定义新常态。

本文是「多样性公司」第 7 篇,我们和领克副总经理穆军进行了对谈。

领克是一个特殊的汽车品牌,它是极少数在汽车赛事领域投入大量精力的中国汽车品牌,也是极少数在燃油、混动和纯电三线作战的中国汽车品牌,它过往有鲜明的年轻和个性标签,现在面临着客群逐渐成熟,市场瞬息万变的挑战。

同时,领克 900 这样自我突破的车型受到了市场认可,领克 10 EM-P 也正准备挑战中大型轿车市场,领克的信心源自什么,热爱归于何处,个性是否会被磨灭?答案就在下方。

「用户热爱我们,我们回应这种热爱」

Q:上半年领克的重磅新车是全尺寸 SUV 领克 900,下半年领克的重磅新车是领克 10 EM-P,为什么会在竞争更激烈的下半年选择一款中大型插混轿车投入市场?

A:领克未来的方向就是主攻插混,这是我们最核心的方向。

然后就是客户的需求还是挺明显的,就在这个方位上,原来买 B 级燃油车,BBA 入门车车型的用户在换车的时候,发现市场没有真正适合他们想要的车型。

具体讲,就是他们想要一辆非纯电的新能源,又有智能化,同时还不改变太多日常实用习惯,然后保证安全,操控也好的车。

领克 10 EM-P 正好能干这件事,安全、操控和品质,这些用户看重的要素我们早就具备了,我们只需要补充好新能源和智能化这两件事,加上符合客群的审美和调性,这就是我们的机会所在。

领克 10 EM-P 造车的逻辑,其实和领克 900 是一致的。领克 900 的经验,我们会复制到其他车型上。

▲ 领克 10 EM-P

Q:过往领克给人的印象是做紧凑型运动型的车型很擅长,到了混动乃至纯电领域,领克的气质是不是在往「家用」在走?更大的领克 10 EM-P 的定位和受众是什么样的?

A:我们会继续坚持做汽车运动,不会放弃,不过有时候谈到汽车运动,不能简单地等同于高性能,更快、更强。

汽车运动也包括操控能力的边界在哪里?我边界更大,就等于操控更稳,失控的边界比别的车大得多,那么车的安全性也提升很多。

所以这次领克 10 EM-P 跟客户沟通的不是我多么快,快这件事,新能源车要比传统燃油车要简单,加电机就能解决。

在这个前提下,我们就思考这款车到底卖给什么样的客户?是像领克 03 那样,自己一个人爽,还是我不仅自己可以爽,也可以带家人朋友一块出去?

中大型豪华轿车的零百加速,都是 5、6、7 秒,就是追求又快又稳,因为 6 秒左右已经很快了,所以领克 10 EM-P 选了这么个值:5-6 秒之间。在这个范围里,我们希望它不仅高性能,但也是操控稳的车,这是我们过往汽车运动底盘调校这些数据得回来的经验,就是让领克的车都能调校得很好,不光是紧凑型,是所有领克的车都能调得很好,甭管大小。

覆盖更多家庭场景,也是一种向宽的逻辑,我们要通过领克 900 和领克 10 EM-P 打动更大的群体。

Q:燃油车,燃油性能车,混动和纯电领克都在做,为什么领克的战线会这么长?

A:领克是这么样的一家公司,就是用户需求在哪里,领克就在哪里,只有这样才能让用户满意。过去无论是油车、混动还是纯电,用户对我们的满意度都挺高的。

之前智能化没跟上,不过这次领克 10 EM-P 就一把追回来了。

我们三线作战是为了满足客户的需求,因为有些客户真的想跑赛道,想玩赛事,在混动和纯电领域还没法提供这样的乐趣和赛事,所以燃油车领克还是要保留,这也是一些领克客户的执念。包括领克做 Z10 也是,因为有很大一批人,当他们想买纯电的时候,还是想要领克的纯电,所以我们推出了领克 Z10,领克 Z20 等纯电车型。

▲领克 Z20 纯电 SUV

战线长也有战线长的好处,比如我们发现领克 900 加领克 Z20 这样的家庭购车组合,就非常强大,900 覆盖长途和家庭用车场景,Z20 覆盖城区短途和个人用车。

我们观察到领克客户随着年龄增长,家庭成员也在变化,我最近去新疆阿勒泰一趟,看到一些开大车的场景,就发现一个大家庭开两辆车不是成本或者累不累的问题,而是不好交流的问题。

一家人从 A 点到 B 点,在领克 900 这样的大车里,就等于在一个房间里头,想唱歌,我有无麦 K 歌;想吃东西,我有冰箱;想照顾孩子,大六座,长辈也在车里,这才是真正的家庭场景。

原来的领克没有这样的产品,现在有了。

Q:现在大家算新势力品牌的时候,不会带上领克,但是相比于吉利长安上汽广汽,领克的形象又是偏新锐和年轻的,领克怎么看自己的品牌定位状态,以及整体价格定位?

A:我觉得我们是基于传统车企孵化出来的新势力,我可以用这句话来描述领克。

因为领克要做的事,就是改变了原来传统车企里最重要的一个环节,以前是以生产为核心,而领克创立之初就是以用户为中心,基于用户的需求去开发产品,去和客户生活在一起,互动在一起。

即便到现在,我都觉得领克是新势力,因为就算把其他新势力品牌都加上,我们也是做用户做得最好的品牌之一。

所以我看是不是新势力就看两件事,第一,有没有创新思维,第二,有没有以用户为核心。

还有个信息我觉得算是「念念不忘,必有回响」,领克创立的时候,目标就是合资品牌,那个时候合资是公众认可的主流,国产品牌大多数都卖 10 万以下的车。但是现在,来到中国汽车主导的新能源领域,领克已经实现了对合资品牌的超越,我们现在的平均售价达到了 18.9 万,是高于丰田、大众这些主流合资品牌的。

高价值造车理念,不搞价格战,在中国是有用户基础的。

Q:领克是汽车品牌里很早就开始做用户运营的,为什么领克在较早的时间点意识到了用户的价值?除了营收,领克从用户这里还得到了什么?除了汽车,用户用领克这里可以得到什么?

A:领克刚成立的时候,当时我们思考的问题是,为什么中国汽车行业还需要一个新品牌,这样一个新品牌靠什么在这个市场立足?

一定是要做创新。

再问一句,我们创新是为了谁?那一定是为了客户,想生存就一定要以客户为主导。

中国汽车品牌里面,用户运营和用户互动有两个品牌是做得比较突出的,蔚来一个,领克一个,其他品牌和用户没有那么强的连接。

领克(LYNK&CO)的名字就是连接(LYNK)和互联网时代开放与协作的精神以及无限可能(CO),领克从初创开始,基因里就包含「用户」。

▲领克 03 参加 TCR 赛事

我们说领克不止于车,是我们是真的能够和客户一起成长,我们得到他们的认可,也能看到他们鲜活的生活,这些让我们非常满足。比如我们领克 03 去参加 TCR 赛事,外人看这个比赛有啥意义吗?对于我们客户来说,意义非常重大,他们有骄傲感,能得到认同,国内能提供这样场景和情绪体验的品牌极少。

所以说,我们的客户对领克的认知和期望非常高,并不是说他们买了其他品牌的车,就不认同领克,只是领克做得不够宽,没有给客户提供想要的品类。我们想要做更宽的事情,满足客户的需求。我们可以保留领克 03 和 06,把 07 和 08 做得更大,还可以去做领克 10 EM-P,900 这些车。

甚至我们还会响应客户的一些呼吁,比如领克要不要做旅行车?

后面我们经营条件好了的时候,是不是可以响应大家,做两座跑车,做两座敞篷?

▲领克 03+

客户的声音我们都听得见,有的时候我们甚至没那么考虑商业逻辑的问题。就像我们做领克 03+ 的时候,当时我们做调研,大众高尔夫 GTI 在中国卖了 10 年,最高一年卖 2200 台车,平均也就 1000 多台,按照这个逻辑,我们根本不该做领克 03+,商业上完全不可能成功。

但用户很想要。

所以集团领导只问了我一个问题,刚开始问能不能这车生命周期卖 10000 台,后来快上市了,问我能不能卖 5000 台,少亏点也认了,因为客户呼声确实太强烈了,我们参加了 TCR 赛事,用户感觉很哇塞,但我们不出个性能车卖给用户,确实又不太对。

结果呢,03+ 第一年就卖了 5000 多辆,第二年卖了 6000 多辆,到现在总共卖了 30000 多辆,远远超出我们的预期。

哇,我觉得这真是一个非常好的商业循环,买 03+ 的人 100% 看过 TCR 比赛,都是带着热爱的,我们回应了这种热爱,没有他们的热爱,没有他们买单,中国不可能有性能车品牌做出来。

▲领克 900

Q:从领克 08 开始,领克就开始聊自己的品牌从「年龄年轻」到「心态年轻」,前不久领克交付了第 150 万辆车,用时 9 年,一定程度上领克的受众也成长成熟了,所以领克 900 的出现,与领克品牌以及领克受众的成长,有逻辑关系吗?

A:就是做更大范围的人群,然后去闯更广阔的市场。

大六座今年正好又是个风口嘛,那领克为什么不去做呢?应该做。

做车有两种逻辑,一种是你看市场上的车,我去对标;还有一种是我去看用户,弄清楚用户到底为什么买一辆车。领克 900 是第二种逻辑,做领克 900 之前,我们做了快 30 场的用户调研和共创。

比如有个调研客户,平时开宝马 X5,周末照顾家庭要开个新势力的大六座,后排舒服了,司机不舒服啊。那我们能不能让他平时开 X5,周末开领克 900 的时候仍然给他 X5 一样的操控感?这就是领克 900 的造车逻辑,我们在突破一些中国车原来没有实现的场景。

旋转座椅,天地门,包括电动拖车钩这些,大六座 SUV 上没有中国人做,现在你看,买领克 900 的用户说这是「户外三件套」。

比如说天地门这个产品的洞察,就是来自于友商,因为友商一款大六座的后备箱,向外带点坡度,这样有两个问题,一是地库后面是墙的话,打不开后门,二是如果后备箱有西瓜这样的圆东西会滚下来。

怎么解决这个问题?天地门完美解决,首先门的开度很小,底下的地门可以不开,两个问题都搞定了。

手动天地门很好做,但体验又不够好,我们就觉得必须干出一个电动天地门,这个难度就完全是地狱级的,我们花了差不多两年的时间才做好。

▲领克 900 旋转座椅对坐模式

「领克 900 的成功,是一次卧薪尝胆」

Q:领克之前并不是一家擅长做大车的品牌,之前最大的 09 轴距也是在 3 米以下,这次做领克 900 为什么一下子就越级到轴距 3160mm 全尺寸 SUV 了?

A:做领克 900 的团队,就是之前做领克 09 的团队,他们太憋屈了。

因为领克 09 本来要对标的是传统中大型 SUV 燃油车型,比如汉兰达,结果市场上出现了新的品类,冰箱彩电大沙发,在消费者看得见的地方配置拉满,产品思维完全不一样。

我们回家或者出差,都希望住的房间大一点,买大车也是一样,第一需求就是大空间,领克 09 当时的问题是内部乘坐空间有点小。

▲领克 900 内部空间

这次 900 的团队干的最直接的工作,就是 1 毫米 1 毫米地去抠内部尺寸,因为外部尺寸已经锁死了,考虑停车位的话,5 米 2 长,近 2 米宽这些都是限定的。领克 900 的 88% 得房率就是基于 SPA Evo 架构的打造,这里用料尺寸收一点,那里的电机能不能往下再放一放,油箱可不可以做成扁的等等等抠出来的。

所以领克 900 要解决的客户第一诉求就是空间,不仅整体车内空间大,行业比较难的第三排空间也做到了同级最大,并且有平地板、长滑轨,空间更灵活舒适。

Q:2025 年是全尺寸 SUV 车型井喷的一年,原来的蓝海瞬间变成了红海市场,领克 900 目前的销量还不错,为什么领克可以在这个最考验产品力的类目第一次尝试就获得了市场的认可?

A:之前很多领克 09 的用户,后来买了理想,我们就去聊,知道他们要什么?我们也去看市场上的车,市场是老师,用户是老师,友商也是老师,我们好好学就行,只要虚心,没有学不会。

所以市场打开之后,我们发现产品上精耕细作的空间,比如冰箱彩电大沙发这些,我们的冰箱比竞品的再大一升,竞品用电子制冷,只能到 0 度,我们就要压缩机制冷,做到零下 6 度。别人彩电是单屏幕 17 英寸,我们直接大连屏 30 英寸,两个人同时有用屏幕的需求,我们就做分屏,分屏完了会不会相互吵?那我们再做头枕扬声器。

都是一步一步推导出来的,全部基于场景,全部基于客户。

领克 900 确确实实把我们之前落下的课都补上了,而且领克用户有个特点,就是追求好的东西,而不是追求便宜,所以我们卖的大多是高配。领克 900 有些人说这个车不像领克,但是从购买车型的比例看,这个倒金字塔的形状,就说明买它的就是典型的领克用户。

Q:领克是有着强烈个性和年轻标签的品牌,但领克 900 作为全尺寸 SUV,其实定位偏豪华和家庭,内部怎么去平衡这种强烈个性,与家庭包容的冲突?

A:我可以给占领克购车用户大头的男性用户画一个典型用户画像,就叫「酷爸」。

什么是酷爸呢,就是和孩子一起成长,陪着孩子一起去探索世界,去学习,他自己也在成长。之前我看我们的一个媒体车友,就是带着他的孩子去参加斯巴达勇士赛,非常野,非常酷的一个运动。

所以说我觉得领克的客户主体是这样的,很多成年人慢慢就没有好奇心了,领克用户仍然对各种东西充满好奇心的,愿意去看,愿意去听,愿意去尝试。领克也是一样,领克始终对世界充满好奇,是始终会跟我们的用户一起去探索。

领克 900 的用户其实还是很典型的领克用户,过去他们年轻态、有个性,只是这批人现在更多扛起了家庭的责任,扛起了社会的责任,但是他的内心其实没有变化。

Q:领克在基因上和布局上都很全球化,之前的领克 Z20 是先海外上市后国内上市,领克 900 作为旗舰车型,会作为全球市场,尤其是欧洲市场的高端突破车型吗?

A:欧洲人其实不太喜欢大车。领克 08 这种对于欧洲人来说已经很大了,他们其实喜欢领克 01,Z20 这样的这种级别的车。

欧洲市场的话,我们正在进行快速调整,梳理整个网络,然后做多品牌联动,比如在欧洲尝试领克和极氪一店两面,在国内的四五线地区,也做这样的一店多面设计,甚至是领克、极氪和吉利一起,这样来满足渠道开发的需求,还有运营成本的降低。

Q:领克 900 也是国内第一款用上英伟达 Thor 芯片的车型,在此之前,领克有城区辅助驾驶的车型并不多,为什么领克 900 会这么激进抢 Thor 的首发?除了 Thor 芯片,还有用于豪华大型车的 SPA-Evo 架构技术,这些技术会下放到一些主销车型上吗?

A:领克的基因里头就有科技,比如说 08 为什么 23 年的时候能卖好?有一个重要的原因是突破了手车互联。

在当时整个市场上,大家都刚刚去触碰这个领域的时候,它做出来了一个非常好的手车互联体验,在当时绝对是 Number One 的体验。

如果说 08 的成功是因为互联,那么今天要成功,必要的条件一定是智能,辅助驾驶。先不说软件,我们是不是应该先把硬件给推上去?

所以我们去年年底就定了,直接上英伟达最新、算力最高的 Thor 芯片,抢中国首发,抢中国首销。

领克有句话是说「要么第一,要么唯一」,所以我们能做第一,就要做第一。

SPA -Evo 架构未来肯定还会做其他的大 SUV,因为已经证明这个架构可以做出很好很成功的产品,既然在这里有突破,那肯定要继续深耕和复用,理想的经验我们也可以去学习。至于会不会做更大的轿车,这个还要继续看,比如说今年领克 10 EM-P 火了,那后面顺势做更大的轿车也很有可能。

Q:冰箱彩电大沙发的产品理念和如今的高端新能源车型深度绑定,领克 900 在冰箱彩电大沙发的重视程度甚至比一些新势力品牌还高,为什么在这个层面,领克的表现比新势力还新势力?

A:我觉得一句话就概括了,就是客户要什么我们就造什么。即使是冰箱彩电大沙发,领克 900 也做出了更贴合用户需求的创新,不是简单的堆家具,包括电视可分屏、沙发可旋转、冰箱知冷暖,这些都充分更好的满足了全家人的用户车需求。

Q:聊了很多领克 900 在领克内部非常新非常不一样的地方,那么它有没有一些依旧很领克,带着领克基因的地方?

A:操控,这就是我的基因,大车依旧要做到好开。

还有就是安全,我要保证所有人的安全,所以领克 900 的时候,我们就提出一个观点,第三排能不能像第一排第二排一样安全,为了证明这个,我们就做了时速 100 公里的后撞测试,国标是 50 公里时速,美国是 80 公里。

▲领克 900 车身结构

我们还做了时速 100 公里的双碰,后撞之后再调转 90 度,继续撞尾部,保证两次撞击之后第三排的两个人还是安全的。这是因为高速上很可能有这样的场景,被撞打转之后有二次碰撞,所以说,安全永远没有上限,但是领克有底线,而且是行业最高的底线。

当然我们也发现一个问题,我们之前太过于强调被动安全,这是传统车企的思维方式,现在新势力讲故事是主动安全,不撞更安全。这块我们也追得很快,AEB 别人做 120 公里时速的,我们做 130,G-AES 紧急避让别人避一次,我们可以连续避让两次。包括为什么领克这批新车全上了激光雷达,就是为了在雨雾天,强逆光下有好的感知,冗余越多越好。

未来可能还有更多的新技术放到车上,比如红外成像,再夸张一点,相控阵雷达等等,咱们工业克苏鲁嘛,很多东西很快都能普及到普通人能用到的地步。

▲领克 10 EM-P

「一个只会山寨的品牌,不适合走到全球去」

Q:虽然国产新能源在品牌、产品和市占率上进步很快,但是设计同质化,中庸化,甚至抄袭借鉴的例子也不少,这一块领克倒是没被指责,领克为什么如此坚持原创设计?

A:从小的视角来看,是因为我们的客户不想跟别人一样,他们想做不同,这是我们客户非常强烈的诉求。如果领克的车做成和其他新势力一样,那一定不是领克用户喜欢的。

当然有的品牌通过模仿市面上的经典造型,通过供应链把价格打下来,他们的用户也没什么意见,但是这条路不适合领克。

我们一开始就是原创,因为我们要走向全球,一个只会山寨的品牌,不适合走到全球去。

领克的原创也不止于外观,包括最近领克不光自研音响,还要自研声音,做有知识产权的声音,不仅仅是音乐啊,扬声器的声音,还有车上的各种提示音,比如转向,锁门警告,锁车,开锁音等等,就是说你坐上任何一款领克的车,不需要睁眼睛,一听就知道,这就是领克。

除了视觉和听觉,嗅觉啊香氛我们也会做,整体感官上都要做原创,领克品牌要有非常强的认知度标准和品牌印记。

▲领克 CCC 概念车

Q:现在新能源汽车发展的中心在中国,所以很多合资车企开始放权中国本地团队,由本地团队完全主导研发,现在领克还是中欧两地团队吗?欧洲团队能够给予领克车型什么样不可取代的特质?

A:我们欧洲团队给我们提供最多的是设计和调性上的支持,就是我刚才说的原创设计。

领克在欧洲的设计团队,工作逻辑就很开放,走在设计潮流的前端。还有就是对品牌调性的整体把握,比如这次我们做的 Lynk Sound,就是欧洲团队和这边一起打造的,他们来提供配乐编曲录制的工作,来看到底哪些声音上车,怎么上车,以及还有一些视觉上的规范等等。

技术上的话,电池电机电控,还有智能化,新能源技术的中心肯定是在中国。

可以这么说,欧洲团队赋予了领克艺术性,国内团队更多是赋予领克技术性。

Q:在成本和经济性上,吉利的 EM-i 技术更具优势,吉利银河品牌的增长很大程度上依靠 EM-i 车型获得了爆发,领克会考虑推出 EM-i 车型吗,还是坚持一定的性能和驾控乐趣?

A:这个要看领克未来的产品是往经济性方向去,还是往我们认为的最好的体验方向去。

领克用户和其他品牌不一样,对美,一点点小调性是有追求的一群人,打个不那么恰当的比方,有时候你看领克的车主,就像很会追女孩子的,很会想一些小情调,不一定要消费多贵,但会追求调性。比如出去玩一下,是住连锁经济型酒店,还是一开窗户就能看到雪山的民宿?领克车主我觉得会选后者。

Q:领克这两年也有纯电车型问世,不过现在来看,似乎大家不再认为混动尤其是增程是过渡形式,而是会长期存在的动力和能源形式,大电池小油箱成为一种共识。那么,领克对于未来汽车能源形式的思考是什么样的?

A:中国如此之大,人口如此之多,在这个前提下,人们用车需求是多样性的,刚好我们聊的也是多样性公司。

为什么品牌们纷纷去做混动呢,是因为他们要解决一个问题,就是原来只开油车的人,不太能接受一步调到纯电。这些人很难改变原来的使用习惯,去到处找充电桩,要始终想着续航里程等等。

还有一个情况,中国有 75% 的有车家庭,是单车,一辆车覆盖所有场景,他们换纯电也是有阻碍的。

中国未来的汽车市场格局,很可能就是油、混和电,各占 1/3,油可能比例小一点,退到 30% 左右,谁也很难彻底把谁替代掉。

这个思考也反过来说,领克车型为什么这么广的原因,因为每个市场都很大,都很重要,用户需求也很强烈,所以领克都要做。

但领克主攻的是混动,因为燃油吉利内部有中国星系列,纯电有极氪。

领克可以这么说,是一个以混动为核心,目标是中国第一混动的品牌。

混动其实也有很多路线,比如领克 900,后面极氪的 9X,做大电池小油箱,以电为主,以油为辅;现在的 EM-P 其实是油电平衡,以后我们可以不可以做以油为主,以电为辅的?现在很多性能车,其实也是混动,保时捷法拉利发动机都是 V6 V8,但都在加电机来提高功率。那么像领克 03 这样性能向的车,是不是可以加个电机,零百推到 3 秒多?

Q:领克怎么看辅助驾驶成为必选卖点,但同时大家又重新认识「驾驶乐趣」这件事?二者是矛盾的,还是可以共存的?

A:对于老司机来说,二者绝对是可以共存的。对于新手来说,因为他们不会去激烈驾驶,所以我们说的驾驶乐趣并不一定可以体会到。

驾驶乐趣这个东西,随着自己开车时间慢慢变长,总有一天可以 get 到那个点,那种高速超车,或者这个红绿灯到下个红绿灯之间急加速下的荷尔蒙飙升的快感。其实也是一个人要把自己生活过精彩的一个反映,领克用户是这样的人群,所以领克一定要做驾驶乐趣。

辅助驾驶的话,就是把车回归到工具属性,不是玩具属性。工具属性也有好处,我举个例子,我的自驾游是从北京一站开到西安,再从这里慢慢自驾慢慢玩,头一天的时间我要开 1000 公里,这个时候,不就是人驾和辅助驾驾最完美的结合吗?

中国很大,路况很复杂,用车场景也复杂,这种多样性就说明,人驾和辅助驾驶并存来应付这种多样性是必然选择。

说人驾和辅助驾驶二选一,都是在强调某一种场景,回到领克向宽,要覆盖更多场景的话,那就更应该拥抱辅助驾驶。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对话 Hypershell:人人都能成为「钢铁侠」,是可以触及的未来!丨多样性公司

编者按:

当我们想喝可乐的时候,在极长的时间都只有两个选择:百事可乐和可口可乐。当我们选择手机的时候,有 90%的概率在苹果和华米 OV 等品牌里辗转。当我们买运动服饰的时候,第一时间想到的,大概率是 Nike、Adidas。

 

但世界之所以缤纷多彩,是因为在这些巨头之外,有一些不遵从传统,力求创造不同,注重设计和功能,着眼于明日的公司存在。

 

它们有着非主流的商业模式,设计与产品能提供独特的用户价值,和足够的社交谈资。重点是,它们没有大公司的包袱,敢于不顾一切的进步。它们,是「多样性公司」。

 

多样性,是开放世界的关键。爱范儿相信,只有真正关注和理解多样性公司才能比更多人更早地看见未来。在同名栏目中,爱范儿将以专访的形式,与你一同见证这些多样性公司,如何重塑未来,定义新常态。

本文为「多样性公司」栏目的第 6 篇,我们和 Hypershell 的创始人 Kelvin Sun 和联合创始人 Penn Yu 进行了对谈。

Hypershell【极壳(qiao)】是世界上第一家把机械外骨骼产品从医疗和工业领域带到消费者领域的创业公司,现在每个人都有机会去体验机械外骨骼产品给人类躯体带来的力量和体能提升。这有点像钢铁侠在山洞里造出了 Mark I 装甲一样,人类对于「自身」的想象力可以进一步扩展,更重要的是,这种科幻想象,真的有机会变成未来的现实。

Hypershell 目前一共有 3 款产品在售,分别是基础款 Hypershell Go X,功率更高的 Hypershell Pro X,更轻更耐久,采用了碳纤维和钛合金材质的 Hypershell Carbon X,这些产品可以在登山爬楼,徒步骑行等 10 多个场景提供腿部助力。理论上,拥有 1 马力功率的 Hypershell Pro X 可以提升 40% 的腿部力量,抵消 30 公斤的负重,节省 30% 的体能。

极壳首款产品年初在海外正式上市后,已在全球范围拥有超过 1 万名用户,在快速增长的成绩加持下陆续获得了来自 IDG、红杉等资本的青睐,已累计获得数千万美元融资。

Hypershell 也在积极开拓中国市场,八月将在国内前沿潮品渠道 DrivePro 开启体验与销售。

▲ Hypershell 团队

「我的生命没有一分钟被浪费,都在为 Hypershell 做准备」

Q: 为什么给公司取名叫 Hypershell?有什么特别的意义?

A:很大程度上是受一些文化作品的影响,对我们影响最深刻的就是《攻壳机动队》,Ghost in Shell,在这个动漫里 Shell 其实有蛮特殊的含义,指的是灵魂的容器,就是人除了自己的自由意志之外都是 Shell。

这个就跟我们做的事情强相关,我们想要最新的机器人技术和 AI 技术赋能人本身,增强人的自由意志。所以 Hypershell 其实也是指更好的 Shell,更好的人类自由意志的容器。

第二层意思来说,我们做的事情跟户外也是强相关,可以说我们的产品也是一种新的户外装备,过去户外装备有软壳 Soft Shell,硬壳 Hard Shell,Hypershell 也会是一种新的户外装备形态。

我们觉得 Hypershell 很能代表外骨骼这个品类,我们和用户测试了很多名字,比如 Exoskeleton,比如 Power Suit,最后大家普遍觉得 Hypershell 很有代表性,就像吉普车就是吉普车,不用叫四轮越野车一样。

Q: Hypershell 创始人 Kelvin Sun 之前创业的领域是在开发板领域,还有一些机器人项目,为什么这次创业选择了机械外骨骼赛道,毕竟这是一个非常新兴且未被验证的赛道。科技领域创业,你认为是应该更多基于趋势判断,还是源于某种使命感或个人直觉?

A:之前我做开发板其实也是一种机器人的控制器,做的一些机器人产品也是各种机械臂,然后还有 3D 打印以及机器人移动底盘的创业项目,它们都是非常典型的跨学科机电产品。

要说为什么选择外骨骼这个赛道,最真实的答案一定是基于我自己的愿景,我想要实现的东西,和当下趋势之间的双向奔赴,只有这样,事情才有机会做成。

每一代人创业的方向一定是很大程度上受他们小时候的各种因素和看过的文化作品的影响,我非常理解马斯克想让人类上火星,是因为他小时候看的都是《银河系漫游指南》之类的。我们这代人小时候看的都是高达,EVA,当时你会发现这些东西非常酷,但因为太科幻而很难成为现实。现在我会觉得这些东西极尽自己所能,能一点点地拉进现实世界里,这就是非常有意义的方向。

我初中做的第一个 DIY 项目,是一个肌电传感器,现在看,做外骨骼最难的地方在于人,怎么去理解人的运动意图,肌电信号恰好是个有效途径。

到了现在这个时间点,我会发现过往所有的精力其实都是在为此刻而存在。

外骨骼是一个包含机器人,人工智能,还有人机工程学的复杂领域,我觉得过去做的大量的各个方向的工作,都是在为这样一个目标做筹备。

回过头看,我的时间没有一分钟被浪费,这是一种很活得很真实的感觉。

▲ Hypershell 早期设计草图

Q: Hypershell 众筹的成绩非常不错,首月 2638 名支持者,123 万美元众筹金额,对于你们来说,众筹的作用是不是验证这款产品在消费级市场的潜力?

A:拿到第一笔融资过了半年,23 年年初的时候,我们第一版全功能的原型机出来了,等于是我们已经验证了这个产品的可行性,从脑子里的虚拟物件变成了实际的产品,还能给很多人去体验,大家都觉得功能上超出了预期。

当然我觉得原型机距离真正能够量产的产品差距还非常大,缺了很多工程细化和可靠性的优化,以及各种 corner case(边角案例)的推敲。

我们定义了消费级的外骨骼能够有最大 1 马力的功率,在很多场景够用了,然后续航还很长,接近 20 公里,同时它真实地融入 AI 能力,能够自适应多种多样的地形。

更重要的是,我们把这些能力打包起来,还有一个很亲民的价格,几百美元,相比于传统工业级外骨骼价格有数量级的降低。

当时对内来说是验证了概念的可行性,但我觉得一定要去验证这个品类的需求。很多做这种创新类消费硬件的公司,往往死在了闭门造车,拿着锤子找钉子,我们过去的创业经历也犯了大量这种错误。

众筹对我们的价值其实是进一步的 PMF(Product Market Fit)验证,是产品和市场需求之间匹配度的验证。

Q: 对于 Hypershell 这样在新兴领域的初创公司,目前公司面临的最大挑战是什么?

A:外骨骼是一个很需要技术创新和产品创新的赛道,这个品类的迭代一定不是依靠内卷和高压去实现的,而是要尊重时间,需要团队花时间沉下心,去思考,去理解,去不断摸索。

这种时间和过程的不可压缩性,和我自己的紧迫感是有矛盾的。

做外骨骼肯定是个长期的事情,需要未来几十年去努力和迭代,但整个硬件行业的竞争又非常激烈,节奏非常快。

甚至我们还没法依靠堆人力来解决问题,因为行业里不存在现成的外骨骼方向人才,我们筛选到合适的人也需要很长的培养周期,才会对外骨骼有系统性的理解。

另外我们也是在跟物理规则做对抗,相比于软件开发,Hypershell 的产品跟人有强相关和接触性,既要极致轻量化,又要极致高强度,这里面需要权衡和选择很多东西,外骨骼不仅前沿,链条又很长,需要从实验室环境牵引到产品化,中间还要在链路上的关键技术点做突破。

我们研发团队的构成,一半偏学术型,一半偏产品化,我们跑在靠前位置就是需要做大量实验室阶段的工作。

Q: 目前做机械外骨骼产品的初创企业有好几家,产品形态看上去也比较接近,Hypershell 的差异性和竞争力在哪里?

A:Hypershell 第一代产品上线之后,算是证明了这个品类的潜力,还有用户的需求。所以确实也能看到最近一年不断有类似形态的产品出来,不过我觉得做一个长得像的产品并不难,因为这个东西的复杂度看上去好像也没那么高,无非就是两个电机,中间几个杆子连起来,加一些布带子绑起来。

无人机在物理形态上也贼简单,4 根树枝绑 4 个电机也能飞,但是看着接近和真实好用的产品之间的差异非常大。

外骨骼需要在人体工程学,可穿戴设计,机器人,到动力系统和 AI 算法上都研究得很深入,还要抠得很细,最终体验上才比较好。

我们的优势就是除了做了很多前沿性的探索之外,在做外骨骼这件事上足够认真,以及抠得足够细。

竞品确实很容易抄一个形态,但是对于这个形态的底层逻辑很难有具象化的概念,当他们在每一个环节都做得差一点的时候,最终叠加出来的整体体验肯定是比较糟糕的。

比方说,十几年前花 1000 块就能买一个扫地机器人了,但是当时扫地机器人的策略是随机乱撞,回家还要找机器人随机到家里哪里去了,这种产品在我妈的印象里就很傻很垃圾,这个观念在她脑袋里存在了十几年。最近换了自动上下水,带激光雷达和 AI 规划算法的扫地机器人,她才觉得扫地机器人现在很聪明很方便了。

所以对于外骨骼这个品类来说,一定不能让一代人因为一两款垃圾产品就觉得这个品类不行。

实际上我们众筹真实交付的产品也不是众筹展示的那个版本,我们把众筹那一代砍掉了,重新做了第二代发货,因为我们觉得第一代的构型存在很多瑕疵。我们甚至觉得如果这一代产品发给用户,那消费级外骨骼行业就凉了,这代人可能都对这个品类有不好的印象。

「AI 是 Hypershell 产品最核心的两个能力之一」

Q: 一些外骨骼公司从工业或康复市场切入,更偏 B 端,而你们选择了面向日常用户,聚焦户外助力,为什么会有这样的决策?

A:我觉得这不是一个很难的决策。

就是如果你真的选择一个出发点是基于愿景和使命感的创业项目,这就是一个自然而然的决策,最终都是 people mission fit (人和愿景匹配)的问题。

你让我去做医疗或者工业领域的外骨骼,我觉得我也做不好。

我自己就是一个户外爱好者,我喜欢徒步,生态游,自驾,我很能理解这些场景下用户需求和用户痛点是什么,我也很想去打造极致的产品,让我自己也很享受使用这个产品的过程。

这就是我做这个品类的基础,我能同理心用户。

Q: 对于目前的机械外骨骼市场来说,绕不过的就是体积重量和功率之间的矛盾,为什么 Hypershell 的初代几款产品,选择了 2KG 左右,32 N·m 扭矩,800W 峰值功率,1 马力的尺寸?为什么不做得更重更强?或者说 Hypershell 内部是把 1 马力作为目标,然后尽可能极限地做小做轻?

A:其实这个 1 马力是反向虚标,它真实的功率其实是 1.1 马力左右,800 多瓦。

因为我们我觉得用户很难具象化理解多少瓦是什么概念,但是马力很好理解,就是一匹马的力量,人显然没有马的劲儿大,我们调研发现 1 马力用户很好理解。

选择这个性能很大程度是在这在这种构型下,800 多瓦的功能不单能应对日常出行场景,同时还能在一些跑步冲刺,还有极限登山场景也能有很好的助力,是一个非常够用的性能指标。

800 瓦就是我们算出来合理够用的功率范围,1 马力是更好的用户沟通选择。

然后 800 瓦会决定大概的扭矩是多少,扭矩会决定产品结构的刚性和可靠性,然后再去决定用什么材料,要不要上碳纤维或者钛合金,怎么去设计产品的疲劳寿命。

其实就是这样的推导过程,确实就是先把目标定好再来想办法实现,但这个目标也是来自于我们的理论推导,对场景的理解还有实际的测试。

Q: 作为一款「助力」设备,Hypershell 的机械外骨骼产品,AI 对于人类动作意图的理解和预判,是否和本身的机械能力一样重要?

A:Hypershell 产品里一个「小脑」叫 MotionEngine ,融合很多种不同的传感器,还有不错的算力。

为什么有这个东西呢,是因为我理解阻挡外骨骼产品走向更泛化更多样的场景的,不光是硬件性能,或者价格很贵,很大程度上是因为 AI 能力不够。

从实验室角度来看,两个人身材接近,但脚的码数不同,走路步态也会完全不一样,这种情况下什么样的助力方式是有效的?结果其实是千人千面,这个策略对我有效,但是对你就完全没有效果。

另外不同的场景和运动形式,走路,上小坡,爬楼梯,走碎石路,登雪山,或者力量训练,或者骑自行车,用户需要的助力方式也完全不一样。

在用户千人千面,场景纷繁复杂的情况,让 Hypershell 的产品能够无缝地去自适应切换,其实是 MotionEngine 要解决的问题。

我们的机器上只有一个按键,就是开关机,我们的理念是你除了开关机之外,整个设备在使用过程中都不需要任何的按键操作,而是通过 MotionEngine 帮你做了识别,然后帮你做预测、调整和适应。

这是让外骨骼走向现实生活,应对复杂的非结构性场景的必由之路。

行业里最主要的一个难点就是对于人的意图识别,就像我刚才说的,刚好我在初中的时候就开始做肌电传感器了。

所以我的理解是,MotionEngine 背后的 AI 能力,是 Hypershell 产品核心的两个能力之一。

Q:机械外骨骼这个名字形容 Hypershell 的产品恰当吗?你们希望用户把 Hypershell 看作一款什么样的产品?是运动辅助器?是下一代可穿戴?还是未来的人体增强工具?

A:这个问题我们最近也在不断地去探讨和思考,就今天来看,Hypershell 的产品在不同场景有不同的作用,比如在自行车场景下能让所有自行车变成 E-Bike,徒步场景呢,又是 E-Hike,工作场景里,比如要爬好多楼梯的巡逻巡检也会更轻松。

坦白讲,我们对 Hypershell 产品定义的认知仍然在一个迭代的过程中,我们认知它是一个比较 multipurpose 多用途的东西,我们不希望它这个场景或者用户群被限缩,还是希望去保持它的这种延展性和多样性。

不过更抽象地讲,我会说 Hypershell 的产品是一种物理层面的增强现实。

这是我前段时间才有的理解,它是人和物理世界中间连接的一层「介质」,它可输出、可编程、可数字化,可以去提升人的能力,对吧?

也可以去模拟一些体验,让你感觉好像在月球走路,或者让你在感觉在更重的环境走路,比如泳池里面,然或者让你模拟碰到了什么墙,踢到了什么东西。

我觉得人的很多能力和体验其实都可以在这层介质的基础上去重新思考。

Q: 目前 Hypershell 产品主要还是腿部助力,未来会不会有手部助力产品的规划,应对搬运等场景?

A:我觉一家公司的产品拓展方向必须具备两个维度的考量,第一是你的底层的技术能力模块是否能够很好的重叠和复用,第二是用户群是不是同一波用户群。

最完美的拓展方式应该是两个都符合,就是同一种技术路径,然后同一种人群可能存在着不同需求,那这是一个很好的品类拓展路径。

对我们来说,搬运这些场景,我们觉得是一个很刚需很现实的需求,但和我们当下用户人群的重合度很低,加上上肢的外骨骼其实更难做,上肢的动作维度更多更高,很难被标准化,属于很难做一个产品匹配不同场景的领域,这里更适合做高度定制化的产品。

Q:从目前的产品情况来看,是否可以接入一些智能手表等可穿戴设备,根据当前的心率水平,血氧含量等身体数据动态调整 Hypershell 产品的输出功率?

A:这是一个非常好的 idea,Hypershell 产品其实具备基础的这种能力,根据你的动作,还有当下的能耗水平,实时地去调整助力的策略和功率。

这也是为什么它能实现单键操作,用户只需要开关机就行。

刚才你说的这个方向,我们也在做一些准备,最近的探索就是 Apple Watch 端的 app 很快就会上架,和可穿戴设备结合确实是我们关注的方向,通过 Apple Watch 检测身体状态之外,手表也是一个更适合我们产品的人机交互界面,比如户外场景下,抬手就能看到自己和设备的状态。

「成为钢铁侠,是可以想象可以触及的未来」

Q: 已经有马拉松选手穿戴你们的产品参加了马拉松赛事,提升了他的最好成绩,马拉松属于重在参与的运动,不过事实也是 Hypershell 因为便携性轻量化加上助力特性,一定程度上能提升运动表现,你如何看待外骨骼技术在提高个体能力的同时,可能带来的效率悬殊以及公平性的问题?尤其在劳动或竞技场景中。

A:首先我觉得这是一种 trick,一定算是作弊。

当然那个用户的成绩属于可讨论的范畴,他没有影响奖金和名次,更多是提升自我成绩。

对于我们来说,他也是通过这种参加马拉松的方式去测试 Hypershell 产品的有效性,一个运动员在剧烈的,竞争态势的竞赛环境里长时间跑步,能够看到这款产品真实的有效性如何。也不光是为了省力,也能帮助运动员挑战自己的极限。

从运动本身长期来看,外骨骼产品肯定会被禁掉,今天它还处于大家没留意的地步。但是外骨骼产品也可能会催生新的比赛种类,就像之前北京举办的机器人马拉松比赛一样,说不定未来也有外骨骼铁人三项,大家在竞技场里公平竞争,反而也会引导行业,还有人类去突破极限,就像现在的 F1 比赛一样。

Q:人与机器的距离越来越近了,我们好像正处在一个人机融合得微妙临界点,你怎么看待「赛博格」这个概念逐渐成为现实,尤其在人机协作与身体延展的语境下?

A:大家似乎看到了一些影子,比如说这两年马斯克的脑机接口 Neuralink 项目有些进展,还有我们 Hypershell 这样的产品能做人类物理层面的增强,大家似乎看到了人和机器融合的可能性,但是我觉得真要说「临界点」,还需要大量的基础突破才有可能。

比如说智能义肢的研发,就比外骨骼更难,我和一些研究团队沟通过,他们的研发状态就是开发了很多智能义肢,但整体和人的适配度非常低,很多案例里只有一两个人穿戴的时候有不错效果。

我觉得这是一个缩影,真正可用的连接神经的人机接口我觉得还得 20 年往上,今天来看还是体外的工具型设备更现实,更普适,门槛更低,比如说电机的能量密度,已经是人类肌肉的 100 倍。

Q:手机、耳机、智能手表,包括智能眼镜都在变成日常随身设备,还有新兴的潮流是 360°全景相机,乃至一些 AI 记录设备都具有随身性,机械外骨骼产品有这样的潜力吗?就是人们把它变成一种很酷的电子产品日常使用。

A:今天看当然还差很远。

为了实现这样的目标,也需要很多的底层技术创新,对场景不断的拓展。

之前外骨骼产品仅限于行业级场景,到今天不少人在爬山徒步骑行等等日常场景里用,我觉得已经是行业里挺大的进步了。

可能努力个十几年二十年,一代一代的迭代更新,产品爬坡,场景破圈,最终会在某个节点下形成质变。

质变的节点可能是这样的,它一定是在更泛化的场景里面,并且正面作用越来越大,负面作用越来越小,就像 Vision Pro 一样,现在看它观感非常震撼,但实在太笨重了,如果未来负面作用很小,它不压头,同时卖 1 万块以下,我觉得它就质变了。

外骨骼也是类似,今天它对人的耐力提升只有百分之几十,随着技术不断迭代,质变到能提升 100%,甚至 200% 的体能,然后穿戴起来又很无感,平时都意识不到它的存在,关键时刻才有感知,同时成本也不断降低,价格更便宜的时候,我就觉得行业的机会点到了。

Q:我之前采访了一些不同行业的科技公司创始人,从新能源汽车,到无人机和扫地机器人行业,他们无一例外都把企业的长期愿景放在了「具身智能」上,即强 AI 绑定高自由度的机器人,实现更多场景的无人化。对于 Hypershell 来说,在有人的场景里,人类又该如何适应这样的未来?人类的机械化,是不是一个必然选项?

A:用不同的技术去增强人类本身,一定是人类文明的下一个演进阶段,这趋势我觉得是正确的,只是技术类型有很多,AI 也是一种对人的增强,只是它增强的是人的脑力,人的信息获取能力还有逻辑推导能力。

人类增强这件事是未来 10 年,20 年非常重要的技术方向,我们在做的其实只是其中一个细小的分支。就像我说的,外骨骼其实就是人和物理世界进行交互的介质,可输入,可编程,可数字化,它要实现的就是我们在物理世界的增强现实,来实现人的自由意志。

人的自由意志可以被各种技术综合起来去呈现,去放大,这也是我们公司的长期愿景。

如果更具象一点的话,像钢铁侠那样的装甲和人工智能,在未来是可以想象,也可以触及的。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对话理想辅助驾驶团队:辅助驾驶,如何从「猴子」进化到「人类」

去年这个时候,爱范儿和董车会在理想北京研发中心与理想辅助驾驶团队进行了一场交流,当时理想辅助驾驶的新技术架构「端到端+ VLM 视觉语言模型」即将上车,理想辅助驾驶团队当时的表述是:

「端到端+ VLM 视觉语言模型」背后的理论框架,是自动驾驶的「终极答案」。

随着「端到端+ VLM 视觉语言模型」的技术架构过渡到了 VLA(Vision-Language-Action,视觉语言动作模型),我们离「终极答案」又进了一步。

按照李想和理想辅助驾驶团队的说法,这是理想辅助驾驶能力从「猴子」阶段,进化到「人类」阶段的关键一步。今天同期,我们又来到了理想北京研发中心,继续和理想辅助驾驶团队聊这个领域的新动向。

▲ 理想汽车自动驾驶研发高级副总裁郎咸朋

辅助驾驶里,猴子和人类有什么区别?

去年理想辅助驾驶方案切换到「端到端+ VLM 视觉语言模型」之前,采用的是业界通用的 「感知 Perception — 规划 Planning — 控制 Control」技术架构,这个架构依赖工程师根据现实各种各样的交通情况来编写对应的规则指导汽车的控制,但难以穷尽现实所有交通情况。

这是辅助驾驶的「机械时期」,辅助驾驶只会应付有对应规则的情况,没有思考和学习的能力。

「端到端+ VLM 视觉语言模型」是辅助驾驶的「猴子时期」,相比于机械,猴子要更聪明,也有一些模仿和学习的能力,当然,猴子也更好动更不听话。

「端到端+ VLM 视觉语言模型」的本质就是「模仿学习」,依赖大量人类驾驶数据进行训练,数据的数量和质量决定性能。并且因为安全考虑,在这个架构中,负责复杂场景的 VLM 视觉语言模型并不能参与控车,只是提供决策和轨迹。

VLA(Vision-Language-Action,视觉语言动作模型)则是辅助驾驶的「人类时期」,拥有了「能思考、能沟通、能记忆、能自我提升」的能力。

猴子经历了漫长的变化才变成人类,理论上「端到端+ VLM 视觉语言模型」的「模仿学习」也可以在漫长的岁月里学会人类几乎所有的驾驶数据,做到行为上几乎像个人。

但代价就是「时间」。

理想汽车自动驾驶研发高级副总裁郎咸朋说:

我们去年实际的端到端 MPI(平均接管里程),去年 7 月份第一个版本 MPI 大概在十几公里,当时已经觉得挺不错的,因为我们的无图版本迭代了很长时间,综合 MPI(高速+城市)也就 10 公里左右。

 

从 100 万到 200 万 Clips(用于训练端到端辅助驾驶的视频片段),再到 1000 万Clips,随着数据量上升,今年年初,MPI 达到 100 公里,7 个月 MPI 翻了 10 倍,平均一个月翻一点几倍。

 

但是到了 1000 万 Clips 之后,我们发现一个问题,只增长数据量是没有用的,有价值的数据越来越少。这就跟考试一样,不及格的时候,随便学一学分就提升非常快。当考到八九十分了,再往上提 5 分、10 分,是很难的。

 

这时候我们使用了超级对齐,强制让模型输出符合人类要求的结果。另外,我们也筛选了一些数据补充到超级对齐里,让模型能力进一步提升,这样做是有一定效果的,但我们大概从今年 3 月份到 7 月底,花了 5 个月时间,模型性能才提升了 2 倍左右。

这是「端到端+ VLM 视觉语言模型」技术架构在飞速进步后遇到的第一个问题:越往后,有用数据越稀少,模型性能进步的速度也越慢。

而其本质问题也随之暴露出来,郎咸朋说:

本质来看,现在端到端的这套模仿学习并不具备深度的逻辑思考能力,就像猴子开车一样。喂猴子一些香蕉,它可能会按照你的意图做一些行为,但并不知道自己为什么要做这些行为,一敲锣它就过来,一打鼓它就跳舞,但不知道为什么要跳舞。

 

所以说端到端架构不具备深度思考能力,顶多算是一个应激反应,就是给一个输入,模型给一个输出,这背后没有深度逻辑。

这也是为什么要在端到端大模型之外再加一个 VLM 视觉语言模型的缘故,VLM 视觉语言模型具有更强的理解和思考能力,能提供更好的决策。但这个模型一是思考得慢,二是和端到端大模型耦合得不够深,很多时候端到端大模型理解和接受不了 VLM 视觉语言模型的决策。

去年这个时候,理想辅助驾驶团队就说过:

以后两个趋势,第一是模型规模变大,系统一和系统二现在还是端到端加 VLM 两个模型,这两个模型有可能合一,目前是比较松耦合,将来可以做比较紧耦合的。第二方面也可以借鉴现在多模态模型的大模型发展趋势,它们就朝这种原生多模态走,既能做语言也能做语音,也能做视觉,也能做激光雷达,这是将来要思考的事情。

趋势很快就变成了现实。

郎咸鹏也说了为什么要从端到端+VLM 切换到 VLA 的原因:

去年做端到端的时候一直也在反思,是不是端到端就够了,如果不够的话我们还需要再做什么。

 

我们一直在做 VLA 的一些预研,其实 VLA 的预研代表的是我们对人工智能的理解并不是一个模仿学习,一定像人类一样是有思维的,是有自己推理能力的,换句话说它一定要去有能力解决它没有见过的事情或未知的场景,因为这个在端到端里可能有一定的泛化能力,但并不是足以说有思维。

 

就像猴子一样,它可能也会做出一些你觉得超越你想象的事情,但它不会总做出来,但人不是,人是可以成长的、可以迭代的,所以我们一定要按照人类的智能发展方式去做我们的人工智能,我们就很快从端到端切换到 了VLA 方案去做。

VLA(Vision-Language-Action,视觉语言动作模型)就是去年的趋势思考,以及当下成为现实的技术架构。

虽然 VLA 和 VLM 就差了一个字母,但内涵差异非常大。

VLA 的 Vision 指各种传感器信息的输入,也包括导航信息,能够让模型对空间有理解和感知。

VLA 的 Language 指模型会把感知到的空间理解,像人一样总结、翻译、压缩、编码成一个语言表达出来。

VLA 的 Action 是模型根据场景的编码语言,生成行为策略,把车开起来。

直观的差异就是,人可以用语言去控车,说话就可以让车慢点快点左转右转,这主要是 Language 部分的功劳,人的指令大模型收到的 prompt,VLA 模型内部的指令也是 prompt,等于是打通了人和车。

此外,视觉和行为之间,也没有阻碍了,从视觉信息输入到控车行为输出的速度和效率都大大加快,VLM 慢,端到端不理解 VLM 的问题被解决了。

更显著的差别是思维链(Chain of Thought,CoT)能力,VLA 模型的推理频率达到了 10Hz,比 VLM 的推理速度快了 3 倍多,同时对环境的感知和理解更充分,可以更快更有理有据地进行思维推理,生成驾驶决策。

除了思维能力和沟通能力之外,VLA 也具备一定的记忆能力,可以记住车主的偏好和习惯;以及相当强的自主学习能力。

▲ 理想 i8 是理想 VLA 技术的首发车型

理想辅助驾驶的《飞驰人生》

现实世界里,人类想要成为老司机,肯定先得去报个驾校考个驾照,然后贴「实习标」蹒跚上路,在真实道路上开几年时间。

此前辅助驾驶的训练也是如此,不光需要真实世界里的行驶数据用作训练,也需要在真实世界里进行大量的路试。

在一些小说里,有些天赋异禀的选手可以通过读书,读成武力境界超高的实战高手,比如《少年歌行》里的「儒剑仙」谢宣,《雪中悍刀行》里的轩辕敬城。

但是在传统武侠小说里,只会有《天龙八部》里王语嫣这样精通武学典籍,自身却是毫无实战能力的战五渣。

▲ 《飞驰人生》剧照

当然,也有介于中间态的情况:在赛车电影《飞驰人生》里,落魄赛车手张弛在脑海里不断复现巴音布鲁克地区的复杂赛道情况,每天在脑海里开 20 遍,5 年模拟开了 36000 多遍,然后回到真实赛道的时候,成为了冠军。

虚拟开车,不断精进,超越自己过去的最好成绩,这是「算法」。

不过张弛回归赛道,再次成为冠军车手之前就已经在这条赛道多次证明过自己,积累了大量的实际驾驶经验。

实车实路,积累经验,直到了解这条赛道所有的路况,这是「数据」。

郎咸朋说,想要做好 VLA 模型,需要四个层面的能力:数据,算法,算力和工程能力。

理想强调自己数据多,数据优秀,数据库好,以及数据标注和数据挖掘准已经很久了,关于数据,理想也有新技能:生成数据训练。

通过世界模型进行场景重建,然后在重建的真实数据之上,举一反三,生成相似场景,比如理想在世界模型里重建一个出高速 ETC 的场景,在这个场景下,不仅可以用原来的真实数据情况,比如白天晴朗地面干燥,也可以生成出白天大雪地面湿滑,夜晚小雨能见度不佳等等场景。

理想训练 VLA 模型算法的更迭也跟生成数据息息相关,郎咸朋介绍说:

2023 年我们还没做端到端,一年用实车的有效测试里程大概 157 万公里,每公里花 18 块钱。

 

我们开始做端到端的时候,就有一部分在做仿真测试了,2024 年全年的仿真测试仿了 500 万公里左右,实车也测了 100 多万公里,平均下来成本降到了 5 块钱一公里不到,差不多也是花了 3000 万左右。但是同样花 3000 万,我能测 600 万公里了。

 

今年半年时间(1 月 1 日-6 月 30 日),我们测了 4000 万公里,实车只有 2 万公里,就跑一些基本的场景。所有的测试,大家看到的超级对齐、现在的 VLA,我们都是用仿真测的,5 毛钱一公里,就是付个电费,付个服务器的费用。并且测试质量还高,所有的 case、所有的场景都能举一反三,可以完全复测,分毫不差。我们的测试里程多了,测试质量好了,研发效率就提升了。

 

所以很多人质疑我们不可能用半年做个 VLA,测都测不过来,实际上我们测试非常多。

仿真测试的优点除了成本低之外,还能完美复现场景,真实场景测试情况下,一个场景很难被 100% 还原,对于 VLA 模型来说,场景复现差之毫厘,驾驶表现可能就失之千里。

以此而言,理想训练 VLA 模型的形式,与电影《飞驰人生》里主角在真实驾驶经验基础上,不断地虚拟训练的模式,有一些类似。

当然,最后 VLA 模型的训练,也需要背后巨大算力的支撑,理想现在的总算力为 13EFLOPS,其中 3EFLOPS 给了推理,10EFLOPS 给了训练。换算成显卡数量,是等效 2 万张英伟达 H20 用作训练,等效 3 万张英伟达 L20 用于推理。

关键 Q&A

Q:智能辅助驾驶存在一个「不可能三角」,也就是效率、舒适和安全三个目标之间是互相制约的,目前阶段可能难以同时实现。理想汽车的 VLA 目前在当前阶段最先优化的指标是哪一个?刚刚提及到 MPI,是否可以理解为目前理想汽车最终的指标是提升安全性以有效减少接管?

郎咸朋:MPI 是我们衡量的指标之一,还有一个指标是 MPA,也就是指发生事故的里程,理想车主的人驾数据是 60 万公里左右出一次事故,而在使用辅助驾驶功能的情况下是 350 到 400 万公里发生一次事故。这个里程数据我们还会持续提升,我们的目标是将 MPA 能提升到人类驾驶的 10 倍,也就是比人驾安全 10 倍,做到 600 万公里才出一次事故,但这必须等到 VLA 模型提升之后才能做到。

针对 MPI,我们也做过分析,可能一些安全风险问题会导致接管,但有时候舒适度不好也会导致接管,比如急刹、重刹等,因为并不一定每次都会遇到安全风险,但是如果驾驶舒适度不好,用户依然不想用辅助驾驶功能。因为 MPA 可以衡量安全性,在 MPI 方面,除了安全性之外,我们重点提升了行车舒适度,如果体验了理想 i8 的辅助驾驶功能,会体验到舒适度比之前的版本有很大提升。

效率是排在安全和舒适之后的,比如走错路,虽然效率有所损失,但我们不会通过一些危险的动作立刻纠正,还是要在安全和舒适的基础上去追求效率。

Q:VLA 模型的难点在哪里?对企业的要求是什么?如果一个企业想要落地VLA模型会面临哪些挑战?

郎咸朋:曾经也有很多人问过如果车企想做 VLA 模型是不是可以跳过前面的规则算法,跳过端到端阶段,我认为是不行的。

虽然 VLA 的数据、算法等可能跟之前不太一样,但是这些仍然是要建立在之前的基础上的,如果没有完整的通过实车采集的数据闭环,是没有数据能够去训练世界模型的。理想汽车之所以能够落地 VLA 模型,是因为我们有 12 亿数据,只有在充分了解这些数据的基础上,才能够更好的生成数据。如果没有这些数据基础,首先不能训练世界模型,其次也不清楚要生成什么样的数据。

同时,基础训练算力和推理算力的支撑需要大量资金和技术能力,如果没有之前的积累是不能完成的。

Q:今年理想实车测试是 2 万公里,请问大幅减少实车测试的依据是什么?

郎咸朋:我们认为实车测试有很多问题,成本是其中一方面,最主要的是我们在测试验证一些场景时不可能完全复现发生问题时的场景。同时,实车测试的效率太低了,在实车测试过程中要开过去之后再复测回来,我们现在的仿真效果完全可以媲美实车测试,现在的超级版本和理想 i8 的 VLA 版本中 90% 以上的测试都是仿真测试。

从去年端到端版本我们就已经开始进行仿真测试的验证,目前我们认为它的可靠性和有效性都很高,所以我们以此替代了实车测试。但仍有一些测试是无法替代的,比如硬件耐久测试,但和性能相关的测试我们基本上会使用仿真测试替代,效果也非常好。

工业时代来临后,刀耕火种的流程被机械化替代;信息时代后,网络替代了大量工作。在自动驾驶时代也是一样,端到端时代来临后,我们进入了使用 AI 技术做自动驾驶的方式,从雇佣大量工程师、算法测试人员,到数据驱动,通过数据流程、数据平台和算法迭代提升自动驾驶能力。而进入了 VLA 大模型时代,测试效率是提升能力的核心因素,如果要快速迭代,一定要把在流程中影响快速迭代的因素迭代掉,如果这其中仍有大量的实车和人工介入,速度是会降低的。并不是我们一定要替代实车测试,而是这项技术,这个方案本身就要求要使用仿真测试,如果不这样做,并不是在做强化学习,并不是在做 VLA 模型。

Q:VLA 其实没有颠覆端到端+VLM,所以是否可以理解成 VLA 是偏向于工程能力的创新?

詹锟(理想汽车自动驾驶高级算法专家):VLA 不只是工程方面的创新,大家如果关注具身智能,会发现这波浪潮伴随着大模型对物理世界的应用,这本质就是提出了一个 VLA 算法,我们的 VLA 模型就是想把具身智能的思想和路径引用在自动驾驶领域。我们是最早提出,也是最早开始实践的。VLA 也是一种端到端,因为端到端的本质是场景输入,轨迹输出,VLA 也是如此,但算法的创新是多了思考。端到端可以理解为 VA,没有 Language,Language 对应的是思考和理解,我们在 VLA 中加入了这一部分,把机器人的范式统一,让自动驾驶也能成为机器人的一类,这是算法创新,不只是工程创新。

对于自动驾驶而言,很大的挑战是必须要有工程创新。因为 VLA 是一个大模型,大模型部署在边缘端算力上是非常具有挑战的。很多团队并不是认为 VLA 不好,而是因为 VLA 部署有困难,把它真正落地是非常具有挑战性的事情,尤其是在边缘端芯片算力不够的情况下是不可能完成的,所以我们是在大算力芯片上才能部署。所以这不仅仅是工程创新,但的确需要工程部署大范围优化才能实现。

Q:VLA 大模型在车端部署的时候是否会有比如模型裁剪或蒸馏版本?如何在推理效率和模型之间做好平衡?

詹锟:在部署时的效率和蒸馏上我们做了非常多平衡。我们的基座模型是自研的 8×0.4B 的 MoE 模型(混合专家模型),这是业界没有的,我们在深入分析英伟达芯片后,发现这个架构非常适合它,推理速度快的同时模型容量大,能够同时容纳不同场景、不同能力的大模型,这是我们在架构上的选择。

另外,我们是大模型蒸馏出来的,我们最早训练了一个 32B 的云端大模型,它容纳了海量的知识和驾驶能力,我们把它做出的思考和推理流程蒸馏到 3.2B 的 MoE 模型上,配合 Vision 和 Action,使用了 Diffusion 技术(扩散模型,可以生成图像、视频、音频,动作轨迹等数据,具体到理想的 VLA 场景,是利用 Diffusion 生成行车轨迹)。

我们用这样的方法做了非常多的优化。从细节上来看,我们也针对 Diffusion 做了工程优化,并不是直接使用标准 Diffusion,而是进行了推理的压缩,可以理解为一种蒸馏。以前 Diffusion 可能要推理 10 步骤,我们使用了 flow matching 流匹配只需要推理 2 步就可以了,这方面的压缩也是导致我们真正能够部署 VLA 的本质原因。

Q:VLA 是一个足够好的解法了吗?它抵达所谓的「GPT 时刻」还需要花多长时间?

詹锟:多模态模型之前说没有达到 GPT 时刻,可能指的是 VLA 这种物理 AI,而不是 VLM,其实现在 VLM 已经完全满足一个非常创新的「GPT 时刻」标准,如果针对物理 AI,现在的 VLA,特别是在机器人领域、具身智能领域可能并没有达到「GPT 时刻」的标准,因为它没有那么好的泛化能力。

但在自动驾驶领域,其实 VLA 解决的是一个相对统一的驾驶范式,是有机会用这个方式做到一个「GPT 时刻」的,我们也非常承认现在的 VLA 是第一版本,也是业界第一个往量产上要推的 VLA 版本,肯定会存在一些缺陷。

这个重大尝试是想说我们想用VLA来探索一个新的路径,它里面有很多尝试的地方,有很多需要去落地的探索的点,不是说不能做到「GPT 时刻」就一定不能去做量产落地,它有很多细节,包括我们的评测、仿真去验证它能不能做到量产落地,能不能给用户「更好、更舒适、更安全」的体验,做到以上三点就可以给用户更好的交付。

「GPT 时刻」更多指的是具有很强的通用性和泛化性,在这个过程可能随着我们自动驾驶往空间机器人或往其它具身领域去拓展的时候会产生出更强的泛化能力或者更综合的统筹能力,我们也会在落地以后随着「用户数据迭代、场景丰富、思维逻辑性越来越多、语音交互越来越多」逐渐往 ChatGPT 时刻迁移。

像郎博(郎咸朋博士)说的,到明年我们如果到了 1000MPI,可能会给用户这种感觉:真的到了一个 VLA 的「GPT 时刻」。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌