Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

讯飞首款 AI 眼镜,用 40 克撬动 AI 工作流

By: 李超凡
28 May 2026 at 17:27

2026 还没过半,已经有 30 多款 AI 眼镜亮相了。

除了华为、阿里千问、Rokid、雷鸟、小米这些老玩家,连老板电器都推出 AI 烹饪眼镜,京东方也做了骑行眼镜……百镜齐放,但大体上在围着三件事卷:谁能做得更轻、谁的摄像头更清晰、谁的镜片上能塞进更大更好的显示屏。

热闹之下,有一个数据通常会被忽略。

目前主流电商平台上,AI 眼镜的退货率高得惊人,普遍在 30% 左右,在冲动消费占大头的直播渠道,退货率甚至能飙到 40% 到 50%

用户因为新鲜感下单,戴了几天,默默点了退货。销量高开低走、退货率居高不下,就是众多 AI 眼镜的「生命周期」。

说白了,尝鲜期过去后,消费者就会开始产生这样的疑惑:戴上之后它到底能帮我干什么。

就在今天,科大讯飞在澳门发布了旗下首款 AI 眼镜。这副 40 克的眼镜没有卷像素、卷全彩大屏、卷时尚联名,把核心能力押注在一个看起来十分常见的能力上——翻译

但翻译只是它的入口,不是终点。

发布会前夕,APPSO 和科大讯飞副总裁王玮、穿戴设备业务部总经理林会杰聊了聊。聊到后半段,话题从具体的产品技术转移到了一个更大的命题上:AI 眼镜下半场的关键,到底在硬件层面还是在 AI 工作流?

AI 眼镜的「奇点」,是让人愿意一直戴

百镜大战之后,在现有供应链里攒出一款智能眼镜真不难,华强北两周就能给你出一个样机。但难的是,你怎么给用户一个「一直佩戴」的理由。

对于第一次做 AI 眼镜的讯飞来说,这也是个绕不开的坎。

王玮跟 APPSO 聊起讯飞做 AI 眼镜的起点,其实源于一个非常具体的画面:你想啊,翻译机在展会、小型商务洽谈这些场景里是很好用的,甚至公司共用一台就够。但总有一些时刻,当你在国外旅游或者某些场合,你不方便掏出设备和低头看屏幕,不想等翻译结果打断说话的自然节奏。

你希望交流是「沉浸式」的,眼神始终对着彼此,对话顺畅流动,翻译像空气一样感受不到存在。这副眼镜的起点,就是用户对那种「无感」体验的期待。

这种「物理中断」,是讯飞看了无数个翻译机用户的真实反馈后,攒下来的痛点。做 AI 眼镜的公司可以一夜之间冒出来,但做翻译的底子,真的没法速成。

讯飞翻译机卖了 100 万台、翻译了 10 亿次。讯飞同传跑了 42 万场国际会议,覆盖 50 多个国家,触达 4 亿观众,连续 8 年服务全国两会。

这些数字沉淀下来的不只是算法,还有对真实场景里那些琐碎问题的感知:什么时候用户会嫌翻译慢,什么场景下手持设备让人尴尬,什么噪音条件会让准确率断崖……

去年 10 月讯飞已经推出了一款翻译耳机。耳机验证了两件事:用户确实需要释放双手的穿戴式翻译;端到端的同传在穿戴设备上是跑得通的,反应速度能掐在 2 秒以内。

但耳机只管耳朵,在林会杰看来,耳机的局限在于它是一个「听觉」设备(现在也开始加摄像头了),眼镜则可以增加视觉的模态,多种模态叠加在一起,跨语言沟通的信息输入就丰富多了。

说白了,眼镜上有摄像头可以拍照翻译,有显示可以投射字幕让你不用低头看手机,还能放更多的麦克风做定向降噪。

用王玮的话说就是,「眼镜离人的眼睛、耳朵、嘴巴最近,它是物理世界与数字世界天然的桥梁,让翻译像呼吸一样自然发生。」

而到了 2026 年,供应链成本开始被拉下来了,国补也首次把智能眼镜纳了进来,再加上星火 X2 大模型云端翻译能力的提升,天时地利凑齐了。

林会杰倒挺坦率:「我们选择这个节点,是因为看到了增速才刚刚开始。」王玮更直接:我们不想用「iPhone 时刻」这个词,但实际上就是这个意思,眼镜马上到了奇点临近的时候。

40 克,一道系统工程题

讯飞这款 AI 眼镜,我戴上之后第一反应是比想象中轻。它集成了微型显示屏、摄像头、5+1 麦克风矩阵、喇叭,但整机重量被死死卡在了 40 克。

这个数字可能很多人没概念,我们来横向对比一下:

  • Meta Ray-Ban 是 49 克,但它没有显示屏;
  • Rokid Glasses 也是 49 克,带显示,但比讯飞重了将近 25%;
  • 华为 AI 眼镜确实轻,35.5 克,但它没有显示屏。

在「带显示屏」的智能眼镜阵营里,讯飞目前几乎做到了行业最轻。

为什么非得是 40 克?林会杰说,这个数字是他们用模拟仿真和海量调研死磕出来的。欧美人的头型和体型对重量的钝感力比较强,Meta 做到 50 多克他们依然觉得能接受。但亚洲人的颅骨结构和鼻梁高度不同,对重量极度敏感。

对于中国用户来说,45 克是一道分水岭,超过这个分量,戴久了就会有明显的压迫感。40 克,是长时间佩戴的「舒适阈值」。

为了抠掉这几克,团队在工程上跟供应链磨了很久。最关键的一招,是用树脂镜片替代了传统的玻璃镜片。

传统近视眼镜早就是树脂的天下了,但为什么智能眼镜一直不用?因为工艺太搞心态了。智能眼镜的镜片需要做「全贴合」,把显示层和镜片压在一起。树脂材料在成型和加热时极易产生微小的气泡,胶水一旦有一丝一毫的空隙,光线的折射曲率就偏了,整个镜片就废了,良率控制比玻璃难得多。

林会杰透露,讯飞应该是行业里第一个在带显示的智能眼镜上把全贴合树脂工艺跑通的。研发过程中经历了非常多尝试和失败,才最终把树脂材料用在了显示镜片上,但回报是巨大的,单靠镜片这一项,就比玻璃方案轻了 30% 到 40%。

再加上定制的 0.15CC 微型光机、微型摄像头模组,镜框镜腿一体成型。芯片选型和算法做了深度耦合:同样的功能别家可能要 100mAh 电池,讯飞可能 50mAh 就够了。

所以最后我们看到的讯飞 AI 眼镜,整机重量更轻,续航却没打折。

这是一道系统工程题,没有捷径,每一环都要跟供应链反复磨合良品率。树脂镜片、微型光机、低功耗芯片、算法-硬件耦合,哪一环掉链子,重量都得回到 50 克以上。

唇动识别降噪,用眼睛帮耳朵听

翻译固然是讯飞的舒适区,但这副眼镜上,讯飞还首发了一个有点科幻的技术——唇动识别降噪,这是多模态降噪系统的核心部分

这是唇动识别降噪首次搭载到 AI 眼镜上,实现逻辑是眼镜的前置摄像头会死死锁定对面说话人的嘴唇。同时,眼镜上的 5 颗气导麦克风和 1 颗骨传导麦克风组成了一个六通道的音频流。

系统实时通过「看到谁的嘴在动」,来辅助判断「该听谁的声音」, 从而在嘈杂的多人混声中,精准地把目标人物的语音「抠」出来。

这就实现了「看谁翻谁」的效果,你的眼镜盯着谁,耳边响起的、镜片上跳出来的,就是谁的翻译字幕。

这个技术直接决定很多场景的翻译质量,因为翻译准不准,有一个重要的前提听得清不清。

安静的会议室里,其实目前的翻译软硬件都可以较好处理交流问题。但讯飞 AI 眼镜重要的一个用户群是商务人士,他们真正需要用到的翻译场景是什么?是展会、商务酒会、机场,环境噪音随便都能 80 到 90 分贝。传统翻译工具在这种环境下,准确率直接掉进马里亚纳海沟。

高噪场景下,唇动识别降噪让识别准确率提升了 50% 以上。林会杰解释说,这并不是单纯看口型,它融合了声源位置增强、目标人锁定等一整套多模态降噪系统,各路信号在实际使用中自动协同。

这个能力也不是拍脑袋想出来的。讯飞在大型会议系统和汽车智能座舱里,搞这种多通道语音分离和多模态降噪已经很多年了,在 CHiME 国际语音分离大赛上拿过 6 连冠。

王玮还给我们分享了一个几年前的内部 Demo:几个研究员同时讲话,人耳完全分不清,系统把每个人的声音干净利落分离出来,谁说了什么都清清楚楚。

这事儿有趣的地方在于,以前开大会,你有足够的物理空间塞麦克风,有服务器的算力,有插座供电。现在,你要把这套复杂的视觉-音频融合算法,塞进一副 40 克、算力和功耗被极度压榨的眼镜里。

王玮觉得,这恰恰是讯飞在硬件上秀出的「肌肉」:怎么把大设备上的硬核算法做高倍率的压缩,移植到小尺寸、轻量化的移动端侧,而且还能离线实时处理多路语音数据

讯飞做硬件的路径是「大设备验证、小设备迁移」。在会议系统和汽车上跑通的算法压缩到眼镜端侧。唇动识别降噪需要视觉-音频配对数据、端侧实时处理能力、多麦克风硬件的联合调优,单靠现成算法集成难以实现。

降噪的准确性直接决定翻译的准确性,这也是整条工作流的第一道关卡。

「全能翻译」背后的基础设施

听得清之后,才是译得准的问题。

讯飞 AI 眼镜支持 122 种语言的实时互译,划分了同声传译(听演讲)、面对面翻译(商务洽谈)、通话翻译(跨国电话)和线上同传(接腾讯会议或 Zoom)等四种模式,摄像头还能直接拍 PPT, 做外文资料翻译。

在现场体验中最让我觉得有意思的是通话翻译

这大概是目前市面上唯一一款能在你打电话时,同时帮你做跨国翻译和记录的眼镜。它的路径是这样的:眼镜通过蓝牙挂载在手机上,捕捉到电话那头的英语,端到端同传模型全自动翻译,再把你的中文回答翻译成英文顶回去,延迟在秒级。

也就是说,你在电话这头说中文,老外在那头听到的是你的音色克隆出来的英文。电话一挂,眼镜甚至能帮你把一份结构化的会议纪要发你。

过去,传统的翻译系统是「老三样」:语音识别(ASR)→文本翻译(MT)→语音合成(TTS)。这套方案最大的毛病就是延迟大,而且每过一个环节,信息的「语义损失」就多一层。

讯飞这次在眼镜上搭载端到端的语音同传大模型,跳过了中间的文本转译步骤,直接实现「语音进、语音出」,把首字响应时间压进了 2 秒。云端撑腰的是星火 X2 模型(293B 参数的 MoE 架构,基于华为昇腾训练)。

林会杰说,他们把翻译场景切分得极其细微,因为不同场景下需要的行业知识库和降噪模式是完全不一样的。

讯飞这款眼镜在翻译功能上花的功夫,这有点像手机行业卷影像,拍照功能谁都有,但我有 2 亿像素,有10 倍长焦,有4K live 图,甚至能覆盖专业摄影场景。

翻译之后,AI 工作流才开始

到了这一步,你会发现,讯飞想做的已经不只是「翻译工具」了。这大概也是为什么它不叫「翻译眼镜」,而被视「眼前的超级 AI 助理」。

林会杰认为,「眼镜更像是一个戴在眼前的超级计算机,带有显示、摄像头、语音能力,它的配置跟手机、PC 基本一样。

承载这层能力的是讯飞的 GlassClaw,这个 Agent 能调用大模型能力、接入生态服务、做多模态理解,把从听懂到干活的整个过程打通,同时也支持 OpenClaw 等第三方 Agent 接入。

你没看错,这还是一副「龙虾」眼镜。

林会杰分享了他自己使用 GlassClaw 的日常工作流:他出门不用频繁掏手机。在路上走着,可以直接用语音唤醒 GlassClaw,让它调取手机通讯录、找客户拨号,电话接通自动开翻译。

跟客户面对面聊天时,突然需要查阅之前的某份合同纪要,直接盲操吩咐眼镜,眼镜会去检索他的电脑资料,提取出要点并同步到镜片上。

甚至开完会后,眼镜自动做完多模态的角色区分(谁说了什么),输出结构化纪要,他直接语音:「把纪要以邮件形式发给项目组,并把下周三的复盘会同步到日历上。」

如果你也养过虾对这些功能肯定不陌生,只不过这次交互发生在你的脸上。

当初让AI 眼镜出圈的提词器功能,在这款眼镜里也迎来升级。

讯飞 AI 眼镜的智能提词器功能做到了语义跟随,说到哪跟到哪,不再是机械按速度滚动,可以做自然的智能语义理解和跟随。配套的充电胶囊可以当遥控器,按键切换和暂停文稿。

这就是 AstronClaw 架构在底层玩的「端-边-云」三级协同:眼镜端侧负责环境感知和预处理,边缘侧做决策,复杂的推理丢给云端的星火 X2。GlassClaw 基于讯飞自研的 Agent 能力,同时也支持 OpenClaw 等第三方 Agent 接入。

王玮的判断是,未来的眼镜不再只是很简单的一副眼镜,而是你穿戴最方便的一个随身助理

市场上单做翻译或单做 AI 助手的产品不少,但把「翻译 + 记录 + 纪要 + 跨端执行」串成顺滑的工作流,需要语音、翻译、大模型、智能体(Agent)四种底层能力同时在线,且环环相扣

讯飞这种全栈的技术能力,恰好在眼镜这个载体上找到了合适的闭环。

AI 眼镜的下半场,拼的是什么

过去两年,AI 浪潮裹挟着整个硬件行业寻找那个所谓的「Next Gen」入口。

AI Pin 翻车了,各种智能吊坠无疾而终,虽然 AI 硬件的产品形态和技术路线各异,但行业也逐渐形成一些共识: AI 需要眼睛,它必须能实时感知人类所处的三维物理世界。

AI 眼镜未必不是最终形态,但它是目前唯一能够全天候、第一视角承载视觉与听觉输入的形态。

王玮在采访里提到一个挺有意思的预判:「未来的数字生活三件套,大概率是电脑、手机和眼镜。眼镜不是手机的配件,它自己就是一台架在鼻梁上的独立主机。」

眼镜天然适合做连接物理世界和数字世界的设备。而且硬件本身还有很长的迭代空间:显示会从单色走向全彩、从 2K 走向 4K;摄像头和麦克风还会向 AI 原生的 token 编码方式升级。王玮说这些技术路径已经开始有比较明晰的发展方向了。

林会杰透露,讯飞的第二代 AI 眼镜已经在规划中,最快 2026 年秋季能看到,面向更多不同人群,也在摸索一些细分的垂直场景。

过去一年 APPSO 测过、写过不少 AI 眼镜。回头看百镜大战,行业其实已经分化出了两条不同的路:

一条是「做最好的眼镜,让 AI 成为加分项」。 Meta Ray-Ban 是这个逻辑:用时尚设计和品牌文化来对冲用户对 AI 能力的低频刚需。

另一条是「做更深的 AI 工作流,让眼镜成为新的电脑」。 讯飞选择的就是这条路。两条路指向不同的竞争维度,但后一条更难走,因为它要求你同时具备硬件工程能力和 AI 全栈能力,缺一不可。

AI 眼镜的下半场,真正的分水岭在于,谁能把 AI 揉进高度细分的真实场景里,替用户把一件件琐碎任务给办了。

让眼镜回归眼镜, AI 老老实实当「牛马」。

最后能留下来的设备,我想大概是这样的:当你摘下它的时候,会突然觉得眼前的世界变得沉重而低效。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

对话云鲸创始人张峻彬:2 年之后,扫地机器人就有「手」干更多活了

By: 刘学文
28 May 2026 at 15:14

在硬件行业,规模很容易被当作一种衡量成功的标准,但它有时也是一种幻觉。

规模是看起来像更大的销量、更高的市场份额、更快的发布节奏,也像一场所有人都必须参加的军备竞赛:更多 SKU、更宽价格带、更密集的营销投放,以及更激烈的渠道争夺。尤其是在清洁电器这个行业,过去几年,扫地机器人、洗地机、吸尘器、除螨仪不断交叉生长,国补、价格战、出海、AI 和具身智能又轮番成为关键词。

另外一家总部位于苏州的清洁电器品牌制造了巨大的声量,深圳本地硬件品牌大疆和影石之间的竞争也有尖锐的摩擦啸叫,相较之下,云鲸,以及云鲸创始人张峻彬在行业的喧嚣期显得相当谨慎和沉默。

十年前,「产品经理」张峻彬需要解决的问题是「如何做出一台好用的扫地机器人」,但现在,造产品的快感不再单纯,他的职责已经从「造一台机器」,变成了「让一家公司成为一台更高效的机器」。

规模很重要,但不能强求

过去两年,国补刺激带来了阶段性的高基数;另一方面,线上红利不再像早期那样明显,线下渠道开始重新回到家电行业的主航道。张峻彬提到,今年1-4月 线上虽然有所下降,但线下增长维稳,云鲸线下增长了 150% 以上。在他看来,随着国补退却,线下业态正在回归,清洁行业的大盘仍然会继续增长:

随着国补退却以后,整个线下业态是在逐步回升的,回升速度比想象快。云鲸线下增长了 150% 以上。所以,整个线下业态回归到家电逻辑。

早期的扫地机器人,更像互联网消费电子产品,线上种草、线上转化、线上爆发,早期的云鲸 J1 就是这样获得爆发的。但当品类逐渐进入更广泛的家庭用户,尤其是进入下沉市场和传统家电消费场景,它也会重新回到家电行业的基本面:渠道、服务、口碑、价格体系、终端体验,以及长期复购。

但这并不意味着企业应该立刻把油门踩到底。

张峻彬对规模的态度很明确,规模不是不要,而是要等组织效率匹配之后再要:

在这个阶段,你的精力可能要聚焦在组织效率提升的事情上。你会发现当效率不高的时候,要砸大钱就得花费精力去盯着,这个精力就特别不划算。

所以他给出的阶段性选择是:

我现在阶段性很简单,就是加速组织体系的效率化改革,在这个过程中肯定是以利润优先,当到达一个阶段以后,我就会以规模优先,是一种战略的阶段性的选择的不同。

这背后其实是非常朴素的商业规律:如果组织本身还在漏水,越大的规模,可能只是越大的浪费。

张峻彬在采访里举了一个具体例子:以前云鲸从前端需求到后端生产,沟通时间很长,经常出现生产完之后,前端不要了的情况。后来补齐这个前后端配合的漏洞后,库存周转率得到明显提升。

消费者并不关心公司经营和治理,只在乎产品本身,但 CEO 如果沉迷产品,对供应链,库存周转,研发效率不投入足够精力,那并不算是合格的 CEO。

在宣传中,这样枯燥的库存周转效率提升几乎没有意义,但是相比于 AI 概念、具身智能概念,这更加接近一家公司真正的经营内核。

过去很多消费硬件公司在扩张时都会遇到类似的问题:产品能打,组织跟不上;渠道铺开了,价格体系乱了;SKU 多了,资源被摊薄;营销声量上去了,但用户心智没有真正建立起来。

张峻彬显然也意识到了这一点。

他提到,2025 年云鲸其实做了更多 SKU,但多 SKU 并没有带来和预期成正比的收益,所以今年反而调整策略:

我们做了很多 SKU,围绕扫地机和洗地机,但是会发现多 SKU 并没有带来预期成正比的收益。所以我们今年就调整了策略,聚焦研发,打磨最好的产品。

规模不是目的地,它更像一面放大镜。组织健康时,它放大优势;组织粗糙时,它也会放大漏洞。

对于品类扩张,他也没有把资金视为核心瓶颈,而是把问题指向「管理者的带宽」:

首先资金肯定不是一个问题。但是你的精力不足以覆盖这件事情的时候,可能就又会跑偏。可能是组织选错了人,还不如别那么快开始。

创业公司容易相信单点突破,相信一款爆品可以改写命运;但到了新的阶段,公司更需要系统能力。这就是很多企业家说的,创始人的上限就是公司的上限。

当产品经理张峻彬足够优秀的时候,就有云鲸的梦幻开局:大学毕业就创业,花了 3 年打磨第一款产品 J1,预期只卖 1 万台,结果卖了几十万台。

但当企业经营者张峻彬自己的管理者带宽没有升级的时候,就需要花费代价来学习规模很重要,但规模不能强求。

张峻彬开始找属于自己的那枚「硬币」

云鲸的变化,首先发生在张峻彬自己身上。

过去外界对他的典型印象,是在于产品打磨能力。这个标签很好理解:云鲸早期的崛起,来自对用户痛点的敏感捕捉,以及对应的产品方案。从自动洗拖布到基站维护,云鲸一直试图把用户不愿意做但又绕不开的家务细节交给机器。

不过新的阶段,张峻彬开始接管一个更复杂的系统。

他在采访中直接说,自己过去一直专注产品和研发,对营销看得很少,直到去年 9、10 月份开始接全球营销,才发现过去对商业增长的理解需要更新:

我之前一直以为产品和营销是加法逻辑,产品 + 营销,就是产品做得特别好,营销稍微少看一点,也还不错。但后面发现产品和营销是乘法逻辑,产品 X 营销,这意味着产品和营销都必须做得足够好,才能真正把公司带到一个新的高度。

很多产品型创始人都会经历类似转变:早期相信好产品会自己说话,后来发现,在一个信息过载、渠道碎片化、竞争高度同质化的市场里,好产品也需要被准确表达、被有效触达。

张峻彬用了一个比喻:找到云鲸自己的「硬币」。

在接管营销之后,他与许多行业人士沟通,有一个营销例子让他记忆深刻:卡萨帝当年在洗衣机上立一个硬币而不倒,来展示直驱电机工作时的平稳和安静。

▲ 10 多年前,卡萨帝洗衣机做的立硬币营销案例

用户也许并不懂底层技术,但看到洗衣机上立着的硬币,就知道这台洗衣机震动极小,颠覆认知地小。

在汽车领域,也有在汽车上摆香槟塔连续过减速带,通过香槟杯不倒,香槟酒不洒来表现底盘素质的优秀。

张峻彬说:

这段时间我带领大家梳理云鲸的产品真正的竞争力是什么,以及找到那个硬币的传播方式,在这个事情上我做得相对多一些。

在他看来,云鲸并不缺产品创新,但相对内敛。很多功能是「人有我优」,但如果讲不清楚,技术优势就很容易被淹没在参数和卖点里。尤其在清洁电器行业,用户购买决策又非常现实和具象:扫得干不干净、拖得干不干净、会不会缠毛、需不需要手动清理、售后麻不麻烦。

技术本身并不直接构成心智,能被用户感知的技术才构成心智。

▲ 云鲸扫地机器人的视觉能力可以帮助识别物体规划路线

张峻彬接手营销,并不意味着云鲸从产品与技术导向转向营销导向,只是创始人意识到,产品力必须经过商业系统的翻译,才会变成真实的市场结果。

这件事此前不是他擅长的:

这些事确实在我能力圈之外,但不代表我不能快速迭代和学习,这是两码事。我以前看营销和销售确实少,去年9、10 月份接了之后,其实是在疯狂地学。10 月份基本上每天干到凌晨三四点,高强度学习、高强度接触业务。

「创始人自我更新」是一种新的叙事方式,一个创始人承认自己原来的能力结构不够用了,于是重新进入一线,重新学习一套新系统,左右脑互博,文理思维碰撞是常见的现象。

在张峻彬看来,营销和技术的差异很明显:

做技术,很多地方是数理化、理工科那套逻辑,有清晰的对错边界。但营销里,第一性原理的东西也很多,不可量化的地方更多。

但他也可以把营销拆成了自己熟悉的逻辑:

搭建清晰的财务系统去监控和调整,是一个数学优化的逻辑,背后是对业务的深刻理解……公司现在产品特别多,不同产品对应的人群卡位、生命周期、资源配置和组织能力都不一样,这本质上就是个数学优化问题。

这仍然是工程师和产品经理的思考方式:面对营销这样看似开放、感性、不确定的系统,他试图先找到里面能被结构化、数据化、模型化的部分。

这也是张峻彬个人成长路径的一部分:

我觉得肯定是我在经历一个成长,从最早是一个工程师,到一个产品经理,再到一个组织的管理者,到跨领域的组织的管理者,到逐步的思考战略。

他说,云鲸早期三到四年打磨第一款产品时,他更多扮演的是产品经理和系统工程师角色,并不认为那时自己已经是一个成熟的管理者,团队从 200 人扩展到 1000 人的时候,他的管理半径没有跟上。

现在云鲸是近 2000 人规模了。

▲ 学生时期的张峻彬就是机器人爱好者

很少谈具身智能,但不代表投入很少

在过去一两年,AI 和具身智能几乎成为一级市场最热的方向,许多还没有被市场验证的项目,也能拿到很高估值。对于扫地机器人公司来说,它们天然可以把自己放进家庭机器人、空间智能、具身智能的叙事里。

不过把营销纳入自己管理范围的张峻彬并没有急着把云鲸包装成一家「具身智能公司」。

当被问到为什么没有明确说自己是一家具身智能公司时,张峻彬说:

没有对外说,不代表没有在做。但是云鲸一直以来都比较低调,我们希望把产品的很多东西做好,我们再去做这件事情。

他进一步解释说:

挂上了具身这个头衔之后,是不是对用户就更有价值?我现在判断好像也不一定会。但不代表我们没有在做具身的产品,这是两码事。一个是宣传端,一个是产品端。产品端的东西我们是非常激进地在做。

这是云鲸对具身智能的态度:宣传端克制,产品端激进。

克制的原因也很现实。对一家已经在用户心中建立「清洁」认知的公司来说,过早把自己推向一个更宏大的 AI 叙事,未必一定是好事。张峻彬担心的是,用户会觉得云鲸不聚焦:

我们确实没有说云鲸是一家具身智能公司。因为我担心给用户产生一种想法,就是云鲸是不是不聚焦了?我们还是希望把产品做好。

但宣传端克制不等于技术和产品端保守。

▲学生时期的张峻彬

事实上,云鲸已经设立了具身事业部。目前公司有三个事业部:手持清洁、扫地机和具身事业部,具身智能事业部的产品量产时间暂时保密,但「肯定不会那么远」,并且「肯定是有整机形态出来的」。

更具体的信息,来自空间清洁方向。

在回应何时「从平面清洁走向空间清洁」的问题时,张峻彬透露:

我们一直有具身的团队在做空间收纳、空间清洁的工作。某种意义上我们对于特定的、立体表面的清洁做得还是比较好的。比如说清洁马桶、立面瓷砖等等。对于很大种类物体的抓取和收纳,现在做得还是很不错的。

这是之前他接受爱范儿专访提到的产品愿景,云鲸的产品未来一定会具备空间清洁能力,但是空间清洁能力对于整体产品技术的要求是量级程度的提升,至少目前来看,他们开始攻克一些具体的场景和任务了。

张峻彬也直接提到了机械臂产品的时间判断:

我觉得在两年后可能有一个带机械臂的产品,真正能解决扫地机解决不了的很多事情的产品形态进入家庭。

从去年开始,带机械臂的扫地机器人就出现在了一些行业展会上,云鲸的认知是,给扫地机器人装上机械臂并不难,难的是这个机械臂能够做什么?

当然,张峻彬认为在扫地机器人基础上做形态创新是合理的乃至必要的。

真正的家庭机器人,不太可能一开始就以科幻电影里的仿人机器人形态出现。它更可能长在一个已经成熟的家电品类上,先解决一个明确、高频、有支付意愿的任务,再逐步增加能力。

张峻彬自己也提到,任何一个具身产品要真正突破大规模生产,都需要在一个成熟产品形态上做加法。就像 iPhone 首先仍然是一台手机,用户为它买单的基础功能依旧成立;具身产品也需要找到类似扫地机这样的基础品类,再在上面增加机械臂、视觉、交互和空间操作能力。他说:

任何一个具身产品要真正的突破大规模生产,一定是他要赋予一个像手机一样的行业,或者是像扫地机一样的东西去做加法,这个过程中才有机会做大规模的量的突破。

相比很多从零开始定义家庭机器人的创业公司,扫地机器人公司已经拥有几个关键基础:它们熟悉家庭空间,拥有真实用户数据,理解清洁任务,也已经建立了供应链、服务和渠道体系。更重要的是,扫地机器人本身就是目前最接近普通家庭的机器人产品。

从平面清洁到空间清洁,从地面移动到物体操作,从路径规划到任务理解,扫地机再往前一步,是迥异于一些人形机器人的路线。即便踏出这一步也并不简单,张峻彬也提到,这里面牵涉大量算法、产品定义和机电系统创新。机械臂不是简单装上去就能解决问题,家庭环境比工厂复杂得多:物体种类多、摆放不规则、用户容错率低、成本敏感,安全性要求也更高。

但他的判断是,这件事「越来越近了」。云鲸内部做具身智能的逻辑是,先去做技术储备和知识储备,摸索技术的天花板,然后再做产品力。

现在云鲸到了开始做产品定义的阶段了。

产品可以是一种「时间状态」,在它之前是技术,之后是营销,现在的张峻彬不再只关心如何做出好产品,也开始关心好产品如何被用户理解;不再只关心规模增长,也开始关心规模增长之前组织是否健康;不再只把自己放在产品经理的位置上,也开始进入营销、战略、价值观和全球经营这些更复杂的系统。

张峻彬在谈 IPO 时有一句话,是对这种状态的另一重理解:

我个人觉得 IPO 不是终点,只是一个开始,我希望在开始的那一刻,它会有特别好的,我们内部叫二次创业,就是希望在那一刻是一个二次创业的状态,最好的组织,最好的人才,最好的业务。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌