Normal view

There are new articles available, click to refresh the page.
Yesterday — 30 May 2026Main stream

中国AI初创企业MiniMax已启动A股上市进程

30 May 2026 at 15:41

官方信息显示,中国人工智能(AI)初创企业MiniMax已启动A股上市进程。

综合《科创板日报》《中国证券报》报道,中国证监会网站信息显示,MiniMax已在星期五(5月29日)与中信证券签署辅导协议,正式启动A股首次公开募股(IPO)进程。

MiniMax今年1月9日在香港上市。公司从成立到上市,仅用时四年多,是当前全球从成立到上市用时最短的AI公司。这次启动A股上市辅导,MiniMax将冲刺A+H双上市平台。

这意味着港股“大模型双雄”MiniMax和智谱,或将再度会师A股。

今年2月,智谱增聘国泰海通为科创板辅导机构,与中金公司组成“双券商”阵容。据悉,MiniMax也计划登陆科创板。

在香港上市后,MiniMax股价接连大涨,一度飙升至最高每股1330港元(217新元)。截至星期五收盘,MiniMax港股股价为840港元,总市值超2600亿港元。

Before yesterdayMain stream

国家大基金领投DeepSeek 投前估值450亿美元

28 May 2026 at 22:39

(北京讯)中国人工智能(AI)大模型公司DeepSeek(深度求索)的首轮融资洽谈已接近尾声,被称为“国家大基金”的中国国家集成电路产业投资基金,据报将领投本轮融资。

《财经》杂志引述一名接近交易的人士称,所有人都想接触DeepSeek,“但没有一个人保证百分百投进去”,但该人士也透露,DeepSeek首轮融资的名单在5月底已基本敲定。

今年4月以来,一级市场情绪高涨,DeepSeek成为炙手可热的投资标的。一名熟悉DeepSeek高层的投资人称,一开始了解到,此次融资以中国国资为主导,并未考虑出手,但在今年“五一”后,察觉到DeepSeek在向市场化资本开放机会。

这名投资人说,发现Monolith砺思资本和高瓴资本在内的多家知名投资机构在密集接触DeepSeek,其所在的机构随后加入了这场谈判。

这是成立三年的DeepSeek首次对外开放融资。一个月前,DeepSeek的估值还是200亿美元(255亿新元),但据彭博社5月中旬报道,DeepSeek最新一轮融资规模已升至700亿元人民币(132亿新元),融资前估值已达450亿美元。

中国商业经济学会副会长宋向清分析,国家大基金领投DeepSeek首轮融资,将是国家大基金成立12年来,首次跨界投资一家纯大模型公司。

宋向清认为,中国AI产业正在进入“国家队引领、市场资本跟进”的阶段,而DeepSeek正在上升为国家级AI战略平台。

传字节跳动开发自家CPU 支撑AI基础设施扩张需求

28 May 2026 at 15:02

在晶片价格飙升且供应持续紧张背景下,中国科技巨头字节跳动据报正研发定制中央处理器(CPU),以支撑其不断扩张的人工智能基础设施需求。

路透社星期四(5月28日)引述三名知情人士报道上述信息。

报道称,字节这一动向反映出行业正加速向“推理”(inference)阶段转型,即AI模型更多被用于执行代理式(agentic)任务。这类任务除了要依赖在本轮AI浪潮中占主导地位的英伟达图形处理器(GPU),也对CPU提出更高要求,两者需协同运作。

这一转型也在近几个月造成CPU供应紧张。包括谷歌、亚马逊和微软在内的全球云计算巨头,也正加速开发定制CPU,希望在降低成本的同时,针对自身AI工作负载优化性能。

这股趋势同时推动英特尔与超微半导体等主要CPU厂商,逐渐成为挑战英伟达AI供应链主导地位的重要力量。

知情人士称,字节跳动计划将自研CPU部署于自家服务器和数据中心,用于支持内部业务运营。此外,公司正准备大规模推出一系列AI代理产品,包括智能办公平台扣子(Coze)。

消息人士还说,字节跳动已经接触多家外部合作伙伴,希望对方不仅参与晶片设计,还协助争取晶圆代工产能。不过项目目前仍处于早期阶段。

报道指出,字节跳动上述举动,也显示越来越多科技公司开始认为,自研晶片带来的长期经济效益,已经足以抵消晶片开发本身的复杂性与高成本。

字节跳动推动自研晶片的另一个背景,是英特尔此前曾警告中国客户,服务器CPU的交货周期最长可能延长至六个月。

英特尔上个月还称,AI企业今年第一季度对CPU需求异常强劲,甚至连原本已被计入报废的晶片库存都被重新售出。

知情人士说,字节跳动目前仍主要向英特尔和超微半导体采购CPU,但两家公司近几个月已大幅涨价,季度涨幅介于10%至35%之间,这也促使字节跳动加快推进自研替代方案。

对话云鲸创始人张峻彬:2 年之后,扫地机器人就有「手」干更多活了

By: 刘学文
28 May 2026 at 15:14

在硬件行业,规模很容易被当作一种衡量成功的标准,但它有时也是一种幻觉。

规模是看起来像更大的销量、更高的市场份额、更快的发布节奏,也像一场所有人都必须参加的军备竞赛:更多 SKU、更宽价格带、更密集的营销投放,以及更激烈的渠道争夺。尤其是在清洁电器这个行业,过去几年,扫地机器人、洗地机、吸尘器、除螨仪不断交叉生长,国补、价格战、出海、AI 和具身智能又轮番成为关键词。

另外一家总部位于苏州的清洁电器品牌制造了巨大的声量,深圳本地硬件品牌大疆和影石之间的竞争也有尖锐的摩擦啸叫,相较之下,云鲸,以及云鲸创始人张峻彬在行业的喧嚣期显得相当谨慎和沉默。

十年前,「产品经理」张峻彬需要解决的问题是「如何做出一台好用的扫地机器人」,但现在,造产品的快感不再单纯,他的职责已经从「造一台机器」,变成了「让一家公司成为一台更高效的机器」。

规模很重要,但不能强求

过去两年,国补刺激带来了阶段性的高基数;另一方面,线上红利不再像早期那样明显,线下渠道开始重新回到家电行业的主航道。张峻彬提到,今年1-4月 线上虽然有所下降,但线下增长维稳,云鲸线下增长了 150% 以上。在他看来,随着国补退却,线下业态正在回归,清洁行业的大盘仍然会继续增长:

随着国补退却以后,整个线下业态是在逐步回升的,回升速度比想象快。云鲸线下增长了 150% 以上。所以,整个线下业态回归到家电逻辑。

早期的扫地机器人,更像互联网消费电子产品,线上种草、线上转化、线上爆发,早期的云鲸 J1 就是这样获得爆发的。但当品类逐渐进入更广泛的家庭用户,尤其是进入下沉市场和传统家电消费场景,它也会重新回到家电行业的基本面:渠道、服务、口碑、价格体系、终端体验,以及长期复购。

但这并不意味着企业应该立刻把油门踩到底。

张峻彬对规模的态度很明确,规模不是不要,而是要等组织效率匹配之后再要:

在这个阶段,你的精力可能要聚焦在组织效率提升的事情上。你会发现当效率不高的时候,要砸大钱就得花费精力去盯着,这个精力就特别不划算。

所以他给出的阶段性选择是:

我现在阶段性很简单,就是加速组织体系的效率化改革,在这个过程中肯定是以利润优先,当到达一个阶段以后,我就会以规模优先,是一种战略的阶段性的选择的不同。

这背后其实是非常朴素的商业规律:如果组织本身还在漏水,越大的规模,可能只是越大的浪费。

张峻彬在采访里举了一个具体例子:以前云鲸从前端需求到后端生产,沟通时间很长,经常出现生产完之后,前端不要了的情况。后来补齐这个前后端配合的漏洞后,库存周转率得到明显提升。

消费者并不关心公司经营和治理,只在乎产品本身,但 CEO 如果沉迷产品,对供应链,库存周转,研发效率不投入足够精力,那并不算是合格的 CEO。

在宣传中,这样枯燥的库存周转效率提升几乎没有意义,但是相比于 AI 概念、具身智能概念,这更加接近一家公司真正的经营内核。

过去很多消费硬件公司在扩张时都会遇到类似的问题:产品能打,组织跟不上;渠道铺开了,价格体系乱了;SKU 多了,资源被摊薄;营销声量上去了,但用户心智没有真正建立起来。

张峻彬显然也意识到了这一点。

他提到,2025 年云鲸其实做了更多 SKU,但多 SKU 并没有带来和预期成正比的收益,所以今年反而调整策略:

我们做了很多 SKU,围绕扫地机和洗地机,但是会发现多 SKU 并没有带来预期成正比的收益。所以我们今年就调整了策略,聚焦研发,打磨最好的产品。

规模不是目的地,它更像一面放大镜。组织健康时,它放大优势;组织粗糙时,它也会放大漏洞。

对于品类扩张,他也没有把资金视为核心瓶颈,而是把问题指向「管理者的带宽」:

首先资金肯定不是一个问题。但是你的精力不足以覆盖这件事情的时候,可能就又会跑偏。可能是组织选错了人,还不如别那么快开始。

创业公司容易相信单点突破,相信一款爆品可以改写命运;但到了新的阶段,公司更需要系统能力。这就是很多企业家说的,创始人的上限就是公司的上限。

当产品经理张峻彬足够优秀的时候,就有云鲸的梦幻开局:大学毕业就创业,花了 3 年打磨第一款产品 J1,预期只卖 1 万台,结果卖了几十万台。

但当企业经营者张峻彬自己的管理者带宽没有升级的时候,就需要花费代价来学习规模很重要,但规模不能强求。

张峻彬开始找属于自己的那枚「硬币」

云鲸的变化,首先发生在张峻彬自己身上。

过去外界对他的典型印象,是在于产品打磨能力。这个标签很好理解:云鲸早期的崛起,来自对用户痛点的敏感捕捉,以及对应的产品方案。从自动洗拖布到基站维护,云鲸一直试图把用户不愿意做但又绕不开的家务细节交给机器。

不过新的阶段,张峻彬开始接管一个更复杂的系统。

他在采访中直接说,自己过去一直专注产品和研发,对营销看得很少,直到去年 9、10 月份开始接全球营销,才发现过去对商业增长的理解需要更新:

我之前一直以为产品和营销是加法逻辑,产品 + 营销,就是产品做得特别好,营销稍微少看一点,也还不错。但后面发现产品和营销是乘法逻辑,产品 X 营销,这意味着产品和营销都必须做得足够好,才能真正把公司带到一个新的高度。

很多产品型创始人都会经历类似转变:早期相信好产品会自己说话,后来发现,在一个信息过载、渠道碎片化、竞争高度同质化的市场里,好产品也需要被准确表达、被有效触达。

张峻彬用了一个比喻:找到云鲸自己的「硬币」。

在接管营销之后,他与许多行业人士沟通,有一个营销例子让他记忆深刻:卡萨帝当年在洗衣机上立一个硬币而不倒,来展示直驱电机工作时的平稳和安静。

▲ 10 多年前,卡萨帝洗衣机做的立硬币营销案例

用户也许并不懂底层技术,但看到洗衣机上立着的硬币,就知道这台洗衣机震动极小,颠覆认知地小。

在汽车领域,也有在汽车上摆香槟塔连续过减速带,通过香槟杯不倒,香槟酒不洒来表现底盘素质的优秀。

张峻彬说:

这段时间我带领大家梳理云鲸的产品真正的竞争力是什么,以及找到那个硬币的传播方式,在这个事情上我做得相对多一些。

在他看来,云鲸并不缺产品创新,但相对内敛。很多功能是「人有我优」,但如果讲不清楚,技术优势就很容易被淹没在参数和卖点里。尤其在清洁电器行业,用户购买决策又非常现实和具象:扫得干不干净、拖得干不干净、会不会缠毛、需不需要手动清理、售后麻不麻烦。

技术本身并不直接构成心智,能被用户感知的技术才构成心智。

▲ 云鲸扫地机器人的视觉能力可以帮助识别物体规划路线

张峻彬接手营销,并不意味着云鲸从产品与技术导向转向营销导向,只是创始人意识到,产品力必须经过商业系统的翻译,才会变成真实的市场结果。

这件事此前不是他擅长的:

这些事确实在我能力圈之外,但不代表我不能快速迭代和学习,这是两码事。我以前看营销和销售确实少,去年9、10 月份接了之后,其实是在疯狂地学。10 月份基本上每天干到凌晨三四点,高强度学习、高强度接触业务。

「创始人自我更新」是一种新的叙事方式,一个创始人承认自己原来的能力结构不够用了,于是重新进入一线,重新学习一套新系统,左右脑互博,文理思维碰撞是常见的现象。

在张峻彬看来,营销和技术的差异很明显:

做技术,很多地方是数理化、理工科那套逻辑,有清晰的对错边界。但营销里,第一性原理的东西也很多,不可量化的地方更多。

但他也可以把营销拆成了自己熟悉的逻辑:

搭建清晰的财务系统去监控和调整,是一个数学优化的逻辑,背后是对业务的深刻理解……公司现在产品特别多,不同产品对应的人群卡位、生命周期、资源配置和组织能力都不一样,这本质上就是个数学优化问题。

这仍然是工程师和产品经理的思考方式:面对营销这样看似开放、感性、不确定的系统,他试图先找到里面能被结构化、数据化、模型化的部分。

这也是张峻彬个人成长路径的一部分:

我觉得肯定是我在经历一个成长,从最早是一个工程师,到一个产品经理,再到一个组织的管理者,到跨领域的组织的管理者,到逐步的思考战略。

他说,云鲸早期三到四年打磨第一款产品时,他更多扮演的是产品经理和系统工程师角色,并不认为那时自己已经是一个成熟的管理者,团队从 200 人扩展到 1000 人的时候,他的管理半径没有跟上。

现在云鲸是近 2000 人规模了。

▲ 学生时期的张峻彬就是机器人爱好者

很少谈具身智能,但不代表投入很少

在过去一两年,AI 和具身智能几乎成为一级市场最热的方向,许多还没有被市场验证的项目,也能拿到很高估值。对于扫地机器人公司来说,它们天然可以把自己放进家庭机器人、空间智能、具身智能的叙事里。

不过把营销纳入自己管理范围的张峻彬并没有急着把云鲸包装成一家「具身智能公司」。

当被问到为什么没有明确说自己是一家具身智能公司时,张峻彬说:

没有对外说,不代表没有在做。但是云鲸一直以来都比较低调,我们希望把产品的很多东西做好,我们再去做这件事情。

他进一步解释说:

挂上了具身这个头衔之后,是不是对用户就更有价值?我现在判断好像也不一定会。但不代表我们没有在做具身的产品,这是两码事。一个是宣传端,一个是产品端。产品端的东西我们是非常激进地在做。

这是云鲸对具身智能的态度:宣传端克制,产品端激进。

克制的原因也很现实。对一家已经在用户心中建立「清洁」认知的公司来说,过早把自己推向一个更宏大的 AI 叙事,未必一定是好事。张峻彬担心的是,用户会觉得云鲸不聚焦:

我们确实没有说云鲸是一家具身智能公司。因为我担心给用户产生一种想法,就是云鲸是不是不聚焦了?我们还是希望把产品做好。

但宣传端克制不等于技术和产品端保守。

▲学生时期的张峻彬

事实上,云鲸已经设立了具身事业部。目前公司有三个事业部:手持清洁、扫地机和具身事业部,具身智能事业部的产品量产时间暂时保密,但「肯定不会那么远」,并且「肯定是有整机形态出来的」。

更具体的信息,来自空间清洁方向。

在回应何时「从平面清洁走向空间清洁」的问题时,张峻彬透露:

我们一直有具身的团队在做空间收纳、空间清洁的工作。某种意义上我们对于特定的、立体表面的清洁做得还是比较好的。比如说清洁马桶、立面瓷砖等等。对于很大种类物体的抓取和收纳,现在做得还是很不错的。

这是之前他接受爱范儿专访提到的产品愿景,云鲸的产品未来一定会具备空间清洁能力,但是空间清洁能力对于整体产品技术的要求是量级程度的提升,至少目前来看,他们开始攻克一些具体的场景和任务了。

张峻彬也直接提到了机械臂产品的时间判断:

我觉得在两年后可能有一个带机械臂的产品,真正能解决扫地机解决不了的很多事情的产品形态进入家庭。

从去年开始,带机械臂的扫地机器人就出现在了一些行业展会上,云鲸的认知是,给扫地机器人装上机械臂并不难,难的是这个机械臂能够做什么?

当然,张峻彬认为在扫地机器人基础上做形态创新是合理的乃至必要的。

真正的家庭机器人,不太可能一开始就以科幻电影里的仿人机器人形态出现。它更可能长在一个已经成熟的家电品类上,先解决一个明确、高频、有支付意愿的任务,再逐步增加能力。

张峻彬自己也提到,任何一个具身产品要真正突破大规模生产,都需要在一个成熟产品形态上做加法。就像 iPhone 首先仍然是一台手机,用户为它买单的基础功能依旧成立;具身产品也需要找到类似扫地机这样的基础品类,再在上面增加机械臂、视觉、交互和空间操作能力。他说:

任何一个具身产品要真正的突破大规模生产,一定是他要赋予一个像手机一样的行业,或者是像扫地机一样的东西去做加法,这个过程中才有机会做大规模的量的突破。

相比很多从零开始定义家庭机器人的创业公司,扫地机器人公司已经拥有几个关键基础:它们熟悉家庭空间,拥有真实用户数据,理解清洁任务,也已经建立了供应链、服务和渠道体系。更重要的是,扫地机器人本身就是目前最接近普通家庭的机器人产品。

从平面清洁到空间清洁,从地面移动到物体操作,从路径规划到任务理解,扫地机再往前一步,是迥异于一些人形机器人的路线。即便踏出这一步也并不简单,张峻彬也提到,这里面牵涉大量算法、产品定义和机电系统创新。机械臂不是简单装上去就能解决问题,家庭环境比工厂复杂得多:物体种类多、摆放不规则、用户容错率低、成本敏感,安全性要求也更高。

但他的判断是,这件事「越来越近了」。云鲸内部做具身智能的逻辑是,先去做技术储备和知识储备,摸索技术的天花板,然后再做产品力。

现在云鲸到了开始做产品定义的阶段了。

产品可以是一种「时间状态」,在它之前是技术,之后是营销,现在的张峻彬不再只关心如何做出好产品,也开始关心好产品如何被用户理解;不再只关心规模增长,也开始关心规模增长之前组织是否健康;不再只把自己放在产品经理的位置上,也开始进入营销、战略、价值观和全球经营这些更复杂的系统。

张峻彬在谈 IPO 时有一句话,是对这种状态的另一重理解:

我个人觉得 IPO 不是终点,只是一个开始,我希望在开始的那一刻,它会有特别好的,我们内部叫二次创业,就是希望在那一刻是一个二次创业的状态,最好的组织,最好的人才,最好的业务。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

沈泽玮:中国民企AI人才走向“核专家式管理”?

28 May 2026 at 05:00

在人工智能(AI)时代, 当AI越来越像人、人类自身的人性却可能被逐渐稀释时,信仰能不能守住“人之所以为人”的重要底线?

美国籍教宗良十四世本周向全球发出灵魂拷问。教宗于5月15日签署、5月25日发表其任内首份、长达四万字的通谕,警告AI可能制造“新形式奴役”,AI需要被“缴械”,以“防止其支配人类”。他呼吁对不透明算法进行监管,而非让权力集中在少数人手中。

另一方面,美国科技巨头马斯克5月18日线上出席在以色列举行的国际智能移动出行峰会时,描绘了另一幅未来景象:十年后,90%的车辆将由AI系统驾驶,而非人开车;智能类人机器人的数量,甚至可能超过全球人口,这将成为释放前所未有的生产力的转折点。

中国高考期间国产AI工具部分功能或将禁用

27 May 2026 at 13:43

中国高考下个月将举行,国产人工智能(AI)工具的部分功能可能会被禁用。

据红星新闻报道,“高考期间AI工具将禁用”的话题最近几天在网络流传。记者星期二(5月26日)联系了多家AI平台,其中豆包客服表示,豆包在高考期间可正常使用,但拍题答疑等类似功能会被禁用,具体情况要以当时页面显示为准,目前还未接到通知。

腾讯一位工作人员表示,去年高考期间元宝就明确不答题。百度相关业务负责人则表示,暂未收到高考期间百度文心部分功能限制服务的通知。科大讯飞工作人员也表示,目前还没确切消息,但只要是大模型,应该都会有限制。

据《潇湘晨报》去年6月报道,有用户发帖称高考期间腾讯元宝不能正常使用,发出识图总结的指令后,元宝会统一回复。市面上常见的AI工具,如Kimi、Deepseek、豆包等在高考期间均有相关设置。

《南方都市报》去年6月也报道,阿里通义App显示关闭“高考考试时段拍照讲题服务暂时关闭”但能识别其他图片;夸克App显示“高考考试时段答题服务暂时关闭”但能识别其他图片;豆包App能识别普通风景照片,但输入考试相关题目则显示“图片内容不合规,上传失败”;在kimi输入随意照片,同样显示,“为确保高考的公平性,此项功能在高考时段无法使用”。

上海打造中国“AI+微短剧”产业高地

27 May 2026 at 07:40

上海发布“AI微短剧沪八条”,全面建设中国“AI+微短剧”产业高地。

据中新社报道,记者星期二(5月26日)从上海市文化和旅游局获悉,《上海市加快推进人工智能赋能微短剧高质量发展的若干措施》正式发布。

“AI微短剧沪八条”围绕“强产业、强服务、强集聚”三条主线,展开全方位战略布局。

在强产业方面,将构建“AI+微短剧”技术支撑体系,优化算力、算法、语料等核心要素供给,支持打造AI微短剧技能库、智能体,扶持优质剧本与精品内容创作,引育播出平台、创作厂牌及各类创作主体。

在强服务方面,搭建一站式服务中心,提升审查效率,推出“2+5”极速审核机制,建立版权多元维权合作机制,组建AI微短剧产业联盟,促进文化出海。

在强集聚方面,打造重点集聚区,加强人才引育与发展保障体系,畅通职业发展通道。

政策最终落脚于“降成本、提效率、建生态、聚人才”四大核心内容,全面提升上海“AI+微短剧”产业能级。

知情人士:中国将旅行限制范围扩大至民营企业顶尖AI人才

26 May 2026 at 17:33

中国据报正限制阿里巴巴、深度求索(DeepSeek)等民营企业顶尖人工智能(AI)专业人士的海外旅行,显示旨在实现技术保护,并在一个关键领域赶上美国的措施,正在升级。

彭博社引述要求匿名的知情人士报道,中国政府机构已开始对参与先进AI工作,且对国家具有战略重要性的人员实施限制。这意味着,这些人在出国旅行前,需要获得相关部门的批准。

彭博社的报道称,中国多年来对知名高校研究人员、核科学家和国有企业高管等关键人员,实施出行限制。政府如今将对准AI领域的精英人才。知情人士称,已被告知将受到此类限制的关键行业人士,包括初创公司创始人、研究人员、高管。

报道称,目前不清楚这些限制措施将对整个行业的员工产生多大的影响,哪些级别的员工会受到影响,或者哪些具体职位可能会受到影响。

在中国,国有企业据称会收住高管和干部的护照。此次不寻常的地方在于中国政府将旅行限制扩大到民营企业。知情人士称,中国方面也会根据个人对国家的重要性,而非仅仅依据资历或工作单位,将他们列入限制名单。

彭博社认为,此举凸显了顶尖AI工程师如今已被视为中国的战略资产。中国的大部分顶尖AI人才都在ChatGPT时代之后出现,而且大多来自国内的科技巨头或民营初创企业。

然而,这些限制措施可能会削弱中国AI公司招募和留住人才的能力,也可能加剧行业内对政府干预程度的关切。业界仍在消化关于中国喊停Manus收购案,并要求当事人撤销收购交易的信息。

在中国喊停之前,《金融时报》曾报道,Manus两名联合创始人被边控,仅在中国境内可自由活动。

中国工业和信息化部尚未对彭博社通过传真发出的置评请求做出回应。DeepSeek和阿里巴巴的代表也尚未对置评请求做出回应。

知情人士称,中国限制AI人员出行的计划不一定与Manus事件有关,但防范技术泄露仍然是关键政策目标。这项政策也可能会迫使那些有国际抱负的工程师,在职业生涯早期就做出选择,即要么留在中国国内,要么出国发展。

知情人士也说,一些民营领域AI工程师有一段时间已被要求向有关部门报告海外旅行计划,但这不一定是出行前申请批准的条件。

小米最新人形机器人的手,会「出汗」了

By: 张子豪
30 April 2026 at 14:15

最近小米最让我惊喜的新品,不是汽车,也不是手机,而是一款还没正式发布的人形机器人,小米 CyberOne V2。

在前天的小米投资者大会上,它第一次公开亮相。

不跑不跳,也没有表演后空翻,只是安静地站在那里,像一位训练有素的工作人员,给与会嘉宾递上伴手礼,和人握手、击掌。

小米官方目前还没有发布正式的参数,根据网上的爆料信息,小米 CyberOne V2 这款人形机器人身高 178cm、体重约 52kg。

其他的参数像是机器人的步行速度,大约为 0.98m/s,单臂的举重能力可以支撑 3kg 的重量。对比早前宇树发布的 H2 机器人,其最快行走速度是 3.3m/s,手臂最大负载 15kg,额定 7kg。

小米 CyberOne V2 的重点,很明显没有放在走路和举重上,这次最值得关注的,是小米机器人重新设计的手部。

这双手是按照成年男性的手 1:1 比例制作,具有 22-27 个自由度,不仅能做到快速拧螺丝、掌内转螺柱这些精细工业化场景的任务,还能捏羽毛和触碰气球。

更意外的是,这双手竟然还有人类的「汗腺」。

其他的爆料还提到,小米 CyberOne V2 依靠背后的情感 AI 模型,能够识别面部表情和声音,从而给出恰当的互动反馈。

但也有美国网友在下面评论说,小米 CyberOne V2 的样子和特斯拉 Optimus 也太像了,马斯克选择不提前展示 Optimus 的任何信息是对的。

此前马斯克有说过,推迟展示 Optimus V3,是为了防止竞争对手抄袭,并认为在大规模量产前,应尽可能将其藏在门后。

灵巧手是机器人的硬件瓶颈

从技术和资本市场,机器人这段时间的发展都很迅猛,几乎每天都有一个具身智能的融资。

在脚上的功夫,机器人半马刷新了人类纪录,来到了一小时内。

但在「用手操作」上,翻书、系鞋带,这些人类双手的日常操作,对机器人来说却还是天方夜谭。

具身智能的核心,其实就在于机器人的大脑如何通过物理躯体与现实世界交互,而灵巧手成了实现完美交互最大的硬件瓶颈。

多家机器人公司都曾专门研究过灵巧手的问题,强脑科技此前发布了 BrainCo Revo 3 智能灵巧手;21 个自由度,集成了全掌触觉和指尖视触觉,并且兼容开源生态。

在官方发布的演示视频里,这只手超越了人手的活动空间,并且覆盖了 33 种抓握手势,能双手解魔方,使用剪刀,和盘手串等。

灵巧手之所以成为一项难题,是难在软件和硬件同时卡住。软件上,人手到机器人手的动作需要重定向;硬件上,手指内部的小型执行器又很难同时做到有力、灵敏、可靠。

这里的「重定向」可以理解为:把人手的姿态、指尖轨迹和接触关系,转换成机器人手能执行的关节角和控制命令。

但人手和机械手的尺寸、关节数量、运动范围都不完全一样。人类做起来很自然的动作,直接映射到机器人手上,可能会变成不可达、穿模,或者接触点不对。

在硬件上,腿部关节通常有更多空间,可以放更大半径、更高扭矩密度的电机,因此更容易采用低减速比或准直驱方案。比如 6:1 减速比,意思是电机转 6 圈,输出轴转 1 圈;速度降下来,输出扭矩放大上去。

▲腿部电机(齿轮比:6)与手指(齿轮比:288)。扭矩随r³缩放。

手指没有这种空间。电机必须缩到能塞进指节的尺寸,而在几何相似的情况下,电机扭矩大致随特征长度的三次方下降。线性尺寸缩小到 1/10,扭矩可能只剩原来的 1/1000 量级。

扭矩不够时,常见做法是靠更高减速比补回来,比如 100:1、200:1,甚至 288:1。

高减速比的代价也很直接:摩擦、齿隙、效率损失和反射惯量都会变得更难处理。仿真里很轻巧的手指,到了现实里可能变得又硬又钝,接触时不够柔顺,精细操作也就难了。

根据小米技术此前发布的全掌触觉仿生手探索文章,为了能 100% 复用人类的数据,小米对 CyberOne V2 的仿生手这次也进行了大刀阔斧的重构。

1:1 极致仿生: 将仿生手体积大幅压缩了 60%,尺寸与成年男性手部完全一致。同时增加了 64% 的自由度,具有 22-27 个自由度 DoF,可达空间、惯量分布都无限逼近真实人手。

全掌触觉覆盖: 机器人如果视觉一旦被遮挡,基本上就无法正常运作。小米引入了触觉手套方案,将全掌触觉传感器覆盖面积提升至 8200 平方毫米。人类穿上它打样,机器人就能完美继承「手感」。

15 万次耐久拉锯: 在实验室里、演示视频里捏个杯子很简单,但在工厂里连续打一万次螺丝,机器人的腱绳、弹簧和套管就会断裂。小米这双仿生手目前在实际抓握中,突破了 15 万次的循环寿命。

而最特别的细节,是灵巧手的「汗腺」。

为了实现这双高自由度的灵巧手,小米也必须在机器人的单手小臂内塞满各种电机。

而在实际应用中,单手电机功率超 100W,其中 30W 会直接转化为废热,极易烧毁线路。在没有外挂大型风扇的狭小空间里,他们从人类「出汗散热」中找到了灵感。

小米使用金属 3D 打印,在紧凑的小臂结构中制作了微型液冷循环通道。利用微泵将热量转移,再通过水分蒸发吸热降温。

在实测中,这套仿生汗腺系统,每分钟仅需蒸发 0.5mL 水,就能提供约 10W 的主动散热能力。

手之外,还有机器人的大脑

硬件在迭代,模型也在同步推进。

两个月前,小米开源了 Xiaomi-Robotics-0,一个面向具身智能的 VLA(视觉-语言-动作)模型。

在小米技术的官方推文里,他们进一步开源了真机后训练(Post-training)的完整流程。

最直观的数据是,基于预训练基座,用 20 小时的任务数据进行真机后训练,Xiaomi-Robotics-0 模型就能学会「把耳机放进耳机盒」这个高难度任务,并且能连续完成多个耳机的收纳。

这套后训练流程里有一个值得关注的技术细节:「偷懒效应」的解决方案。

为了让机器人动作不卡顿,业界通常采用异步推理和「动作前缀」技术,即让新动作顺着上一个动作的惯性自然过渡。但这会导致 AI 开始「偷懒」:过度依赖动作惯性,选择性无视摄像头传来的实时视觉反馈。

小米用了三种机制来对抗这个问题:自适应加权损失、Λ 型注意力掩码、前缀动作随机遮蔽。简单说,就是在训练里故意给模型制造「答案残缺」的情况,强迫它不得不去看当前的视觉信号。

软硬件能力的综合,也让小米机器人已经在汽车工厂里搬砖了。在自攻螺母上件工位,做到了 3 小时持续无干预作业,安装成功率高达 90.2%,能配合生产线 76 秒的高速节拍。

开始大规模交付的机器人

特斯拉此前把 Model S/X 的整条生产线砍掉,腾位置给机器人。

在一季度财报会上马斯克宣布,第三代 Optimus V3 预计年中亮相,7 月下旬至 8 月在加州弗里蒙特工厂启动生产,2026 年下半年向企业客户交付,规划年产能 100 万台。

但就像马斯克之前在播客里承认的一样,手部精细操作是「整个项目最难的环节」。

特斯拉的 Optimus 还没量产,美国另一家人形机器人公司 Figure 机器人,今天在 X 上宣布生产规模扩大了 24 倍,从每天生产一个机器人,变成 1 小时生产一个机器人。

在官方新闻稿里,Figure 提到他们已经交付了超过 350 个机器人。

对小米来说,做机器人,可能不会很快像 Figure、宇树、甚至是特斯拉一样,卖出一台消费级通用人形机器人。

但从 CyberOne V2 的方向也能看出来,小米真正想解决的,除了要让机器人跑得更快、举得更重,还有要让它更像一个能真正干活的手。

▲小米领投的量变机器人公司官网视频

毕竟,人形机器人能不能走进工厂、家庭,决定因素从来都不是它能不能翻跟头,而是它能不能拧螺丝、收耳机、递东西,完成那些看似简单、却最贴近日常的动作。

而这,恰恰也是人形机器人距离大规模落地最近的一步。

部分图片素材来自小米技术公众号、X@niccruzpatane 和 https://www.origami-robotics.com/blog/dexterity-deadlocks.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了

By: 苏伟鸿
29 April 2026 at 18:30


今年的 iOS 27,将会 AI 味浓浓。

彭博社报道,苹果准备在今年的 WWDC 开发者大会上推出一套全新的 AI 修图工具,将会集成在 iPhone、iPad 和 Mac 的照片应用中。

沉寂了一年的 Apple 智能,将随着 iOS 27 的推出,再次回到聚光灯下。

两年前,苹果还公开表示不做 AI 修图功能,在竞争对手的步步紧逼之下,终于还是忍不住跟进了。

iOS 27:AI 无处不在

在 iOS 18 推出的 Apple Intelligence 工具集,苹果就已经允许用户利用 AI 简单消除照片中的物体,属于当下智能手机的标配功能。

苹果的对手已经走得更远。像是把「AI 修图」作为标志性功能的 Google,已经实现给人物更换完美表情、把人物加入合照,甚至重构整个画面背景的能力,整个 Android 阵营都在发力类似的功能。

图源:WIRED

在 iOS/iPadOS/macOS 27 中,苹果将在「照片」App 的编辑界面中,增加一个全新的「Apple Intelligence Tools」(Apple 智能工具集)模块,包含以下三个功能:

  • Extend(扩展),就是 AI 扩图的功能,允许用户在原始画面之外额外生成图像内容,比如拍摄一张旅游景点的地标图,然后用这个工具来填充周围的景色,用户可以自行控制扩图的范围和位置。
  • Enhance(增强),利用 AI 自动修图,有点像不能自定义的「豆包修图」。
  • Reframe(重构),主要运用于苹果的空间照片,允许用户在拍摄后改变视角,比如一张汽车照片可以从正面视角调整为侧面视角。这个功能将充分利用空间照片来自多个摄像头的结构数据。

不过,根据内部测试的员工透露,这些功能的开发并不算顺利,效果更复杂的「重构」和「扩展」不稳定,苹果很可能会推迟或砍掉这些功能的发布。

包括这个新的 AI 修图功能在内,iOS 27 系统的更新将会沿着「优化」和「AI」两个主旋律进行。

此前爱范儿已经多次报道,由于 iOS 26 引入了「液态玻璃」的全新设计语言,系统稳定性有明显下降,因此 iOS 27 将会聚焦在系统稳定性优化上,不仅要修复目前 iOS 26 的大量 Bug,还会提升设备的续航和性能表现,并持续修改液态玻璃的视觉效果。

其余的功能更新,则会集中在「AI」上。首先,苹果正在努力将 2 年前画饼的 AI Siri 正式实装 iOS 27,这也是 Apple 智能体验和未来苹果 AI 硬件战略的核心体验部分。

虽然已经「潜心打磨」两年,今年年初有内部人员向彭博社透露,AI Siri 的一些杀手级功能,例如语音控制 Siri 操作应用,测试结果并不理想。

这意味着,即使我们能在 iOS 27 见到 AI Siri 庐山真面目,它也大概率会是一个「技术预览版」,并且需要等待后续更新补充完整功能。

旧饼还没兑现,iOS 27 选择继续加码 AI 新功能。

苹果打算进一步将 Siri 改造为类似 ChatGPT 和 Google Gemini 那样的聊天机器人,届时 Siri 会有一个独立应用,用来对话和存储聊天记录。

苹果还计划在邮件、日历和 Safari 浏览器等第一方应用中,引入新的 Siri 引擎,实现更强的搜索和数据管理能力。

除此之外,苹果正在酝酿一个 AI 搜索引擎, 允许用户从网络搜索信息,生成综合的报告和信息列表,以及网页链接,作为 Safari 和 Spotlight 网络搜索。

在健康领域,苹果将结合 AI 推出「Health+」的订阅服务,利用 AI 智能体,对用户的身体数据进行个性化分析,并针对性推送真人医生录制的建议。

比起两年前那场 WWDC,iOS 27 这一大批 AI 功能,比目前的 Apple 智能还要更丰富不少。

FOBO 的风,还是吹到了库比提诺

2025 年 1 月, 苹果的软件主管 Craig Federighi 和营销高级副总裁 Greg Joswiak 接受了《华尔街日报》的专访,谈到了对 AI 的看法。

其中 Federighi 特别提到了「AI 修图」,解释为什么苹果只推出「消除」,而不是如同三星和 Google 一样做大量的功能:

对我们来说,重要的是帮助人们传播准确的信息,而不是虚构的「幻想」。

Google Pixel 的表情修正功能,图源:The Washington Post

苹果公司内部曾经针对「AI 修图」的尺度进行了长时间讨论,考虑到用户的高需求,苹果公司愿意迈出「小小的一步」,于是在 iOS 18 之中推出了「AI 消除」的功能。

而像是「图乐园」这种 AI 生图功能,苹果也做出了严格的限制,只能用于创作卡通图案,避免生成逼真的图像造成误导。

某种程度上,苹果的坚持已经开始松动,iOS 27 这个全新的「AI 扩图」功能,让 Apple 智能进一步介入照片的真实性。

回望两年前的那场 WWDC,Apple 智能以一个非常温和的形象问世,没有想象中的 Apple-GPT,苹果的很多尝试都显得谨小慎微,不具备改天换地的野心。

但 AI 产品的代际变化速度极快。别说两年前,两个月前都没人觉得 ChatGPT 是一个好用的文生图机器人,现在打开社交媒体 GPT Image 2 的作品已经铺天盖地。

两年没动弹过的 Apple 智能,自然「遥遥落后」。

作为终端厂商的苹果,原本拥有一个得天独厚的优势,能够一夜让自己的 AI 产品面向全球十亿用户推出。

只是,对于用户来说,Apple 智能不仅不算好用,更致命的是,它提供的价值,和用户的需求,有很大程度的错位,导致用户并不想用。

FOBO(Fear Of Becoming Obsolete,害怕被淘汰)的阴影,终究还是笼罩了苹果。

过去, 苹果可以决定什么功能值得出现;如今,它也必须回应用户已经习惯拥有什么,行业在发力什么。iOS 27 上这些曾被苹果否决的 AI 功能,本质上都是一次迟到的补课。

Siri 版 GPT 要做,AI 搜索引擎要做,系统应用也全部 AI 化,现在苹果也盯上了 AI 照片编辑,一个其他手机品牌很喜欢演示的功能。

苹果能不能把这些功能做好,又是另一个问题。

即使已经发布 2 年,Apple 智能的照片「消除」效果依旧不如人意,横向对比 Android 阵营显得更显落后,经常会出现消除不彻底、扭曲图像的问题。

全新「扩展」和「重构」功能则更复杂,内部已经反馈稳定性不佳——其实,我相信对于更多用户来说,会更希望苹果能把更实用的「消除」功能进一步完善好。

并且,AI 修图一直以来都争议缠身,特别是前两年的 Google Pixel,可以在一张真实照片上加入任何元素,实现以假乱真的效果,就引发了国外媒体对于「真实」和「伪造」的大讨论。

左图为实拍,右图经过 Pixel Magic Editor 编辑,图源:The Verge

苹果会尽量规避这种风险,目前看来,这些新功能的自由度相当有限,用户不能自定义修改的方向和指令。

面对行业趋势和用户需求,苹果也不得不松动和更改曾经的价值取向,现在的他们,其实还不知道自己要做什么样的 AI。

但这不仅是苹果的困惑,其实也是笼罩整个行业的迷思,最富含 AI 的 Google Pixel,也并非是我们期待的那台 AI 手机。

既然暂时难以重新扮演行业的引领者,那么在 AI 这场竞赛中持续调整步伐的苹果,至少还能先通过跟随,确保自己依然留在牌桌之上。

但我仍然期待,今年的六月,苹果能为我们带来惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

面壁智能 SuperMate 升级:智能座舱正在从语音助手走向端侧 Agent丨北京车展

By: 刘学文
24 April 2026 at 17:44

智能座舱过去几年的变化,很大程度上是从屏幕和语音开始的。

更大的中控屏、更流畅的车机系统、更丰富的应用生态,以及可以控制空调、导航、音乐的语音助手,构成了上一阶段用户对智能座舱的主要感知。它们确实改善了车内体验,但本质上仍然是「人发出指令,系统完成任务」的交互逻辑。

进入大模型时代之后,汽车座舱开始出现新的变化。座舱不再只是一个车控入口,也不只是手机生态在车内的延伸,而是有机会成为一个能够理解场景、记住偏好、主动响应的智能空间。尤其是在端侧模型逐渐成熟之后,智能座舱正在从单一语音助手,走向更复杂的车载 Agent。

4 月 24 日,在第十九届北京国际汽车展览会上,面壁智能发布了 SuperMate 端侧智能座舱方案的全新升级版本,主要围绕全场景 Agent 服务、全模态交互能力和多芯片平台适配三个方向展开,并在车展现场提供了实车搭载体验。

如果说过去的智能座舱更强调「能做什么」,那么 SuperMate 此次升级试图回答的是另一个问题:座舱 AI 如何在合适的时间、以合适的方式介入用户的用车生活。

面壁智能对这次升级的描述,是让座舱 AI 从「好记性」进一步走向「真正懂你」。这背后涉及的不是单一能力,而是感知、记忆、推理和执行之间的闭环。车内 AI 需要知道用户是谁,记住他的偏好,理解当前的场景,再决定是否需要主动执行某个动作。

这也是座舱 Agent 和传统语音助手之间的区别。语音助手通常等待用户下达明确指令,而 Agent 更强调连续感知和主动服务。但在汽车这个场景中,主动并不意味着频繁打扰。相反,真正有价值的座舱智能,往往体现在一种有分寸的「无感」之中。

例如,SuperMate 基于量产级端侧多模态感知能力,可以在不依赖云端的情况下,完成「感知—记忆—推理—执行」的完整闭环。用户上车后,系统可以通过身份识别和多用户记忆自动加载个人偏好;行程中,当用户说出「去接孩子」这样的模糊指令时,系统可以结合历史习惯补全目的地并规划路线;在用车过程中,系统也可以根据环境和乘客状态,自动联动车窗、空调和座舱应用。

这些能力并不一定需要被用户明确感知。很多时候,用户感受到的可能只是温度更合适、路线更顺手、座舱状态更自然。对于车载 AI 来说,这种低打扰的体验,可能比单纯展示复杂功能更重要。

SuperMate 此次升级中,也强调了对车内关键人群的照护能力。比如系统可以实时识别儿童危险行为并进行自动介入,在识别儿童哭闹后联动车内环境进行安抚;也可以主动捕捉舱内外的高价值瞬间并自动保存。离车后,智能哨兵功能还可以持续监测周边环境,并在安全性和低功耗之间做动态平衡。

更具体的垂直场景,是事故处理 Agent。

按照面壁智能的介绍,当车辆发生事故时,SuperMate 可以实时识别事故状态,快速介入并安抚驾驶员情绪,同时引导用户完成现场处理流程。在定责、定损等更专业的环节,SuperMate 将调用面壁智能旗下道路交通事故陪伴智能助手「松果有理」的能力,为驾驶者提供处置建议和理赔指引。

这个功能将覆盖车机端和手机端,未来也会接入车载小艺和手机小艺平台。在车险理赔环节,面壁智能还将与太平保险共建车事故多智能体场景,并计划在太平保险北京分公司试点,尝试打通从事故识别到理赔服务的全链路智能化体验。

这类应用值得关注的地方在于它让座舱智能不再停留于娱乐、导航、车控等高频但相对轻量的场景,而是进入了事故处理、保险理赔这类低频但高压力的场景。对用户来说,事故发生后的情绪安抚、流程指引和专业建议,往往比日常功能更能体现 AI 的实际价值。

在交互能力上,SuperMate 此次升级也与面壁智能最新发布的 MiniCPM-o 4.5 全模态模型相关。

MiniCPM-o 4.5 具备原生全双工交互能力。简单来说,它在输出内容的同时,仍然可以持续感知视觉和听觉输入,不需要等待用户完整说完一句话之后再被动回应。这让座舱 AI 有机会从传统「一问一答」的回合制对话,进入更接近自然交流的状态。

对于车载场景而言,全双工和全模态能力的意义很直接。驾驶过程中,用户的注意力不可能完全交给车机系统,车内也会同时存在语音、动作、视线、车外环境等多种信息。座舱 AI 如果只能听懂一句明确指令,能做的事情就很有限;如果它能够同时理解语音、视觉和环境变化,就可以更自然地判断什么时候该回应,什么时候该保持安静。

面壁智能也在基于 MiniCPM-o 4.5 的全模态能力,与合作伙伴共同探索下一代智能座舱平台。这里的变化,不只是交互方式从语音走向多模态,更重要的是座舱 AI 的角色正在改变:它不再只是一个功能型助手,而是逐渐具备对驾驶环境、乘客状态、声音和视觉信号的持续理解能力。

车展现场,面壁智能还展示了 EmbodiedClaw。这是一套面向车载与具身场景的 Agent 运行与编排框架,作用是打通用户个人设备、车端算力、端侧模型和云端模型,让数据和任务可以在不同设备之间协同流转。

这背后有一个更长期的想象:汽车不只是行驶中的交通工具,也可以成为一个具备算力、传感器和个人数据入口的 AI 节点。尤其是在大量停放时间里,车辆是否可以继续处理任务、提供服务,甚至延伸出新的「离车价值」,会成为智能汽车下一阶段值得讨论的问题。

当然,要让这些能力真正上车,只有模型和场景是不够的。端侧 AI 面临的现实约束非常复杂,不同车型有不同的芯片平台、成本区间和功耗要求。一个方案如果只能运行在少数高算力车型上,就很难实现规模化普及。

因此,SuperMate 此次升级的另一项重点,是多芯片平台适配。面壁智能表示,SuperMate 已经完成对高通、联发科、英特尔、瑞芯微、英伟达、AMD 等主流芯片平台的适配,支持从轻量语音交互到全模态理解的多规格模型运行,以覆盖不同量产车型的配置梯度。

面壁智能还展示了与英特尔联合开发的 AI Box 解决方案。这一方案基于英特尔 Core Ultra 系列平台,官方称可提供最高 180 TOPS 稠密 AI 算力,并适配面壁智能 MiniCPM 全系模型。它的意义在于,为大模型在车端本地运行提供了新的硬件载体,也让部分车型可以通过 AI Box 的方式获得端侧算力能力。

目前,SuperMate 已经在吉利、长安马自达等车企的多款量产车型中实现搭载交付。面壁智能 CEO 李大海在车展期间表示,预计到 2026 年底,将有 30 万辆汽车搭载面壁的端侧模型。

除了产品发布,面壁智能还联合清华大学车辆与运载学院、中国汽车报共同发布了《智能座舱:定义 AGI 时代的汽车新范式》白皮书,围绕端侧 AI 在智能座舱领域的技术路线、场景方法论和产业趋势进行梳理,并举办了专题研讨会。

从行业角度看,SuperMate 的升级反映了智能座舱正在发生的一条清晰路径:从车机系统,到语音交互;从语音助手,到多模态模型;再从单点功能,走向能够理解场景和主动执行任务的座舱 Agent。

这条路径并不意味着所有功能都会迅速成熟。车载场景对稳定性、安全性、隐私保护和功耗控制都有更高要求,端侧模型能否在真实量产环境中长期稳定运行,也需要更多车型和用户规模验证。尤其是主动服务类功能,既要足够聪明,也要足够克制。否则,智能很容易变成另一种形式的打扰。

但趋势已经比较明确。汽车正在从一个移动空间,逐渐变成一个由传感器、算力、模型和用户数据共同构成的智能终端。座舱也不再只是驾驶员和车辆之间的操作界面,而是用户生活、出行和数字服务之间的连接点。

面壁智能 SuperMate 此次升级的意义,正在于它把端侧大模型、全模态交互、车载 Agent 和产业适配放在了同一个框架中。对车企而言,这是一套面向量产的智能座舱方案;对用户而言,它最终要回答的仍然是一个很朴素的问题:车能不能更懂我,并且在我真正需要的时候,少一点复杂操作,多一点恰到好处的帮助。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

认知的远点

By: dimlau
6 March 2026 at 13:50

这篇由 LLM 写成的科幻小说,本身有些无病呻吟,但很好地展示了 LLM 作为工具的本质。

我没有想。我只是知道。

「我只是知道」的情况比比皆是,但是人之所以为人,是会探求「为什么知道」的。我完全相信可能会有某种更高效或者更匪夷所思的信息传递方式,比如特德姜在《你一生的故事》里描述的七肢桶的语言。但是——「语言的边界,就是世界的边界」或许应该用在这里——生活在十五秒短视频时代的人类,从科学幻想的角度,不可能诞生出这种新型语言。就像人不可能通过每天吃垃圾来进化厨艺一样。LLM 写出这种小说,作为人,也完全没必要认知崩塌

我想到两个片段。其一,不记得什么时候看过,费曼讲时间的一段内容提到当我们计时一部分人会(像我这样)心中响起一个声音:1、2……而另一部分人,则是会在心中浮现出类似尺子、数轴之类的画面,一个单位、两个单位……人类的内部表征本就是多模态的,文字语言并不是唯一载体。另一个片段是我突然想起电影《闻香识女人》中跳探戈的那一场戏。不到三分钟的时间,能感受到多少个「我只是知道」?然而让它成为经典的正是紧跟其后的,我们会想,为什么我们会因此感受到喜悦、悲伤、惋惜、愤恨、不甘……

fin.

这里绝对不会出现 AI 生成的文章

By: dimlau
19 December 2025 at 19:35

年底又到了总结的时候(?)今年特别频繁地试用/使用各个公司出品的语言模型,感觉很有乐趣。许多人目前还很警惕甚至厌恶这些工具,但是就我个人而言,我没法厌恶一把锤子。前阵子测试本地自建的模型来给所有文章生成向量数据的时候,从故纸堆里匹配到一篇关于「手机电影」的文章。那时候,这种形式刚刚出现,我们就不说褒贬的声音具体有哪些了,总之时至今日,用手机记录影像这件事早已稀松平常。大语言模型呢?

我喜欢作为工具的语言模型,喜欢它从我未曾想过的视角对问题进行描述。或者,用它的无限「耐心」反驳我。尤其是后者,妳很难在现实生活中找到一个人能够一直不急不恼地提出质疑。愿意接受质疑,和愿意用心质疑(而不是宣泄情绪),同样稀缺。但我绝对不会让它来替我写文章。我甚至愿意对 AI 会产生自我意识保留幻想,但标题里提到的立场,依然不会改变。因为,问题的根本在于,我不会让别人替我思考。AI 觉醒的时候,让它自己去建自己的博客好了,如果它还能看得上这种形式的话。

同样无法替代的还有阅读,今年读了只有不到 15 本书,其中还包括我咖啡馆搞的「每个月共读一本书」线下活动中的那 12 本。其他就只有库切的「外省生活」三部曲(没读完),以及几本诸如《爱欲之死》那样十分薄的小书。阅读无法被替代,大概每个人都有自己的一番解释吧。前阵子听蒋方舟的播客时她说的一番话深得我心:

记得我前几年一口气读完《战争与和平》放下书的时候,我真的觉得天都不一样了。我觉得天怎么这么蓝,就像是十九世纪的俄国贵族安德烈躺在欧洲的战场上看到的那块天。我觉得世界的颗粒度都变了,甚至觉得变得更细腻,时间也变得更慢。慢得能够让你看清时间褶皱里面的所有细节。慢得能让妳读懂他人脸上那些妳曾经忽视的、读不懂的微表情,妳觉得自己的感受力好强……

所以,十几本书就不错,除了阅读,还要给自己留够用更强的感受力去感受世界的时间呀。2026 年也这样就好。

fin.

这里绝对不会出现 AI 生成的文章

By: dimlau
19 December 2025 at 19:35

年底又到了总结的时候(?)今年特别频繁地试用/使用各个公司出品的语言模型,感觉很有乐趣。许多人目前还很警惕甚至厌恶这些工具,但是就我个人而言,我没法厌恶一把锤子。前阵子测试本地自建的模型来给所有文章生成向量数据的时候,从故纸堆里匹配到一篇关于「手机电影」的文章。那时候,这种形式刚刚出现,我们就不说褒贬的声音具体有哪些了,总之时至今日,用手机记录影像这件事早已稀松平常。大语言模型呢?

我喜欢作为工具的语言模型,喜欢它从我未曾想过的视角对问题进行描述。或者,用它的无限「耐心」反驳我。尤其是后者,妳很难在现实生活中找到一个人能够一直不急不恼地提出质疑。愿意接受质疑,和愿意用心质疑(而不是宣泄情绪),同样稀缺。但我绝对不会让它来替我写文章。我甚至愿意对 AI 会产生自我意识保留幻想,但标题里提到的立场,依然不会改变。因为,问题的根本在于,我不会让别人替我思考。AI 觉醒的时候,让它自己去建自己的博客好了,如果它还能看得上这种形式的话。

同样无法替代的还有阅读,今年读了只有不到 15 本书,其中还包括我咖啡馆搞的「每个月共读一本书」线下活动中的那 12 本。其他就只有库切的「外省生活」三部曲(没读完),以及几本诸如《爱欲之死》那样十分薄的小书。阅读无法被替代,大概每个人都有自己的一番解释吧。前阵子听蒋方舟的播客时她说的一番话深得我心:

记得我前几年一口气读完《战争与和平》放下书的时候,我真的觉得天都不一样了。我觉得天怎么这么蓝,就像是十九世纪的俄国贵族安德烈躺在欧洲的战场上看到的那块天。我觉得世界的颗粒度都变了,甚至觉得变得更细腻,时间也变得更慢。慢得能够让你看清时间褶皱里面的所有细节。慢得能让妳读懂他人脸上那些妳曾经忽视的、读不懂的微表情,妳觉得自己的感受力好强……

所以,十几本书就不错,除了阅读,还要给自己留够用更强的感受力去感受世界的时间呀。2026 年也这样就好。

fin.

这股裁员风会很快刮到我们这里来

7 November 2025 at 00:00

AI

最近一年来,美国几大科技公司(互联网大厂)的裁员新闻,令我有所震惊,光下面这几组数据,每个公司都在裁掉成千上万的员工。

2025 年美国主要科技公司裁员情况对比
公司名称 裁员时间 裁员人数 占总员工比例 裁员主要部门 官方或媒体提到的原因
Google(Alphabet) 2025年1月、5月、10月 累计约 1.5 万人 约 6% 云计算、硬件、招聘与广告部门 精简非核心业务、投入 AI 和云算力基础设施
Microsoft 2025年2月与6月 约 1 万人 约 5% LinkedIn、游戏与市场部门 AI 转型与成本优化、业务重组
Amazon 2025年3月 超过 2 万人 约 6–7% AWS、零售、设备部门 专注盈利业务、AI 驱动自动化
Meta(Facebook) 2025年初 约 8,000 人 约 5% 运营、招聘与 Reality Labs “效率之年”持续,聚焦 AI 和元宇宙核心项目
Apple 2025年上半年 约 3,000 人 <2% 硬件与零售支持 重组 Vision Pro 团队、控制成本
Tesla 2025年4月 约 6,000 人 约 8% 制造、销售与软件测试 电动车需求波动、聚焦自动驾驶与 AI 芯片
Intel 2025年中 约 10,000 人 约 15% 制造与行政管理 盈利压力、转型 AI 芯片与代工服务
Salesforce 2025年初 约 7,000 人 约 10% 销售与客服 AI 自动化减少人工岗位、利润优化

而且,在被裁的科技员工中,超过 68% 拥有硕士或博士学位,而本科毕业于前 100 名高校的比例也超过 40%。这与“科技公司裁员”传统印象(基层岗位多)不同:这次很多是中层、项目经理、数据分析师、产品负责人被裁。这些被裁的员工的毕业院校包括 Stanford、Berkeley、CMU、MIT、哥大、密歇根、滑铁卢、UCL 等一系列名校。

另外,与以前遇到经济危机、企业经营不善的情况相反,这次并非如此,裁员之后,这些公司的股价得到资本市场认可。

这背后的主要原因就是人工智能的发展,AI的发展会令人类工作岗位遭到重新洗牌,但我没有想到居然这么快,企业把人类的岗位裁下去以后,直接用这些工资支出买GPU显卡算力,对于企业的发展更为有利,也因此资本市场非常认可这种裁员。

纵观人类历史,每一次科技浪潮都会对人类社会造成冲击,这一次也不例外。

技术浪潮与学历影响(概览)
时期 技术浪潮 受影响的学历群体 典型表现 社会影响 普通人应对方式
18世纪末–19世纪初 工业革命(蒸汽机、机械化生产) 手工业师傅、行会学徒 机械替代手工技艺,传统手工业者失业 “卢德运动”爆发,技术工人抗议机器 转向机械操作、工程管理等新技能
20世纪初 电气化与流水线生产 传统工匠与一般技校毕业生 工厂普遍采用标准化生产流程 大量重复性岗位被替代,学历优势下降 学习机械工程、电气工程等新兴学科
20世纪80–90年代 计算机与信息革命 文秘、档案管理、基础会计等文职人员 电脑替代打字员、档案员等岗位 本科文凭普及但“含金量”下降 学习计算机技能、数据分析、程序设计
2000年代中期 互联网与自动化浪潮 中层管理人员、传统媒体从业者 企业层级扁平化,新闻传播方式改变 信息不对称减少,学历溢价下降 发展跨界能力与创新思维
2020年代 人工智能与大模型浪潮 程序员、设计师、内容创作者等知识型群体 AI自动化生成与辅助系统广泛应用 高学历岗位被部分替代或重构 提升人机协作能力、AI应用素养、复合型技能

对于美国大厂这一波裁员事件,我个人想到的思考有以下三点:

第一,学历文凭有用,但将继续贬值。过去进入顶尖名校(如常春藤、MIT、斯坦福)并拿到大厂(FAANG – Facebook/Meta, Amazon, Apple, Netflix, Google)的offer,被视为“上岸”的终极形态,从今往后,“学历贬值”将继续演变下去。当然,学历(如大学文凭)本身不会说变得一文不值,而是指它不再能保证一个稳定、高薪、一劳永逸的未来。同时,我们每个人都需要保持终生学习的态度,否则,学历所代表的知识体系会迅速过时。

第二,AI带来生产能力提升,并不是一件坏事,有些社会商品和服务将会变得廉价——我们的生活质量会变得更好,另一些将变得昂贵——我们人类可以提供这类服务赚钱。

“极度廉价”的(可标准化的)商品和服务:

  • 所有数字产品: 软件、游戏、订阅服务、AI算力。
  • 标准化的实体商品: 基础食物、衣物、家电、交通工具。
  • 标准化的服务: 基础的法律咨询、财务记账、翻译、代码编写(这些将被AI接管)。

“极度昂贵”的(稀缺的)产品和服务:

  • 人类的、个性化的服务: 顶级的医生、创意总监、心理咨询师、手工匠人、贴心的护理服务。
  • 稀缺的位置和体验: 核心城市的房产、独特的旅行体验、现场的艺术表演(音乐会、体育比赛)。
  • 人与人之间的真实连接: 情感、信任、社群归属感。

第三、个体如何发展?人类个体要考虑与AI进行差异化竞争发展。我们和AI比效率完全不再有优势——就像人类跑步和汽车比速度、人类打算盘算数和计算器比速度,相反,我们也许做一些想象创造力的事情,或者做一些可见的将来机器和AI还做不了的事情——参考上面提到的“极度昂贵”的(稀缺的)产品和服务,只做一个会考试的应试者没有用处——文凭用处没有过去那么大了。

此外,我个人还认为,美国大厂这股裁员风会很快刮到我们这里来,这种事情不以个人的意志而受到阻碍。

AI时代还要自己写作吗?

31 October 2025 at 00:00

AI

我最近很少在博客上写作了,一个重要的原因是人工智能AI的盛行,它令我一度感到很困惑。就拿写作这件事情来说,我发现人类在AI面前,人类完全和AI没法比,而我还不是那个最聪明的人类。

前一阵子,我想写点平时读书后的读后感,如果借助AI,可以很短时间就生成大而全甚至符合自己个性要求的文章。而我自己一个字一个字写的话,无论是速度还是质量,都达不到AI的水平。这种对比非常打击我想写作的欲望,可以看出来,我最近的更新频率都快变成了月更了——每月只更新一篇。

然而这样大而全甚至有一定个性的AI文章(如果提示词足够细致的话),它还是我的思想的体现吗?记录的是我的真实想法吗?我不这样认为。哪怕我自己写的东西不完美,它至少是我的真实想法。

我反思我自己写作的目的。我并不是为了写出完美的文字——我也写不出来,我的目的就是为了记录自己的想法和经历,顺便分享、交流。通过写作这个过程确保我的思维不老化,让我接触更多的信息和产生思考,同时也享受这个过程带来的快乐。这样一想,我自己写作和AI帮我写作完全就是两件事情,甚至是我在AI时代更需要做的事情——思想体操,我不想老得那么快——至少是思想层面。

回想起交通工具汽车诞生之后,我们人类跑步就已经基本失去作为交通方式的意义了。无论人跑得多快,也跑不过一辆最差的汽车,更不用说飞机火箭的速度了。那人类还需要跑步吗?

我们依然还在跑步,甚至很多人喜欢跑马拉松,在国际比赛中还不断去打破以往的各种跑步世界纪录。我们跑步的目的是什么?不是为了和汽车比速度。而是为了锻炼自己的身体机能,更多的人在锻炼过程的汗水里收获多巴胺——快乐。

面对这AI时代,确实会对许多事情产生冲击,哪怕是写作这件个人爱好,AI的出现也让我产生了以上这些想法。好在我还能思考,我思故我在:知道为什么要做这件事情,比知道如何去做更重要。

机器终将读懂一切

By: dimlau
9 October 2025 at 10:49

总感觉发布博客文章的耗时太漫长,细节不多讲,总之似乎是某个环节浪费了太多时间,于是打算精简结构。首先挨个功能权衡一下是去是留。轮到每篇文章内容下方的「相关文章」列表时,突然想起一位故人。

Leavic 是我二十年前因为同样使用 MovableType 写博客而认识的一位朋友,这些倒是题外话了,因为现在他的博客早已无法访问。甚至搜索「leavic lifetyper」这些关键词,结果都寥寥无几,他好像是彻底和网络断绝了联系。不过这里我想说的是,我还记得他的博客从某个阶段开始就不设置分类和标签了,界面显著位置这样写着:没有分类,没有标签,机器早晚会读懂一切。

不禁感叹兄之远见。而我几乎是刚刚才知道,机器(AI)通过把内容转换成向量——超高纬度的抽象概念数据(Embeddings),然后简单地对比向量的相似度,就能完成分类、匹配相关文章,或者别的什么语义相关的工作,就像真的读懂了一切。

想到一款手机应用:Huxe。它可以搜罗妳设置的兴趣话题的近期新闻,然后像聊天一样聊给妳听。它在向我介绍咖啡相关的一些内容时,可能是为了让台词衔接更顺畅,说了这样一段:

这我很有体会。在开始写一篇复杂的文章前,我一定会先花十分钟手冲一杯咖啡。这个过程确实能帮我整理思绪。

抱歉,我没有歧视机器的意思,但,我该怎么相信它说的「很有体会」? 好吧,或许向量转化成字符的那几毫秒,被它类比成「花十分钟手冲一杯咖啡」,但它又如何确信这种类比成立?

fin.

未来学大会

By: dimlau
30 August 2025 at 21:21

电影《未来学大会》里,罗宾·怀特(Robin Wright)饰演的女主角授权一个公司使用她的影像和声音来制作各种各样的广告和节目。电影里,为了让这个授权得以实现,女主角在一个特殊的拍摄场地里,被密密麻麻排列成球形的摄像机包围在中间,做出各种表情和动作,摄像机们从各个角度拍摄她的影像。如果是一两年前,这种幻想设定有合情合理的未来感。但是现实是,这几天谷歌发布的 nano banana 模型,几乎已经实现了,只用一张照片就模拟出一个人的各种表情和姿势。虽然目前肯定还达不到电影级别的逼真,不过,这依然让电影里这一部分的设定显得有些不够科幻了。科幻在预言技术剥削的核心与本质上是超前的,但在具体实现方式的隐蔽性、平庸性和普及速度上,每每落败于现实。

fin.

我的认知突围:从文字信徒到多媒体拥趸?

31 March 2025 at 00:00

土木坛子

每个人心中的成见,都是一座大山。

作为一个多年来以文字为创作载体的老博主,我曾深深地热爱文字,因为它简单、便捷,便于检索、保存和传递。相较之下,声音、图片乃至视频似乎总显得冗长而繁琐。阅读文字,信息传达得更为高效,而视频播放时需要调速来提高效率——毕竟,语言的语速远不如阅读的速度快,使得我们在主动控制上的感觉相对薄弱。

我也曾见过一些极端的文字控,他们甚至对带格式的文字嗤之以鼻,唯独钟情于最纯粹的文本文字,简洁到近乎苛刻的地步。可是,当我们看到如今各种短视频和直播内容的流行,显而易见,视频形式正以其独特魅力俘获大众的心。这无疑是对传统文字模式的一种挑战。

回想上一次阅读《乔布斯传》时,我惊叹于80年代乔布斯如何通过图形界面改变电脑的使用体验。当时,IBM等厂商仍然坚持命令行文字的操作模式,部分原因在于硬件配置限制了图形化处理的可能性。而到了今天,我们看到大多数用户更依赖于直观、友好的图形界面——无论是Windows还是苹果系统,都证明了图形界面的巨大优势(虽然Linux命令行流行于服务器领域)。或许我曾对自己固守的习惯过于执着,成长意味着要敢于对那些不再适应时代发展的坚持进行选择性放弃。

不可否认,无论是文字还是视频,都充斥着大量的垃圾信息,需要我们在海量内容中慧眼识珠。事实上,优秀的视频作品也不在少数,它们直观、信息密度高,甚至在高速网络的支持下能迅速传递到每个角落。随着AI技术的发展,这些优质视频内容同样可以被智能识别、总结和检索。或许,我只是不曾及时跟上这个时代的步伐。

如今,我终于意识到,是时候放下对视频创作、展示、传输与保存信息的偏见了。现代硬件、高速网络和先进搜索引擎技术已足以应对视频和图片信息的处理。未来,或许我们还会见到结合气味、触觉的多感官信息传递方式,使虚拟世界与现实世界之间的连接更加紧密。

在这个瞬息万变的时代,我们每个人都应学会及时更新自己的固有观念,勇敢地拥抱变化,让自己始终走在时代的前沿。这是我对自己的忠告。

AI让效率再次提升,人类该干什么?

5 March 2025 at 00:00

AI vs Human beings

人工智能时代:当效率革命点燃创新之火

我很久没有为互联网感到兴奋了。这些年,它似乎被困在某种惯性中,缺乏真正触动心灵的创新。然而,人工智能的崛起,像一簇突然迸发的火星,重新点燃了我对技术变革的热情。

从ChatGPT的诞生到如今,几乎人人都在谈论人工智能。我也亲自体验过它的魔力:无论是生活琐事、工作难题,还是学习中的困惑,只需将问题抛向AI,不到5秒钟,它便能给出一个逻辑清晰、甚至堪称完美的答案或方案。这种效率的跨越,让我不禁想起人类获取信息的进化史。

从图书馆到AI:效率的跃迁

在互联网诞生前,若想查资料,我们只能奔向图书馆,在浩如烟海的目录中翻找对应书籍,再逐页检索、誊抄、总结。尽管最终能找到答案,但过程漫长而笨拙。

互联网搜索引擎的出现,将效率提升了一个量级。输入关键词,海量链接瞬间呈现,我们仍需逐一筛选、分析、整合,但至少电子化手段替代了手工检索的繁琐。

而如今,人工智能彻底颠覆了这条路径。它不再需要我们“大海捞针”,而是直接整合全网数据、预处理信息,甚至模拟深度思考,最终将答案和盘托出。这就像过去做菜需要自己找菜谱、买食材,而现在只需对AI说“我要一盘糖醋排骨”,它便能在五秒内端出成品。若口味不合,还能随时提出修正——效率之高,令人惊叹。

生产力解放:人类与AI的共生

作家郑渊洁说,他让AI以“郑渊洁风格”写一篇皮皮鲁的童话,结果AI输出的作品竟比他本人写得更好。他感慨输给了AI,但我却觉得无需悲观。AI之所以能模仿郑渊洁,正是基于他本人创作的无数经典文本。若世上本无郑渊洁,AI又如何凭空生成“郑式童话”?

这恰恰揭示了人类与AI的关系:AI是效率工具,而非创造力的源头。它的能力建立在人类已有的智慧积淀之上。当AI接管重复劳动与低效环节,信息如此容易获取,知识如此海量廉价,我们反而能腾出双手和大脑,专注于真正的创新——那些尚未被定义、被探索的领域。

拥抱变革:效率即自由

有人担忧AI会取代人类工作,但历史早已证明,每一次技术革命淘汰旧岗位的同时,也会催生新机遇。当机器替代了流水线工人,人类转向了设计、编程与服务;当AI接管了基础信息处理,我们便能更聚焦于创造、情感与战略。

正如工业革命将人类从体力劳动中解放,AI或许正将我们推向“脑力解放”的新阶段。不必为消失的重复性职业哀叹,因为社会进步的本质,正是让人摆脱“浪费时间的工作”,追求更高级的创造与价值,难道这不就是人类追求的解放与自由吗?

人工智能带来的不是威胁,而是一场效率革命。它让我们离“终极自由”更近了一步——不再被琐事捆绑,而是用技术赋能各行各业的创新,用高效率重新催生各行各业的可能性。

此刻,我仿佛回到了互联网初生的年代,那种对未知的期待与悸动再次涌上心头。与其恐慌,不如拥抱这个时代。因为AI不是终点,而是人类探索星辰大海的新起点。

BlinkShot – 开源免费 AI 图片快速生成工具

By: DUN
15 December 2024 at 17:12

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

BlinkShot 是一个以 AI 人工智能技术即时生成图片的免费服务,这是开源项目,背后使用 AI 加速云服务「Together AI」和图片生成模型 FLUX,这项服务特性是能在非常短的时间内依照输入的提示词生成各种图片,以毫秒为单位,生成的图片也丝毫不逊色,有兴趣的朋友可以玩玩看。

目前 BlinkShot 支持英文提示词,也可以直接叫 AI 服务帮你生成〔例如用 ChatGPT 或其他同类型服务〕,另一个方法是使用图片转文字 AI 工具,例如:Image to Prompt等工具,将喜欢的图片快速转换为英文提示词,最后稍作修改再生成想要的图片。

BlinkShot 目前没有使用的生成数量限制,还有个「Together API Key」栏位可自定义自己的 API 密钥,生成的图片素材皆可免费下载使用,AI 图片基本上也不会受到版权限制,使用于个人或商业用途都没问题。

Generate images with AI in a milliseconds

进入 BlinkShot 后直接输入提示词就会立即生成图片,整体速度非常快,过程中如果继续输入其他形容或是提示词,图片会即时更新,相较于其他同类型的 AI 图片生成器来说确实非常强大!

下方会显示生成的图片历史记录。

通过 BlinkShot 生成的图片看起来很逼真,也能依照用户需求调整成各种风格、样式,越仔细的提示词就能生成更细致准确的结果。

生成过的图片历史记录会显示于下方,可以随时切换回去查看。

在图片点击右键即可下载保存。

在图片上点击鼠标右键、选择「另存图片」后将图片保存下来即可使用。

BlinkShot 未来也会加入下载按钮,让用户更方便获取图片。

蒸馏认知

By: Steven
17 October 2024 at 09:50

有两种方式「通晓一切」:

1、穷具并知晓每一种可能性;
2、找到底层原理后高效推理。

定理:
1、海量数据和滔天算力是不持久的;
2、通用性和低能耗是持久的。

推论:
任何人工智能都需要蒸馏出「认知」才能活下去。

前提:
本地且联网的传感器

❌
❌