Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

在美国造 iPhone,根本不现实

By: 杜晨
10 April 2025 at 11:11

成百上千万美国人,进厂打螺丝。

很难想象吗?

在特朗普看来,这并非什么不可能任务。

近日,美国突然向全世界上几乎每一个国家发起关税战。对于中国来说,关税比例已经超过了 100%。

关税战可能意味着 iPhone 以后在中国不好生产了?没关系,美国早有对策。上周末,美国商务部长霍华德·拉特尼克在电视直播上发表了他的伟大计划:

成百上千万的美国人,进厂打螺丝,造 iPhone!这样的景象将会来到美国。很多工作将会被自动化,但美国的专业技能将会解决一切问题。我们将创造大量的机械工、空调技师、电工。美国的专业技能,美国的高中毕业生们,将会成为我们劳动力的核心,创造历史上最伟大的一次就业浪潮。高科技工厂将来到美国,而他们将加入这些工厂。

白宫发言人卡罗琳·莱维特也在回答记者问时表示:

(总统)认为美国拥有大量的劳动力,以及资源,来实现(在美国生产 iPhone)。

简直是计划通。但问题是,拉特尼克的设想,特朗普的这场「iPhone, Made in USA」的大梦,真的能实现吗?

今天的苹果,一手构建并运行着全世界最庞大、复杂,也最成功的供应链体系:将近 190 家已知、公开的供应商,遍布全世界 50 多个国家和地区。受雇于这些供应商并为苹果项目工作的人员数以百万计。但这些供应链,能够顺利地迁移到美国吗?

让我们来跟随 iPhone 手机从原材料到精炼,从组装到成品的整个过程,看看区区 iPhone,到底能不能美国制造?

原材料供应链,能「复制粘贴」吗?

手机没有电池不行,电池没有钴和锂不行。这里,我们先用 iPhone 电池所需的钴、锂这两种有色金属材料来举例。

根据苹果在官网公开的清单,该公司使用的几乎所有的钴、锂金属精炼厂都位于中国大陆。在大约 200 家精炼厂的供应商列表中,绝大多数位于世界其他国家和地区,只有 10% 位于美国,且苹果使用的美国精炼厂仅具有少量 3TG 精炼能力,不具备钴、锂精炼能力。

但根据美国官方公布的数据,美国本土的已探明钴矿储量只有 100 万吨左右,位于世界末位,且年产量极小。并且,美国本土没有一座能够具备电池级和航天级钴精炼能力的精炼厂。

世界钴矿储量最大的国家是刚果(金),最大的精炼钴国家是中国。这两个国家均受到本轮「自由日」关税的影响,中国的税率更是高达 104%。

锂矿资源方面,美国倒是储量丰富,目前世界排名第三。但美国本土锂资源开采控制极端严格,直到去年 10月才批准了过去 60 年以来的首座锂矿。至于精炼能力,电池级锂精炼厂在美国同样不存在。

美国缺乏电池这一 iPhone 最重要的元器件之一所需要的两种关键元素的原材料生产和精炼能力。这意味着苹果没有可能也没有理由在美国生产 iPhone 电池,就是这么简单。

如果仅从海外采购并在美国组装,可行性并没有提高多少。考虑到特朗普的「自由日」关税显著提高了苹果从海外采购有色金属/稀土元素原材料以及铸造精炼服务的难度,高昂的采购成本,加上本土的高人力、运营成本,将会显著提高最终的美产 iPhone 的价格,且产能难以爬坡。

电池重度依赖美国缺乏的稀土资源,而中国掌握全球稀土资源的极高话语权。事实上 iPhone 的电池几乎全部都在中国生产。如苹果被迫将 iPhone 电池生产转移到美国,进口稀土资源的难度将会显著增加,成本暴增。显然,将 iPhone 转移到美国生产来对抗中国产 iPhone 的 104% 关税是毫无财务意义的。

这还只是在说电池。其他的半导体元器件所需的关键材料,比如「3TG」(锡、钽、钨和金,),苹果采购来源多达 79 个国家和地区。其他稀土元素方面,苹果更是已经和中国、非洲、拉美等国家和地区供应链深度绑定。这些资源当中的大多数,美国本土都比较匮乏,也缺乏现成的开采和精炼基础设施,现有产能供应国内其他低需求产业略显勉强,无法达到苹果的需求量级,更无法和苹果的成本目标匹配。

美国不仅缺乏原材料,也缺乏完整的产业链。而中国拥有完整的电子产业集群,提供不限于芯片封装、屏幕、光学、电池等元器件在内的生产、制造、组装,以及开模、测试、物流等覆盖全链条的服务能力。

究其根本,作为一个系统设计复杂、元器件种类多样的高精密数码设备,iPhone 所需的原材料的供应链无法被轻易复制和粘贴。这不是一纸命令或者各式各样的补贴政策可以改变的。没有就是没有,巧妇难为无米之炊。

百万美国人进厂,靠谱吗?

第二次世界大战之后,中国百废待兴,选择了全球制造工厂的站位,并一直坚定站到了今天;而美国公司将低附加值的制造业离岸化,利用剪刀差获得了更高的利润,投入到创新研发、并购整合等再投资用途,进而制造更高附加值的商品,循环往复。

但在今天的全球化分工十字路口,甭管中国想怎样,反正美国是腻了。按照美国商务部长拉特尼克的说法,美国应该将这些低附加值的制造业回流。

与其将价值链上最前和最少的那一部分留给中、印、越,从而让美国跨国企业可以相对轻松地赚到链条后端的大钱——为什么不让美国公司和美国劳动力都更辛苦一点,但可以把整个价值链都留在本土呢?

好,百万美国人,像富士康厂弟厂妹们一样,进厂打螺丝吧。

用不了多久美国工厂主就会发现,用本土劳动力来土生产 iPhone,是一件完全不经济的事情

根据苹果官方发布的供应链报告,苹果供应链雇佣了上百万人。就以最大的组装商富士康的郑州工厂为例,为苹果产线工作的常态人数稳定在 20 万人左右(不一定全职苹果产线),而为新机出货爬坡准备的旺季人力可以轻易达到 30 万人。

近年来富士康苹果产线员工的月薪在 7000 元人民币上下浮动,即便加上旺季额外工资和返费等也并不高。而相比之下,2002 年数据显示美国「机械操作工」(machine operators,和富士康工厂装配工基本对等)的平均年薪是世界第二高达到了 3.25 万美元,折合人民币月薪高达 2 万元,仅次于德国,是富士康厂工的 2 倍还多。

也就是说,不考虑美国行会组织的阻扰、高强度和技能密集型人力资源的匮乏程度等诸多额外限制因素,就纯粹假设美国有一个大城市地区能够一夜之间提供数十万人进厂打螺丝,工资成本的增加也已经严重拉低了苹果的傲人的利润率。

而如果把额外限制因素纳入考虑,情况只会更加糟糕。

首先,美国缺乏高科技制造所需的技能密集型劳动力。在 iPhone 流水线上最需要的精密焊接组装等工作内容上,美国不但缺乏相关劳动力,也缺乏培训资源。

解决的办法是引进外部劳动力或者引进培训师。考虑到特朗普的「美国优先」大政策方向,引进外劳几乎没有可能。后者则更加复杂。

一方面,工厂需要快速招到足够多的人从而进行高效率的大批量培训,因为招聘进度决定培训进度,进而决定了产能和良率爬坡的进度。但在美国,恐怕没有城市能够复刻富士康在人口大省河南「一个周末招聘 5 万人」的招聘速度;另一方面,即便招到了人,培训的转化效率也是个大难题。苹果不可能在美国招到像在中国那样配合度高,工作勤恳的劳动力。

看看福耀玻璃就知道了。

奥巴马投拍过一部福耀玻璃在美国办厂的纪录片《美国工厂》,片中直观、详细地展示了创始人曹德旺从中国带去的熟练技师,面对拒绝「吃苦耐劳」的美国本地工人有多么无奈。怎么教都教不会、不愿意学,上不了一会班又被行会派来的人请去茶水零食招待。

前《美国在线》记者曾经探访福耀玻璃在美国的工厂,发现中国工人「一次扛三块挡风玻璃」,美国人一次只能扛一块;中国工人愿意每周工作六天,每天 12 小时,而美国工人每周能干满 40 小时就已经叫苦连连了,效率不及中国工人的一半。这位记者在 X 上直言不讳:

你算算 iPhone 在美国制造,成本要多少?

如果福耀玻璃美国工厂这样一个相对低技术要求的项目的失败还不能让人信服,那么不妨直接看看苹果和老朋友富士康自己的试错经历。

苹果曾经宣称 Mac Pro 在美国组装(不是制造),然而这个和 iPhone 相比已然是庞然大物的机型,在美国组装的过程中仍然难免受到供应链不足和劳动力短缺的影响,结果苹果被迫将部分组装工作转移到中国;富士康曾经在美国威斯康辛州做了一个「AI+5G+8K」的梦,打算在这里投资兴建一家全世界最顶级的 LCD 工厂,然而即使拿到了数十亿美元的投资和补贴,最终还是梦碎——富士康在本地聘请的一位高管直言:问题在于技术工人短缺。

但如果按照充分利用工业自动化的魔法,让美国工厂可以在高技术/经验工人暂时短缺的情况下也能够顺利生产,这种方式可行吗?

The Information 曾有一篇报道,提到苹果计划逐渐削减供应链装配工数量,到 2030 年实现减半。今年 2 月,苹果 CEO 蒂姆·库克还官宣将在未来 4 年内在美国本土追加高达 5000 亿美元的投资,其中包括在得克萨斯州兴建一座总面积超过 2.3 万平方米的新工厂,用于生产 Apple 智能背后的私有云计算服务器,能创造 2 万个本土岗位。

然而一个摆在眼前的大难题是,特朗普在 4 月上旬先后多次提出、取消、再追加新的关税,对于包括苹果在内的任何一家希望在美国投资办厂的企业来说,带来了巨大的不确定性。对于 iPhone 这样的高精密电子设备,其生产所需的机械装备主要来自中国和欧洲。而这两个国家和地区在本轮「自由日」关税战中得到的税率也是最高的。

关税暴增,使得工厂主无法用合理的落地价格采购成套的自动化生产解决方案和组装机械所需的零部件。机器变贵,自动化的难度只增不减,意味着苹果以及其他生产商们要么花费更高的成本购买机器,承受更长的回本周期,要么被迫回落到对于传统人工装配的模式——无论怎么做,都无法实践特朗普的承诺,这个道理不难理解。

彭博社近日采访了美国供应链管理和物流服务巨头 Flexport 公司的 CEO 瑞安·彼得森,他在节目中提到美国的工厂需要来自其他国家的机器和零部件才能正常运转。而机器变贵等于生产变少。

反观中国呢?相当多人们还以为苹果的 iPhone 供应链在中国能够成功仅是因为劳动力成本低,实际上这个观念早已过时。库克早在 2017 年就说过:

中国早已不再是低劳动力成本的国家……(苹果的供应链)选择中国的原因在于技术能力,技术类型,以及掌握这些技术能力和类型的工人的密集性。我们的产品需要先进的材料加工、先进的机械工具 (tooling)、极高的精度,而中国的工程能力非常深厚。好比在美国,你想要找所有的 tooling 工程师,我不确定能够装满一个房间——然而在中国,你可以装满好几个球场。

结果就是,机械工具、技术工人、供应链支援等各种苹果生产 iPhone 所需的生产要素在中国已然齐备。再这样的前提下还要强行制造业回流到美国,可以说没有困难也要制造困难了。

制造 iPhone 背后,到底意味着什么

最后我想讨论两个东西。

第一个是:苹果,以及以苹果为代表的美国跨国高技术公司,过去一直以来做的是什么?

其实前一小节其实已经简单提到。无论是苹果在中国生产 iPhone,抑或是美国化工巨头从加拿大进口石油进行精炼,生产出更高附加价值的产品再出售给加拿大以及其他国家,底层逻辑都是一样的:

美国跨国公司将低附加值的制造工序转移到海外,利用劳动力价差来赚取足够高的利润率,然后再将利润投入到技术创新研发、收并购等行业横向/供应链纵向的整合,不断开发出更新更高科技的产品,继续交给离岸国家生产,赚取更高的利润。自从 iPhone 发布以来,苹果用了 20 年构建维持了现在这个巨大的优势供应链,把高研发-高利润率的雪球滚起来。

这个过程中离岸制造商和它们的国家并非一直被利用和收割,而是也吃到了技术创新结果的下放和滴漏效应。但无论如何,这个过程中美国和美国跨国公司斩获了绝大部分的价值链,是毫无疑问的赢家。

然而在全球化的信念早已破产的今天,似乎美国已经不再认可共赢,而是只有自己赢才是真的赢。必须所有的价值链都在自己手上。肥水不流外人田。

但是,代价是什么呢?

通过本文的 iPhone 例子,强行将一个高附加值产品生产过程中的低附加值阶段回流到美国,意味着美国跨国公司将痛失利润率。而利润降低,意味着研发等增长驱动型再投资活动也将降低,进而干扰创新发生的节奏。这无论对于美国还是它的最大贸易伙伴和中国,都不是件好事。不顾一切出拳,只会把暴露更多的弱点。

第二个想讨论的东西,是另一支人们没太关注到的「美国生产手机前辈」。

2017 年,一个名叫 Purism 的美国团队发起众筹,宣布要独立制造一款不受任何巨头控制,注重安全和隐私的手机。再后来,这个项目的画风逐渐离谱,团队开始大张旗鼓地宣传手机完全在美国本土制造。

最后,这支名叫 Liberty Phone 的手机,在原定交付延迟了整整一年多之后,终于磕磕绊绊地问世,售价高达 2000 美元,而且采用的配置性能极其落后,甚至低于项目在 2017 年宣布时的同期中端机水平——5.7 英寸的 720P 屏幕、4GB RAM+128GB ROM、非主流的 NXP 处理器。即便如此,即便宣传「美国制造」,手机内相当大比例的零部件仍然不可避免从中国和越南采购。

一支美国生产的 iPhone,或许从配置和体验上不会比 Liberty Phone 糟糕。至少苹果无论放弃什么都不会放弃引以为豪的体验。然而考虑到这家公司对利润率的极致追求(不只是单纯的营利性,也出于确保研发的动机),iPhone made in USA 的价格,应该不会太美丽。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AI 不是来当员工,而是来当老板的| 46 个 AI「金句」

By: 杜晨
4 April 2025 at 19:18

毫无疑问,我们处在一个 AI 的大变革时代。

每天都有新的 Agent 发布,新的模型开源。每天都有小 AI 公司正在变成巨头,而巨头们也在拿到越来越多的,甚至令人难以置信的钱。

或兴奋,或恐惧,或担忧。在所有的大变革时代,我们都难免多想。

在中国,APPSO 关注 AI 的同事们经常因为大洋彼岸的新闻而「夜半惊醒——而在美国,看起来从业者们也同样会因为 AI 的日新月异而睡不着觉。

投资网红 Greg Isenberg 就是一个经常多想、辗转反侧的人。他参与创办了上百个项目,目前是投资机构 Late Checkout 的 CEO 和 The Startup Ideas 播客的主播。

昨天,Isenberg 在他的 X 账号上发布了一条长文,说自己半夜睡不着,想出了 46 条和 AI 有关的「金句」。

其中大部分是他的个人观点,甚是有趣。我们将这条长文编译分享出来,并且展开聊聊其中的部分思考。

原文地址🔗

1. GPT-4o 的图像生成功能与 ChatGPT 发布一样震撼,将会催生上千个百万至亿级美元的垂直领域软件商机。

chatgpt 4o image gen is as big as the chatgpt launch. probably will birth 1000+ $1-$100m/year vertical software businesses.

2. 当前的 AI 生成内容,就像数字音乐早期的「MP3-Napster」时代。数百万创作者并没有意识到,他们的作品未来将成为打败他们的武器。

we’re in the “mp3 napster era” of content. millions of creators don’t realize their entire back catalog is being weaponized into their competition because of AI. 

3. 在三年内,日历、邮件和 CRM 工具将经历根本性重构——不是渐进式的AI升级,而是范式级的重新设计。

every calendar, inbox, and CRM will be rebuilt from scratch in the next 3 years. not “AI-enhanced,” fully rethought.

4. AI 不是来当员工,而是来当老板的!首批具备管理人类能力的 AI 系统将彻底重构劳动力市场,其影响力将远超工业革命。

i thought ai was creating digital employees. but it’s more like digital employers. the first ai systems that can manage human workers will cause a restructuring of labor markets more significant than the industrial revolution.

5. 如果你的工作是招聘人→训练系统→系统替代人去做招聘工作,那么你不是 HR,而是一个程序员,正在编写卸载自己的程序。

if your job is interviewing people who will train ai systems that will replace people who do interviews, you’re just a step in a weird recursive extinction.

6. AI 将难以规模化的服务生意,转变为兼具产品利润和服务溢价的新生意。能用 AI 做 80% 工作的产品化解决方案,将成为新的独角兽企业。

ai is turning “service businesses that don’t scale” into “product businesses with service margins.” the new unicorns will be productized services with ai doing 80% of the work.

7. 不要痴迷于打磨产品。社群运营更难,更决定生死。大部分创业公司死掉是因为没人在乎。

building communities is harder than building products but everyone pretends it’s the reverse. the reality is most startups fail because nobody cares.

8. 威尔·史密斯吃意面?那是 739 天前的 AI 水平。想象一下再过 739 天,生成式 AI 会进化到什么程度?

it’s been 739 days since the will smith spaghetti video. imagine what could happen to gen ai in 739 more days?

APPSO 的延展思考:在图像/视频的生成式 AI 方向,上一次重大破圈事件是3 月的「OpenAI 吉卜力风格迁移生成」,而两年前的威尔·史密斯吃意面是上上次。

这两次事件有异同之处:相同的是都和知名文化现象/符号有关,从而很容易地导致了破圈;不同则在于最初版本的吃意面视频过于粗糙,十分「魔性」。这种失真感不但没有影响人们对 AI 强大的预期,反而显著加强了这个梗的病毒传播。

9. 开发 AI 助理的人,大多没用过真人助理。真正的助理懂背景、记历史、重关系——而 95% 的聊天机器人,三者皆无。

people building “ai assistants” have never actually had assistants. real assistants need context, history, and relationship. 95% of chatbots have none of those.

APPSO 的延展思考:不需要用过助理,大多数用户已经觉得 AI 助理很蠢了。有给它交代上下文、打磨提示的工夫,还不如自己去干了。

10. 3年内,连最高级的客诉处理都将被 AI 取代,包括你现在认为必须人工的复杂客诉。

most customer support will be automated within 36 months. not just tier 1 tickets, complex, multi-step resolution that previously required senior support staff.

11. 创业最危险的结局不是归零,而是被卡在「生存线」上——足够温饱,永远不够自由。该止损还是加注?我总在思考这个困境。

the worst thing that can happen to your startup is mediocre success. enough to keep you going but not enough to change your life. most founders are trapped there. thinking about this a lot with respect to shutting down or doubling down on projects. 

12. 反抗AI的不只是失业者——每个发现自己的数字痕迹被擅自用作AI养料的人,都会加入抵抗。

the ai backlash won’t just come from replaced workers, it’ll be from everyone who realizes their entire digital identity is being converted into training data without consent. 

13. 没人会看用户条款。

no one has ever read a terms of service ever

14. AI 真正的颠覆在于「草图经济」:设计无门槛,审美和创意才是硬通货。

the “sketching economy” is the real ai revolution. when anyone can turn rough sketches into production-ready designs, taste and ideation become the only scarce resources. 

APPSO 的延展思考:作为文字和视觉的工作者,APPSO 对于这一观点深深赞同。AI 能生成看起来非常有「思考」味和「设计」感的内容,用于非严肃场景是可以的,一旦放在商业和专业场景,生成结果的破绽,以及审美的同质化、大中华是个很大的问题。

究其根本,审美和创意是一种非常「个人化」和「人性化」的概念。创作是创作者个人的行为,但也是和观者的一次交流。这种交流需要双方有着类似的人生经验、相近的认知水平。

一种极端但往往正确的观点是:大众的审美水平永远趋向降低。所以真正的审美和创意一定会成为稀缺资源。

看看现实吧,AI 并不是取代了能深度思考的人,而是让本来就懒得深度思考的人更不需要思考了。审美和创意也是一样,AI 在这方面的能力,只会让更多人彻底失去掌握这些能力的必要。

15. AI 创业的真金白银,藏在吃透行业痛点的垂直应用里——不是在提示里加两个行业黑话就行的。

i dont know how else to say it, the money (and opportunity for the avg joe) is in ai startups is in vertical-specific applications that actually understand industry context. no, adding industry terms to your prompts isn’t the same thing. 

16. 消费移动设备又复兴了。从桌面→移动→AI 优先,我们已进入 AI 原生时代——下一批独角兽,必是深度整合 AI 的移动应用。

consumer mobile is back in full swing. we went from desktop-first apps to mobile-first apps to now ai-first mobile apps. the next wave of $100m/year apps will start mobile-first with ai baked in from day one. 

17. AI 「套壳」大战才刚打响。介于底层大模型和终端行业之间的中间商,将收割最大红利。而模型和行业应用本身终将沦为廉价商品。

the ai middleman boom is just starting. companies that sit between foundation models and specific industries will capture most of the value while both ends get commoditized. 

APPSO 的延展思考:这个观点很有趣,但也有一定的讨论空间。行业里有另一种主流观点,和它几乎完全相反:未来所有的模型都将产品化,而 wrapper 等纯工程层面的公司,不会比真正掌握底座大模型研发能力的公司走得更远。因为工程能力谁都可以拥有,但买得起卡,训练的起大模型才是真正的杀手锏?

当然,这两种观点都比较极限。现实很有可能是折中的。即便大模型公司有再多的钱,它也不会比小公司小团队更敏捷、更理解所处的垂直行业。千行百业不能一家独霸,大概就是这个道理。

18. 我们正在目睹新工种的诞生:AI 流程设计师将成为新一代金领,专精于把人类流程转化为 AI 增强的工作流。

we’re witnessing the birth of a whole new job category: ai workflow designers. people who can map human processes into ai-augmented workflows will be the highest-paid consultants of the next decade. 

19. AI 加速「赢家通吃」的局面:垂直行业的龙头之争,窗口期仅 6-12 个月,错过即出局,要么再等十年。想到这我彻底失眠了😂

ai is creating winner-take-most markets overnight. the window to establish yourself as the go-to solution in a specific vertical is maybe 6-12 months before it closes for a decade. this isn’t helping my sleep lollll. 

20. 创业金点子:用AI重塑传统行业产品——这就是你的杀手锏。找一个已被验证的非 AI 产品,用 AI 思维彻底重构,再找行业 KOL 引爆卖点。这把稳赢。

really smart strategy to rebuild traditional products with ai as your unfair advantage, hiding the complexity behind familiar interfaces. basically, just look at proven apps that have no ai, make them ai-first (if it adds a ton of value to end customer). use ai features (don’t sell ai) in creator-led marketing. this is the playbook. 

21. 直达用户的渠道是唯一的护城河。你的产品、技术、团队都可以被复制,渠道不能。

distribution is the only moat left. your product, tech, and team can all be replicated. your direct connection to customers cannot. 

22. 临界点就快到了:对小企业而言,定制 AI 工具将比雇佣员工更划算。

we’ll soon hit the tipping point where custom ai tools are cheaper than hiring humans, even for small businesses. 

23. 很少有人在讨论这件事:AI 正让曾经「无人问津」的企业变得抢手。当业务能自动化运转时,收购逻辑也变了,投资人会追逐那些「买来就能自动赚钱」的公司。

nobody’s talking about how ai is making previously “un-acquirable” businesses suddenly attractive targets. when you can automate operations, the owner-dependent business problem disappears. 

24. 续上条:即将到来的中小企业收购潮,会比 2021 年的科技泡沫更夸张。当 AI 把运营成本砍掉了 60%,小企业会成为现金流机器。

the coming smb acquisition frenzy will make the 2021 tech bubble look tame. when ai drops operating costs by 60%, every small business becomes a cash flow engine. 

25. 如果「氛围编程」(AI 写代码)是一个千亿美元的机会的话,那么「氛围营销」的市场会有多大?。

if vibe coding will be a $100B opportunity, how big of an opportunity is vibe marketing? (you can follow my co-founder @boringmarketer for more on that) 

APPSO 的延展思考:上面这几条和中小企业、创业方向有关的思考都非常值得参考。当然不是说直接跟着他走,而是如果你的企业正好符合他的描述,你应该考虑更积极地拥抱 AI,探索 AI 工具和自动化能否为你提高效率,甚至让你可以对行业里的既得利益者和巨头们发起挑战。

当然,不要因为过度使用 AI 而让你的核心员工和老员工们对你失望。如果你因为 AI 逆天改命,也应该让他们从中分得一杯羹。

26. 游戏工作室将会两极分化:一边是 AI 智能体驱动的「内容农场永动机」,可以批量生成无限的素材;另一边是专注核心玩法的「精品工作室」。无法转型的中间层将被淘汰。

Video game studios will separate into two distinct types: agent-driven content farms that generate infinite assets, and boutique studios focused on core mechanics. The middle will disappear entirely.

APPSO 的延展思考:看看过去几年最受欢迎的游戏和背后的工作室就知道了。前者是你在短视频里经常见到的那种,素材千变万化但机制万变不离其宗的放置、射击,以及羊了个羊等消消乐类,杀时间的游戏。它们不招你待见,但市场巨大。后者是小岛的《死亡搁浅》、战马的《天国:拯救》、雾影的《二人成行》等发布即封神的大作,也是《Only Up!》、《Getting Over it with Bennett Foddy》、《Get To Work》这样的机制魔性、折磨到让人砸手柄的独立游戏。

27. 企业可能更愿意花每月几十美元订阅 AI 工具无限生成素材,而不是 2000 美元/天雇一个商业摄影师。商业摄影赛道凉凉。

Corporate photography is effectively dead. No company will pay $2K for a stock-style photoshoot when they can generate unlimited perfectly on-brand imagery for the cost of a subscription. 

28. AI 能够颠覆企业销售模式:它能精准识别最佳销售时机,锁定买家,并自动触发销售流程。

enterprise sales is being completely inverted by ai. using ai to identify exactly when and how to talk to the right buyer, and set off automations. ill probably talk about this more on a pod soon. 

29. 我在思考:AGI 是否会从相互连接的智能体网络中「涌现」出来?这些智能体网络可能自己涌现出意料之外的特性,而我们正在不知不觉中构建着它们的「神经网络」。

i wonder if AGI will emerge from interconnected agent networks that develop emergent properties nobody designed? we’re building the neural connections without realizing it. 

30. 虽然生成式 AI 看似将成就万亿级市场,真正的「隐形金矿」其实在预测式 AI 领域。预知未来的价值,永远高于创造内容。

while genai looks to be the $1T category, many quiet fortunes will be built in predictive ai. knowing what will happen is more valuable than generating new content. 

APPSO 的延展思考:目前的生成式 AI,生成的是它自己认为将会发生的东西。基于大语言模型的 AI 会遵循文本的规则和概率的规则。而预测式 AI(比如天气、地质、金融、社会工程学的垂类 AI)需要遵循现实规则。后者是不是大语言模型,也说不定,可能是基于,或者从大语言模型精修特调的的专家模型。

当然,如果大语言模型发展太快、太普及,甚至成为实际的权威和统治者——那么将会发生什么,也是大语言模型说了算……

31.所谓的「AI 泡沫」,不过是 VC 们因为分不清 API wrapper 和真·创新而交的学费。

the “ai bubble” is actually an excise tax on vcs who can’t tell the difference between genuine innovation and repackaged openai apis. 

32. 人机交互即将迎来「人格化革命」。当每个工具都能与你对话时,AI 的氛围和腔调,将会决定用户信任、忠诚、留存率。

interfaces will become personalities. when every tool can talk back, vibe and tone will drive trust, loyalty, and retention. It’s why I’m investing more in our design firm for the AI age @meetLCA (you can follow for more insights on designing/taste/brand that will stand out) 

33. AI 将杀死传统首页。未来的入口界面会因人而异、因需而变、因时而动。

ai will kill the homepage. interfaces will get replaced by entry points that change based on who you are, what you need, and when you show up. 

34. 用户不为「AI」买单,只为结果付费。

no one will pay for “ai”, they’ll pay to solve a $10,000/hour problem in 3 clicks. sell outcomes, hide the ai. 

35. Google 的万亿帝国可能被 AI 拆解:旅游搜索、商品比价、本地服务等等,每个细分领域都是待掘的金矿。

ai is unbundling google. every vertical search engine, directory, and comparison tool is a billion-dollar opportunity in disguise. 

36. 未来的小企业标准配置:1个创始人+5个 AI 员工组成的「影子团队」,自动搞定财务、销售、营销全流程。

every small business will get a “ghost team.” automated bookkeepers, sales agents, marketers—run by one founder and 5 bots. 

37. AI 生成内容导致了文化的同质化危机,当全球共享同一套模型,我们得到的将是无限重复的「数字回声」。具有原创性人类思考将会成为最终级的附加值。怪异会成为卖点,请保持怪异。

ai-generated content is creating a monoculture of ideas. when everyone uses the same models, we get the same outputs. original human thinking is becoming the ultimate premium. be weird. weird will sell. 

APPSO 的延展思考:不只人过度依赖 AI,就连 AI 自己也在不断加强对自己的依赖。

机器学习的经验指出,过度依赖生成的数据再次训练,有可能会发生「过拟合」现象 (overfitting),甚至导致模型工作机制熵增,使得生成的结果变得更加不可靠,违背常理,失去代表性。

这可以类比为生物学上的近亲繁殖,对同族遗传资源(基因/数据)的过度利用,更有可能导致错误的因素在生成结果中纯合。只是这种 AI 的「近亲繁殖」结果不像生物学那么容易一眼看出来。事实上大部分人不具备分辨能力,而这会导致 AI 生成的错误结果被更多采纳和再利用,最终形成一种脱离现实的逻辑闭环。

38. AI  不会颠覆学校,而是实现教育的「去中介化」。未来的神童们将绕过传统教育体系,通过直接获取受众、实践验证的方式来快速成长。今天的孩子都当 KOL,而创业者才会是 Z 世代孩子的理想职业。

schools won’t be disrupted by ai. they’ll be disintermediated. smart teens will skip formal education, build audiences, run experiments, and learn faster. kids say they want to become creators but creators are becoming entrepreneurs. entrepreneurship becomes the most popular profession. 

39. AI 创业泡沫的结果:18 个月后,八成的 AI 创业公司将会像劣质小广告一样无人搭理,而剩下的两成会晋升为数字基建。

in 18 months, 80% of the “ai startup” category will look like spam. the rest will become infrastructure. 

40. A/B 测试没意义了。当 AI 能在一夜之间完成200次迭代实验,何必再争论一个按钮该用什么颜色?

conversion rate product debates are obsolete. Why argue over 2 button colors when AI focus groups can test 200 variations overnight? 

41. 传统营销即将被 AI 接管,营销专员必须向上游迁移。讲述品牌故事、营造独特氛围、传递品牌能量——才是未来营销人的核心竞争力。

most of what we call “marketing” is about to be done by ai. humans will move upstream into storytelling, vibes, and brand energy. 

42. 今年最明智的招聘策略?聘请一位 AI 运营总监,一个能搭建 AI 工作流、整合工具链,并交付实际成果的人才。

the best hiring decision you can make this year? a head of ai ops. someone who can build workflows, glue tools, and ship outcomes. 

43. 第一头估值十亿的 AGI 独角兽,初看必定像个玩具。所有改变世界的东西都是这样。

the first $1b AGI startup will look like a toy at first. all world-changing interfaces do.

APPSO 的延展思考:忘了哪个投资人好像说过类似的话。

「当你的孩子拿着一个玩具说它什么都懂的时候,赶快查查背后公司的估值。」

44. AI 驱动的渠道大于 AI 驱动的产品。二流产品一流分发,好过无人问津的一流产品。AI 驱动的分发能力 > AI驱动的产品力。在注意力经济时代,二流产品加上顶级流量 > 顶级产品却没有流量。

ai-powered distribution > ai-powered product. a mid product with elite reach will beat a great product with no attention every time. 

45. 用户对订阅制的反感仍然存在,而为有效结果付费的模式尚处于蓝海。率先采用后者的企业将获得碾压传统 SaaS 巨头的绝对优势。

people still hate monthly subscriptions. outcome-based pricing is still in early days. implementing this will be a competitive advantage for lots of companies. large saas wont be able to compete with you. 

46. 我们正处在商业规则全面重写的黄金时代,它会持续多久我不清楚。但明确的是:那些率先驾驭新工具、构建受众社群的人,拥有绝对竞争优势。

i don’t know how long this window stays open, but we’re in a moment where all the rules of building businesses are being rewritten. for the people playing with these new tools, creating audiences and communities, you’ve got an unfair advantage. 

 

写在最后:

生前何必久睡,死后自会长眠?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测有沉思能力的智谱 AutoGLM ,我们离会思考的 agent 又近了一步

By: 杜晨
31 March 2025 at 13:00

如果有一个会思考但是不会做事的 AI

还有会做事但是不会思考的 AI。

 

你会选哪个?

如果让我来选,我会说:why not both?

今天在中关村论坛智谱 Open Day 上,智谱发布了 AutoGLM 沉思——首个带有沉思能力的桌面端 agent。

这是第一个存在于电脑桌面的,能先思考在做事,且做的过程中不断思考的 agent。

抛给它一个问题,它会逐步分解问题,然后在你面前(或者你不看着它也行)打开一个又一个浏览器标签页,自己上去搜索、查找、记录、汇总、分析信息,最终为你生成一份经过充分查证和深度思考的结果报告。

如果你还不知道这是个什么东西,简单前情提要一下:

AutoGLM 是智谱推出的 Agent 产品,能够实现对手机屏幕和电脑浏览器的操作。重点在于实现方式是前台的图形界面 (GUI),而不是后台的应用接口 (API)。你可以理解为 AutoGLM 学习人类通过「手眼并用」的方式,直接在用户界面上进行操作。这和市面上绝大多数基于 API 的 agent 产品有着明显的交互方式区别。

而沉思能力,正如字面意思,让 AI 可以一边想、一边搜,自主解决开放式的、训练语料不包含的问题,模仿深度思考和展现深度研究的能力。智谱在今年 3 月初拿到新一轮融资的时候就对外预告正在研发沉思,而这个功能的开关也已经在该公司开发的「智谱清言」(ChatGLM) 大模型产品里上线了。

而在 AutoGLM 沉思的身上,智谱独特的 GUI agent 功能,和人们最追捧和爱用的沉思能力,终于实现了融合。

AutoGLM 沉思背后的模型基座,也在本次 Open Day 上正式发布:

GLM-4-Air-0414 基座模型,具有 320 亿参数量,但性能足以对标 DeepSeek-V3、R1 (670B)、Qwen 2.5-Max 等更大参数量的模型。

因为参数量更少,GLM-4-Air0414 可以快速执行 agent 类工作,为 agent 的能力提升以及大规模落地应用提供基础,也一定程度上确保了终端用户的试用体验。

智谱还发布了 GLM-Z1-Air 推理模型,相比 DeepSeek-R1(激活 37B)推理速度提升了 8 倍,而成本降低到只有后者的三十分之一。

这也是一个可以在消费级显卡上运行的推理模型,能够显著提高开发者的使用体验。

智谱还基于 GLM-Z1 模型,使用自进化强化学习方式,训练了一个新的沉思模型 GLM-Z1-Rumination,能够实时联网搜索、动态调用工具,深度分析和自我验证。这个沉思模型能够自主理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更具可靠性与实用性。

也就是说:AutoGLM 沉思的基础模型架构是这样的:

中层推理和沉思模型 GLM-Z1-Air、GLM-Z1-Rumination

+

底层语言模型 GLM-4-Air-0414

加上工程/产品层的 AutoGLM 工具,就形成了 AutoGLM 沉思的整个技术栈。

智谱也计划在 4 月 14 日正式开源 AutoGLM 沉思背后的所有模型。

此前智谱曾分享过团队对于 AGI 路线图的判断:如果用自动驾驶层级打比方的话,目前大模型产品大体上获得了自我学习的能力,接近于 L3;而沉思、反思、自我批评等能力则是 L4 阶段。

需要注意的是,目前 AutoGLM 沉思还处于 beta 测试阶段。上个周末,APPSO 深度使用了这个产品。从测试结果来看,它在处理复杂工作上的效果确有提高的空间,底层逻辑也需要优化,但作为一个非常新颖的大模型-agent 产品,总体效果已经令人惊艳。

智谱已经踏入了大模型 agent 的 L4 阶段,虽然只是进来了半只脚。

目前 AutoGLM 的沉思功能,目前已经正式上线智谱清言网页端、PC 端和手机 App,免费、不限量地开放。

附上体验🔗

https://autoglm-research.zhipuai.cn/?channel=chatglm#get_started

 

当 Agent 有了沉思能力,AI 终于学会自己干活了?

去年 Anthropic 发布了「Computer Use」,同时展现了足够的模型能力以及较强的设备交互能力,让 agent(智能体)的设想终于首次得到实践。今年 1 月,Anthropic 在美国的最大对手 OpenAI 也通过新产品 Operator,做出对于 GUI agent 理念的演绎。

也是在去年 10 月,智谱和 Anthropic 几乎同时发布了各自在 agent 方向上的最新尝试。智谱的 AutoGLM 是第一家国内机构推出的基于 GUI 的 agent。

而今天的 AutoGLM 沉思,不仅将 agent 的执行任务能力带到了桌面端,更是把工具操作能力、深度研究能力、推理能力和大预言能力进行了首次融合。

这种多重能力驱动的 agent,非常适合信息检索、提炼、汇总型任务。

这就好比是让 agent「开车」,过去你得给他一辆车,教他方向盘、油门刹车、档位怎么用,甚至告诉它开车和倒车的时候分别要往哪看——而现在,agent 已经可以「自动驾驶」了。

让它制作一份「不同于网上所有主流路线的日本两周小众经典行攻略,要求绝对不去最火的目的地,要小众景点,但也要评价比较好的。」

AutoGLM 沉思比较准确地拆解了需求,思考逻辑也比较清楚:它首先去搜了最简单的关键词「日本旅游」,了解主流路线和景点,然后又去搜索了「日本小众旅游景点」之类的关键词——通过这几个步骤,它在本次对话的记忆内部构建了一个知识库,也即什么是主流的,什么是小众的。

这个任务总共做了 20 多次思考。有时候几次思考之间会有重复,比如搜索的是相同的关键词,访问了相同或者相似的链接等。这有可能是因为单次搜索到的信息不足够,毕竟沉思/深度搜索的本质其实也是不断地自我怀疑和推翻,直到达到足够置信度时候才进入下一步。

APPSO 还注意到它会过度依赖特定的网站作为信息来源,打开的所有 tab 里有 90% 都是小红书和知乎(各一半左右)。反而真正的旅行专业资料库,比如马蜂窝、穷游,或者哪怕是 OTA 平台,它一次没用过。

如果要做一份真正的小众攻略,重度依赖小红书的结果可能并不理想。毕竟能上小红书的热门笔记,这个景点应该并不真的小众。一个真正的小众景点旅行者,恐怕不想去 momo 们已经去过或者都想去的地方……

APPSO 注意到,AutoGLM 沉思在沉思过后自己提出了「路线规划合理,不要有无意义的反折」、「行程节奏合理,别太特种兵」之类的要求。

只是实际结果没有完美体现它自己提出的这些要求:比如头几天在濑户内海来回折返,有时候一天内去两三个相隔一小时以上的地点,略微特种兵;第二周从青森向南到仙台,然后又从仙台飞机向北大跨度飞到了北海道,并且北海道只留了两天。考虑到日本大跨度旅行基本都靠 JR,票价昂贵,合理的路线应该是顺着一个方向不回头,除非不得不去大城市换车,一般不应该折返。

但总体来讲,这份攻略是有效的:它呈现了一些提问者未曾考虑过的目的地,也试图在一次行程里去到季节、气候、风格完全不一样的地方(而不是围在大东京、富士山、京坂奈区域来回打转)。

从这个角度,它遵循了提示的要求,并且展现出了深度思考的结果。

就像你不应该直接把 AI 生成的结果直接拿去用一样,这份攻略提供了一个还算不错的基础,让旅行者可以自行优化具体的目的地、路线和中间的交通方式。旅行不只是上车睡觉下车拍照,还应该兼顾人文和自然,深入当地文化传统,探索自然景观,以及至少感受一把在地最有特色的体验项目。

只要你的期待不是即问即用,AutoGLM 沉思给出的答案是足够令人满意的。

点击查看智谱清言的回答 https://chatglm.cn/share/FQoLp

考虑到 AutoGLM 沉思与其它深度思考型大模型最大的特别之处在于浏览器的操控能力,APPSO 也更深入和严苛地测试了一下他的 browser use 能力。

让它做一份关于科创板云计算公司的研报,看看结果怎么样。

正如前一次做旅行攻略一样,AutoGLM 沉思的「思考过程」是没有任何问题的。从下图中可以看到,它:

  1. 准确拆解了筛选条件,
  2. 明确需要多轮搜索和迭代,
  3. 制定了分步骤的计划,
  4. 通过「一般搜索」找到了大概的搜索目标
  5. 开始执行分步操作

但是 browser use 的过程实在让人有点抓头:AutoGLM 工具一次又一次地试图打开证监会指定的信息披露网站(巨潮资讯),解析网页的信息。它顺利地找到了网站数据库的条件筛选工具,但经常无法正常筛选,要么选不好时间区间,要么找不到对应板块的下拉菜单在哪。

APPSO 观察到,AutoGLM 沉思给每一步骤的定时通常是 3 分 20 秒左右,但如果访问网站不顺利,就会因为操作超时而导致「本轮思考」失败。

另外,根据 APPSO 之前体验去年的 AutoGLM 以及其它 GUI agent 产品的经验,当需要用户进行登录操作、输入付款信息、点击发送按钮这种敏感性操作时,agent 可以停下来等待用户操作。而在使用 AutoGLM 沉思的过程中,它的确可以等候用户登陆,但遇到「用不明白网站」的情况,并没有呼唤用户接管,而是只会傻傻地等着。

在本次任务中,连续两轮思考失败之后,AutoGLM 沉思开始进入一个重新思考-跟之前导致失败的思考结果一样-再重新思考的循环过程,一直循环往复了五六次,最后败下阵来,把目标转向了知乎。

步骤进行到这里的时候,其实已经算任务失败了,因为输入的原始指令是查找和汇总上市公司资料和公告,数据的专业准确性很重要,而知乎并不是一个可靠的上市公司信息披露平台。

经过了好几次艰难的测试,最后终于吐出了结果:华为、紫光、UCloud 三家公司,虽然都跟边缘计算有关,但三家的股票代码都写错了,更别提有两家并没上科创板。

Agent 「自动驾驶」能力,和路况、驾驶位有很大关系

在其它更轻松的任务(比如做旅行规划、游戏攻略、查找简单信息等)当中,AutoGLM 工具的 browser use 能力是没有太大问题的。

但 APPSO 发现,一旦当前网站的视觉设计相对复杂,或者设计的有一些陷阱,AutoGLM 工具就很容易被「使绊子」。

一个最直接的例子就是电商网站。APPSO 给出明确提示,「去淘宝或京东购买一件重磅日系 T 恤」,AutoGLM 沉思制定了宏伟的计划和明确的分工——然而却连淘宝首页的山门都进不去,甚至找不到搜索框在哪里。而且它似乎被「找不到搜索框」这件事完全阻挡住了,甚至也没有去看网页的其它位置——如果它看了的话,肯定会发现相关商品早就出现在首页推荐里了。

对于这个测试中发现的意外情况,智谱 CEO 张鹏表示,「点背不能赖社会」,AutoGLM 沉思目前仍在 beta 阶段,还有很大的进化空间,而且目前的升级速度也很快(APPSO 在正式发布版上测试淘宝的使用效果,已经没那么磕绊了)。

张鹏指出,在模型作为服务或作为产品 (MaaS) 的理念下,模型产品自己的能力要像木桶一样,高且全面。或许现在 AutoGLM 工具的视觉能力还不如人,处理意外情况的能力还不够,归根结底可能是泛化能力还不够,但这些能力的提升并不是模型问题,而是纯粹的工程层面——不需要担心。

从模型底座层面,AutoGLM 沉思也有提升的空间。

经常用大语言模型产品的朋友都知道,提示写的越具体,规则和边界设定的越明确,它的效果越好,越有希望生成符合用户提示的结果。基于大语言模型的 agent 也是一样。

但是提示不能无限扩展,就好比你招了一个秘书帮你干活,但你不应该总是每次都把「找谁」、「什么地点」、「什么时候」、「去哪」等一切的信息都讲清楚,ta 才能勉强顺利地帮你搞定一个饭局的准备工作。

大语言模型很强大,但也有它糟糕的地方:只受到文本规则的约束,缺乏真正的实际问题的规划能力,任务过程中容易被卡住;缺乏足够长的上下文记忆空间,任务持续时间太长就持续不下去;上一个步骤的错误会随着步骤逐渐放大,直至失败。

AutoGLM 沉思也是一个基于大语言模型的 agent,即便在 agent 能力上做了很多工作,但仍然难免受到大语言模型的诅咒。思考能力越强,越容易想多、想歪。

从 APPSO 的试用过程中可以看到,除了一些绝对基础的概念(比如「旅游」、「T 恤」、「公司」)之外,它并没有稍微复杂的上层知识。用户每次发出任何指令,它都要先自己打开浏览器,上网学习一遍,明确用户的所指,在本次对话的有限记忆空间内建立一个知识库,然后再去进行后续的步骤。

而就它目前最擅长和依赖的那几个信息来源来看,一旦用户任务的复杂性、专业性「上了强度」,想要它在用户可接受的时间(目前官方定的是每任务总共 15 分钟左右)内,查到真实、准确和有价值的信息,就真的有点勉强了,更别提给到用户有效的结果(APPSO 的测试中有一半无法输出完整的结果)。

不过这并不是个太大的问题。

有这样一个很实际的观点,可以套用到 AutoGLM 沉思上:

今天的 agent 水平,将它视为「主驾驶」可能能力尚有不足。但它仍然是一个很好的副驾驶 (copilot)。

在 AutoGLM 沉思上,我们看到了足够的思考能力,也看到了优秀(但确实受制于客观因素)的 browser use 能力。很显然,智谱作为中国目前非巨头公司当中,少数模型能力最强的选手之一,肯定会在这两个能力上面继续进步,而且会很快。

自从 APPSO 拿到测试资格,到 AutoGLM 沉思正式发布,中间已经更新了数个版本,在模型基座和浏览器操控能力上面都有了改进。

但如果我们想要的是一个真正会思考且能办事的 agent,我们恐怕需要比现有范式的大语言模型更强大的智能体基座。

而智谱推出的「语言+推理+沉思+行动」的 Agent 框架,尽管产品层面仍然笨拙,但看起来是一个非常明确可行的方向。

诚然,国产大模型和基于大模型的 agent 产品,现阶段的目标如果放在「追赶硅谷对手」上可能反而更实际一点。AutoGLM 沉思从操作逻辑和实现目的上,都是明显区别于目前国内所有同类和近似产品的「新物种」,和 Anthropic、OpenAI 也正在拉近距离。

对于这样一家非巨头、脱胎于中国顶级学府的大模型创新领导者来说,大多数的不足都可以被容忍,而看到它在做的事情的独创性和领导性,才更重要。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


独家 | Google 决定终止开源 Android

By: 杜晨
27 March 2025 at 12:07

出于新闻报道和纯兴趣讨论目的,爱范儿对知名科技公司的战略做过各式各样的「沙盘推演」,设想了许多场景。

但没想到,最不可能的一种情况,居然正在 Google 身上发生。

Google 已经决定停止 Android 开源项目AOSP

AOSP(Android Open Source Project) 是 Google 主导的开源项目,为所有 Android 设备操作系统提供基础框架和核心组件。它相当于一个「毛坯房」,开发者可自由下载、修改和分发其代码,并基于此构建定制化系统,包括 Xiaomi HyperOS、vivo OriginOS、OPPO 的 ColorOS、甚至 Pixel 手机的 Android 系统,都是基于 AOSP 构建的。

Google 对 Android 的维护分为两条路径:公开的 AOSP 分支面向全球开发者开放,包含纯净的开源代码,不涉及任何 Google 专有服务。任何厂商或个人均可基于此分支开发系统。而内部闭源分支仅供签署了 GMS(Google Mobile Services) 协议的厂商使用。

具体来说,Google 将不再维护目前 AOSP 的公开分支,逐渐关闭相关的的支持性资源,并可能停止更新有法定开源义务(GPL 等协议的代码)外的组件的源代码。

海外媒体 Android Authority 最先报道了这一情况,Google 也确认了此事。

从下周开始,所有的 Android 开发工作将仅在 Google 的内部分支进行。在一段时间后,外部分支可能将不再公开甚至彻底关闭。并且,AOSP 的持续集成/交付 (CI/CD) 工具和环境也可能关闭,甚至 Android Gerrit (https://android-review.googlesource.com/) 也可能会关闭。从今往后,只有 Google 内部的员工能够访问 AOSP 的内部分支,或是提交代码。Android 的开发过程将不再透明。

从高维度来看,Google 将逐步缩减 AOSP 所包含的内容,直至 AOSP 作为开源项目,以及作为一种概念,都不复存在。

以史为鉴,OpenSolaris 项目(也就是 Solaris 操作系统对应的开源项目)在 Oracle 在收购 Sun,宣布对 OpenSolaris「延迟开源」后,直到 Solaris 开发部门解散为止,都没有以 CDDL 许可证开放过半句代码。

谁也不知道,Google 对 Android Authority 承诺的「继续开源,只是推迟」,是不是只是一句空话——毕竟无限期的推迟,也是一种推迟。

根据爱范儿的了解,Android 闭源的总体思路是最终只保留 GPL 强传染许可证要求开源的部分,主要是 Linux 内核态驱动和补丁。其他中层、上层等之前采用 Apache 等宽松开源许可证的部分,最终会闭源;未来的 Android 版本发布后也不再对外公开发布、更新源代码。

此事的决策层级在 Google 高层管理者级别。据信他们做出此决定的时间不晚于 2025 年初。整个策略的执行将会在一个更长的期限内完成,至少持续数年,直到 AOSP 彻底失去意义。

Google 此举的真实动机尚不明确,但根据爱范儿的分析和了解,主要是为了节约开支和增加收入

AOSP 在不同的维度上(比如版本号、发布进度等)有着多条代码流水线和大量的分支。再考虑到项目的上下游代码、多公司之间的协作,进一步复杂化,维护管理起来非常困难,产生大量的计算资源和工时成本。Google 可能希望节约这些成本。考虑到 2025 年初 Android 部门已经向所有员工提供了「自愿离职」的选项,削减开支的思维逻辑不难理解。除此之外,签署了合作伙伴协议的厂家也有义务捆绑 Google 服务,为 Google 提高广告收入,变相提高了公司的整体收入。

好在目前来看,闭源 AOSP 对业界的直接影响并非灾难性,对终端手机用户直观影响也微乎其微。

绝大多数主流手机厂商早就和 Google 签订了各种授权合作伙伴协议。在现有协议安排下的厂商,仍然可以得到和使用最新 Android 源代码,获得 Google GMS 认证,正常预装 Google Play、Gmail 等服务和应用,得到 Google 的支持。一切生意照旧。

真正的影响更多不会直接展现,而是会在更长的时间里从侧面体现。后文会详细解读。

 

AOSP,不存在了?

如下几点需要澄清:

  1. 因为大部分 AOSP 代码通过 Apache 2.0 许可证发行,任何人都可以 fork 一份。其他代码服务平台上也有各种 AOSP 的镜像,例如 GitHub 和国内的 Android 社区。Google 无权要求其它「非官方」 AOSP 代码库下线。已经开源的,无法被撤销开源。
  2. 也就是说,只要能从其他非官方渠道下载,人们仍然可以使用 Google 最后更新的 AOSP 代码,也可以按照自己的需要对其进行修改。原则上如果你有足够多厉害的开发者,也可以把之前的 AOSP 变成自己的系统,去维护和更新。

Android/AOSP 从来不是一个真正的开源项目,社区里的原教旨主义者也一直对其颇有微词。

前文提到,Android 目前运行于 Linux 内核上,后者是 GPL 许可证开源的。GPL 是一个强传染性的许可证,要求所有衍生工作都必须按照 GPL 许可证同样开源,从而贯彻无限开源、扩大社区的精神。

而当年 Google 为了构建 Android 商业生态,创建了平衡开源与商业需求的许可模型。Google 将 Android 平台分为几个部分:底层的 Linux 内核部分保留 GPL v2 许可证(按照要求),而 AOSP 的大部分代码则采用了更为宽松的 Apache 2.0 许可证。这种许可结构使设备制造商能够修改和定制 Android 而不必开源所有修改,同时允许企业在 Android 平台上构建专有应用和服务。Google 自己的专有服务 GMS (Google Mobile Services) 则与 AOSP 分开,并采用不同的许可条款。这种混合方法创建了一个既保持开放性又为生态系统提供商业灵活性的模型。

具体来说,Linux 内核基于 GPL 许可证,虽然 kernel module 需要依据 GPL 强制开源,然而 userspace 应用并不受 GPL 传染性的影响,因此无需开源。部分 userspace 应用程序也与传统的 Linux 发行版不同,例如使用 bionic libc 替代 glibc,使用 toybox 替代 busybox 等。此外,Google 还使用了「硬件抽象层」(HAL),允许厂商将不想公开的商业机密资料,比如一些特定的专有功能对应的背后代码和逻辑,存放在这一层上面,即提供了一套 stable ABI(应用二进制界面),使得厂商可以独立于 Android 框架层更新他们的专有代码。

当然 Linux 基金会对 Google 这种违背开源精神的操作方法很不爽,一度将 AOSP 从 Linux 开源项目中除名。

结果就是,AOSP 底层部分按照 GPL 开源的,大量中层按照 Apache 宽松开源(部分闭源),在此基础上的应用就可以自行按照开发者意愿和商业目的选择各自的开闭源属性了。

Google 自己也是这样做的。事实上,自从 2013 年的 Android 4.4 KitKat 之后,所有的 Android 版本都不再完全开源。Google 为 Android 系统开发的一部分驱动、UI,以及应用层的大量大量核心产品和服务,也就是人们熟知的 GMS 套件,都是闭源的。

AOSP 存在着,但它并不是完整的 Android。这也是为什么很多系统开发者都会强调「原生 Android」(指 Google Nexus/Pixel 的操作系统)不等于 AOSP。

尽管 AOSP 是个开源项目,Google 也不常合并第三方提交的合并请求(合并 AOSP 代码需要 Google 员工的批准,而不少 PR 就死在了 Gerrit Review 里)。这也是不少开发者认为 AOSP 和典型开源项目之间的最大区别。让参与者难以在 AOSP 里获得真正的参与感。

在 AOSP 项目的官网上,Google 写了这样一段「治理理念」:

Google 领导 AOSP,负责维护和进一步开发 Android。尽管 Android 由多个子项目组成,但 AOSP 是严格的项目管理。Google 将 Android 视为一个单一、整体的软件产品,而不是一个发行版、规范或可更换部件的集合,并对其进行管理。Google 的意图是让设备制造商将安卓移植到设备上;他们并不实施规范或策划发行版。

这段话已经把 Google 的意图描述的够清楚了。如果 AOSP 是一头干活的驴,那么卸磨杀驴的时候已到。

 

Android 闭源,将会带来怎样的影响?

主要结论:主流手机品牌和它们的用户不需要担心。

首先让我们重温一下Google 和 Android OEM 之间的协议关系:

  1. AOSP,任何厂商都可以使用 AOSP 进行开发,不需要获得Google 的同意;
  2. Android 兼容性承诺协议 ACC、移动应用分发协议 MADA、企业设备补充协议 EDLA 等,不一而足。通过协议,Google 和 OEM 之间建立商业约束。签订了 ACC 协议的 OEM 通过 AOSP 开发的操作系统,才能够称之为 Android 操作系统,获得 Android 商标使用权等权益。
  3. Google 移动服务 GMS,包括Google 服务核心、账号体系等后台功能,以及前台的 Google Play 商城、YouTube、Gmail、Calendar 等应用。公司签署了上述协议,并且手机型号通过了Google 兼容性测试,才可以预装 GMS。

ACC、MADA/EDLA 等协议的组合,确保了Google 对 Android 操作系统有着大体上的绝对控制。

包括小米、vivo、OPPO、三星等在内的当今绝大多数 Android 手机品牌,和Google 都签订了协议。没有意外的话,Google 应该已经联系它们进行安抚,并且确保未来的合作照常进行了。

在过去有相当一部分设备和芯片厂商,它们利用 AOSP 开发产品,却不从 Google 获得 Android 设备认证,设备不需要预装 GMS 全家桶,也能够避开 Google 的认证要求。

非认证 Android 设备五花八门,数以十亿甚至百亿计。通过这次闭源 AOSP,Google 有可能引诱非认证设备厂商向自己低头,签订前面提到的各种协议。

一种极有可能出现的情况是,基于 AOSP 开发的智慧座舱系统,可能代码也不会再无偿提供给全世界的厂商了。除非车企和 Google 签订协议,它们将无法得到最新的代码。当然,车企也可以继续使用已经开源的旧系统开发。

这不是已经发生的事实,只是一种可能性。Google 这次闭源 Android,不排除有一个小的动机就是试图夺回非认证设备市场,或者至少能够从中分一杯羹。这个大市场,虽然是设备厂商自己打下的,但如果没有 AOSP 确实也不会是今天的样子。

顺着这个角度,非认证 Android 设备消费者可能就会受到影响了,当然同样不会很明显。影响主要来自财务方面:OEM 想继续预装 Android 操作系统,就必须要服从 Google 对设备的管理和要求。这个成本当然会被转嫁给消费者,导致支付更高的价格。除此之外,消费者也只能使用 Google Play 等渠道下载应用,第三方应用市场(例如 F-Droid)等的生存空间也变得更少,Google 也可以向所有的应用内支付收一笔费用。

部分厂商可能不愿意屈从 Google,产品退出市场,消费者的选择权就缩减了;但与此同时,任何 Google 在闭源之前已经发布的 AOSP 代码,理论上仍然可以使用。厂商可以随意 fork 代码,自己开发、更新、维护。估计智能冰箱的消费者不会在意冰箱是否预装最新 Android 操作系统。

不过,这恐怕就又回到了「Android 碎片化」的老生常谈:如果非授权设备厂商继续一意孤行,用老的、不再有官方维护的代码去开发产品,届时碎片化恐怕就不是版本号那么简单了——而是可能出现类似于今天的中国,推送、版本、功能、外观、名称、体验等全方位碎片化,并且向全球范围扩大的一副诡异图景。

开发者权益侵害

AOSP 的闭源,对于 Android 应用第三方 ROM 开发者来说,影响更为明显。

曾经 Android 第三方 ROM 百家争鸣的景象,也将被历史掩埋。ROM 开发者的最好结果,是用 AOSP 最后更新的版本去修改,然后维护当前版本,到它慢慢过时,直至最后放弃这项事业。

至于应用开发者,他们仍然可以从 Google 获取需要的 SDK,在后 AOSP 时代内应该不会有太大的直接影响。

不过在此之前,由于 Android 已经存在相当程度的碎片化情况,开发者为了适配各版本系统、各品牌机型,需要获得不同厂商的系统代码,以及设备作为测试机。这对于中小型,特别是独立开发者来说都是不小的成本。目前尚不清楚这种情况在今后会不会愈演愈烈。

如果中小开发者生存环境被遭到进一步挤压,传导效应就是强者恒强,创新被遏制,进而发生更多的垄断。因此,Google 在做了它该做的事情之后,应该要给出后续方案,确保中小开发者的生存。

最极端,却又最不出意外的做法

此前在中美技术脱钩的大背景下,爱范儿曾经构思过 Android 对中国手机厂商「断供」的几种可能性:禁止在海外销售的手机中显示 Android 商标、禁止预装 GMS、对中国厂商「指向性」闭源 AOSP,甚至中止这些厂商的授权并将其从 OHA 中解约/除名。

在所有可能性中,完全闭源 AOSP 是可能性最低的。爱范儿一度认为这样做实在太不体面了。

在智能移动设备的萌芽阶段,Google 做出开源 Android 的决定,不仅获得了技术开放的名誉,更是在当时将大量厂商和用户从塞班、Windows Mobile,以及诺基亚和黑莓的手中赢了过来。

当然,诺基亚、黑莓和微软各自走了弯路,对Google 获胜起到不小的助攻作用。但 Google 开源 Android,毫无疑问,是今天 Android 在移动操作系统市场抢下超七成份额的道路上,最正确的决定。

Google 内部仍有员工认可开源这项事业的科技普及化意义和长期价值。无论出于业务和上级要求,还是个人身份,他们为 Android 项目编写代码,做维护工作,而 AOSP 也是这些工作的载体。然而 AOSP 对于 Android 和 Google 的商业价值,早已不可同日而语。

尽管这次操作的主要动机是节约成本,但长期来看,也会对 Google 增加收入带来一定帮助。毕竟在过去,Google 很难从那些运行基于 AOSP 操作系统的非认证设备上获得直接收入或数据等间接利益。

在这一事件之前,Google 通过 Android 赚钱的方式,主要是在伙伴协议的框架下对 OEM 进行收费授权认证。 想要在商业合规的框架下使用 Android,厂商需要签署协议。具体协议内容方式等细节可能会有不同,但大的规则是不变的。Google 的主要收入来源是通过预装的Google应用和服务(搜索、Play商店等)获取的广告收入和应用分成。

显然,非认证设备无法给 Google 创造收入,AOSP 的存在却「给人做嫁衣」,作为任何一家商业公司恐怕都想要尽快跟这些设备和厂商切割。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


硬件与软件系统的全面结合,这是鸿蒙操作系统的历史性时刻

By: 杜晨
20 March 2025 at 21:28

3 月 20 日,华为在深圳召开了华为 Pura 先锋盛典及鸿蒙智行新品发布会。这是今年华为的第一场大型发布会,现场公布了 HarmonyOS 5 的全新升级计划:2025 年 3 月底,HUAWEI nova 13 和 12 系列将开启 HarmonyOS 5 公测;HUAWEI MatePad Pro 13.2 和 12.2 英寸等多款机型将开启花粉 Beta。

系统升级迭代也在稳步推进:到 2025 年第二季度,华为还将开启多款已问世机型的 HarmonyOS 5.0.1 推送升级计划,包括 HUAWEI Mate 70 和 60 系列、Mate X6 系列,以及 MatePad Pro 13.2 英寸系列等。

而为了感谢用户的支持,升级鸿蒙操作系统 5(以下简称鸿蒙5)的用户还将获得迄今为止最高额的鸿蒙升级权益礼包,包括并不限于 QQ音乐、B 站、芒果TV、WPS、京东、天际通、酷狗等,以及一系列华为自有服务的高级会员功能,总计价值超过 1200 元。

自去年 10 月 8 日鸿蒙5开启公测以来,鸿蒙系统生态渐入佳境。而在今天的发布会现场我们看到,经过 5 个月的发展,鸿蒙操作系统不断迭代,生态趋向稳健。

截至 2025 年 3 月,鸿蒙已收获用户反馈的优化建议 400 多万条,完成系统更新迭代 30 多个版本,新增超过 150 项功能特性。目前,已有 2 万多个鸿蒙应用及元服务上架,微信、抖音、支付宝等 20 多个 APP 下载量超过 200 万次。

在 2025 年的开头,鸿蒙5作为一个新颖、完善的社区生态,商住两相宜。

从用户角度,一个应用短缺、用户匮乏的操作系统,不足以谓之生态。而鸿蒙系统目前超过 2 万个鸿蒙应用和元服务,虽然部分应用暂未更新所有功能,但也满足了日常的需求。更何况在如此短时间的情况下加速开发,本身已算是一项壮举。而今天各大生态伙伴在会上的站台支持,也给到了消费者足够信心,告诉大家:鸿蒙离成熟,不远了。

从合作伙伴角度,十亿级鸿蒙生态设备的保有量,加上大量的开发资源扶持,让企业和开发者不仅看到了鸿蒙生态的商业价值,更能真正从生态中分一杯羹。

经过艰难的系统搭建和生态维系实践,鸿蒙操作系统也算得上是自 Windows、Android 和 iOS 以来,硕果仅存的国产自主操作系统之一。

与此同时,在本次发布会上,华为还发布了首款全面搭载鸿蒙5的移动设备华为Pura X,而鸿蒙电脑也预告将于 5 月亮相。

至此,鸿蒙系统的软硬件合一,迎来全新的发展时代。

鸿蒙5来了,鸿蒙新物种也来了

数码爱好者流传着一句话:想体验最原汁原味的 Android,一定要用谷歌 Pixel。

同理,想体验最极致的鸿蒙5,可以从首款鸿蒙5手机华为Pura X 入手。

作为一款折叠屏设备,华为 Pura X 前所未有地采用了 16:10 阔型屏的展开形态。这种更宽阔的显示比例,比常规直板机长形屏更适合阅读、游戏、浏览网页和观看视频。内屏和 1:1 比例的外屏均支持 120Hz 高刷/自适应刷新率、HDR Vivid 高动态显示。背后采用 4 摄模组,全面覆盖各种焦段。

在华为 Pura X 上,AI 功能以及语音智能助手小艺的智能体验获得了全方位的升级。在融合盘古和 DeepSeek 双大模型之后,小艺能够精准洞悉用户的需求,处理复杂的事务,比如帮接电话、智能缓存、时光机等,带来更懂用户的交互体验。

鸿蒙系统发布后,展现出系统交互的流畅度、丰富的个性化体验,以及对用户隐私的极致保护,备受广大消费者的青睐。

鸿蒙系统构建了一套属于自己的美学设计,并持续对其优化,呈现感官上一致的逻辑感;安全性方面,鸿蒙5也延续了并进一步加强了前代系统对数据安全的重视,提供单次、限时、指定数据授权等多种权限管理方式,并且让用户在使用过程中就能轻松调整;在多端互联全场景体验方面,鸿蒙系统则是为数不多真正在实践「响应式布局」的操作系统,在不同屏幕尺寸形态之间,实现用户界面和内容如「水」一般的自然流动。

作为鸿蒙5正式身份问世的旗舰设备,华为 Pura X 也是鸿蒙生态发展到今天的必然产物和里程碑事件。一个正式的操作系统,当然要配上专门为它打造的优秀设备。

事实上,从鸿蒙智慧屏、鸿蒙手机和可穿戴,到鸿蒙平板和电脑以及更多设备,华为一直致力于构建一个以用户体验为中心,实现全场景互联的生态体验。

而现场也提前预告了首台鸿蒙电脑,将于今年 5 月正式问世。

鸿蒙自初始就是按照一核多端的理念在推进,而现在传闻终于变成现实。以鸿蒙电脑为载体,鸿蒙系统将会成为第一个广大用户能够用上的,第一个国产自主且广泛可用的电脑操作系统。

作为又一个新物种,鸿蒙电脑也将为华为终端设备全面「鸿蒙化」起到强有力的助推作用。它将补齐鸿蒙版图里的关键一块,让鸿蒙系统可以作为一个自主的操作系统,真正首次在全球操作系统的重量级赛场上站稳脚跟。

与鸿蒙生态的双向奔赴

鸿蒙的进步速度,令人有种时光飞逝的错觉。尽管它作为操作系统也才问世十多年,加速国产自主化也只是最近五六年的事情。

2019 年 8 月,华为正式发布鸿蒙系统,以智慧屏作为试水的载体,并且提出了鸿蒙生态的明确构思:

一个分布式操作系统,以手机为核心,并且用户无论在任何设备上都能够得到一致、流畅、个性化、兼容性强、为当前设备优化的体验。

再到 2.0 版本,「超级终端」终于将手机、手表等核心设备连接到一起;3.0 版本时,显示器、打印机、墨水屏、可穿戴、智能座舱等多种终端支持;4.0 版本则在硬件全覆盖之后,兑现软硬件协同,操作体验统一和流畅的承诺。

最终,到了鸿蒙5,鸿蒙操作系统进行了底层重构,将鸿蒙内核、方舟引擎和端云协同能力进行结合,真正的实现了质的变革,成为了能够让用户获得全新体验的「第三极」。

两年前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东曾在华为开发者大会上做过一句表达:

轻舟已过万重山。

虽然给人一种云淡风轻的观感。但当时还未正式对外揭晓的鸿蒙操作系统,属实只是一叶轻舟,格外孤独。两岸猿啼,观望者众。

2024 年初,首批 200+ 应用的开发意向确认,其中不乏新浪微博、B站、小红书等核心应用;到了同年的华为开发者大会,已有 5000+ 应用启动开发,AppGallery 上可下载使用的主流应用数量超过了 1500 个。

作为一个自主操作系统,鸿蒙的应用和服务数量的增速不低,但其生态可持续性一直受到外界更加严格的审视。这也是鸿蒙系统在相当长一段时间里的缩影:应用少、功能缺失、生态不足。而这种劣势,在中国这种超级应用型的移动互联网市场,可能更加严重。

道理很简单,有短板就要补。

鸿蒙和生态伙伴们继续脚踏实地共同努力,事情也终于朝着有利方向发展。在鸿蒙团队的开发协助和资源倾斜帮助下,从老牌巨头到新创公司,从互联网大厂、中小型企业到各地的有关部门和事业单位,纷纷加速开发鸿蒙应用并提交到应用商城。

今天,微信、支付宝、抖音等「超级应用」在鸿蒙5上都达到了高度可用,使用体验接近用户更熟悉的 iOS 和 Android 版本,甚至已经配合鸿蒙操作系统实现了部分特性功能的创新,比如小红书在华为Pura X,以及华为折叠屏和大屏设备上的「横屏大视野,左图右评论」UI等。

底层方舟引擎的加持,大模型能力的快速应用,加上完善的应用生态,使得鸿蒙5的使用体验和 AI 交互能力追平甚至部分赶超基于 Android / iOS 的主流体验。

回顾来路,道阻且长,虽然发展的节奏很快,但生态伙伴和鸿蒙系统的双向奔赴,不但在很大程度上补齐了应用生态的完整性,也做出了很多不一样的功能。

结合鸿蒙系统的发展经历,以及 Windows Mobile 和 Tizen 操作系统无疾而终的故事,我们能够更清楚地看到操作系统成功的源本:

平地难以起高楼,一家公司自己的技术积累有多深、使命感有多强,并不是唯一,甚至不是最关键的决定因素;能否培养出健全的软件生态,并且和生态里的开发者、用户、合作伙伴奔着同一个目标齐头并进,才是一个操作系统成功的不二法门。

也正因此,在发布会上,余承东也对鸿蒙生态的合作伙伴们表达了感谢,并专门邀请了小红书、钉钉、WPS、B 站等多个关键伙伴上台展示他们的应用在鸿蒙系统上的优异体验。

移动互联网发展十余年,行业的先行者们已经创造了新的工作范式,培养了数以千万计的应用和服务开发者。而鸿蒙5也一定程度上享受到了作为操作系统「后来者」的红利。

过去一年多,我们看到已经有许多互联网大厂开高薪招聘鸿蒙开发工程师,也有不少深耕鸿蒙生态的独立开发者,赚到了第一桶金。

鸿蒙生态从来不是华为的独角戏,而是一场多方参与的大合唱。

鸿蒙5,值得升级体验

几个月前 HarmonyOS NEXT 刚开始公测的时候,爱范儿做了一个投票来了解华为手机用户的升级意愿,样本量数千人。在当时,只有 21% 的受访者不打算升级,和已经尝鲜的公测用户比例相当。

观望中但有兴趣的用户占到一半,而很多观望者告诉我们,只要微信好用了就立刻升级。目前,大部分国民应用不仅支持鸿蒙,而且有了重新设计产品的机会,剔除了几年也用不到冗余功能,还没有广告。之前,爱范儿的文章下面就有读者留言:

赶快升级鸿蒙吧,在上面你能用到未来十年里最轻量的微信 / 微博 / 淘宝……

那么,去享受首个真正、自主、生态完整的国产操作系统,这个时刻已经离我们很近了。

当然,鸿蒙5目前仍有不足,一些小众应用的适配仍需时日,且由于系统稳定性和试用体验需要更多的完善工作,目前仍需要分批升级。对于老设备来说,获得升级资格可能也还需要多等一段时间。

不过,相信这一切仍值得等待。如果非要拔高一下格局,那么现在升级鸿蒙5,不仅能够成为当下最具创新精神的用户,更是对真正国产自主操作系统的一次「用脚投票」。无论支持与否,鸿蒙5都值得你去感受一下。

感受会逐渐变成享受的。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


鸿蒙智行上新!问界 M5 降 2 万,享界 S9 降 8 万,还有「王炸」没出手

By: 杜晨
20 March 2025 at 18:31


刚刚,鸿蒙智行一口气发布了一堆新车,覆盖了 20 万到 50 万元之间的各个价位段——

新 M5 Ultra 进一步向「老大哥」M9 看齐,在豪华 SUV 市场混的风生水起的 M9 也迎来了产品力的进一步提升。

不只是问界系列,享界也有了更多动作。

问界 M9

先来看看问界系列的门面——问界 M9。

新款问界 M9 五座版起售价为 46.98 万元,六座版起售价为 47.98 万元。

新款问界 M9 的造型和尺寸完全没有变化,整车长宽高依旧是 5230mm、1999mm、1800mm,轴距 3110mm,提供五座和六座两种布局。全系标配了 52 度的电池包,CLTC 纯电续航里程约 290 公里。

外观上新增了金瑞红配色,整体称得上奢华优雅,加入了全新 21 英寸的星耀轮毂。老款车型想要这样的多幅轮毂,只能加钱上 22 英寸。

另外,M9 还从场景出发,提供隔空开门、卫星通话、星闪智能钥匙、电动侧踏板、后排隐私车窗、牵引装置和车顶行李架等配置,主驾和后排的座椅也升级了乘坐体验,后排的门板上还新增了零重力座椅按键和老板键。

这次最重要的升级在于智驾。

新款问界 M9 在原先 192 线激光雷达的基础上,于车身两侧及后部增加了 3 个固态激光雷达,硬件规格达到 L3 级自动驾驶需求,在被动和主动安全能力上都有相当程度的提升。

软件方面则升级到了 HUAWEI ADS 3.3,支持车位到车位、泊车代驾、跨楼层泊车等高阶智驾功能,过 ETC 和停车场闸机都没有问题。

动力方面,新款问界 M9 换装了型号为 HG15T 的 1.5T 发动机,也就是赛力斯研发的最新一代,最大功率提升至 118 千瓦(老款为 112 千瓦),百公里亏电油耗为 6.9 L,在能效比上进一步提升。底盘和车身控制系统也有相应的升级。

值得一提的是,华为官方宣布将为问界 M9 老款车型提供原厂硬件升级方案,并将持续 OTA 升级软件,做到「常用常新」。

问界 M5 Ultra

问界新 M5 Ultra 可以用两个词来概括。

一是「降价」——22.98 万元的起售价比去年便宜了两万多块钱;二是「增配」——新 M5 的升级涵盖了外观、内饰、底盘,以及华为最引以为豪的智驾。

新配色:幻影紫

作为年款更新,M5 Ultra 并没有改变整车的比例,而是选择在细节上做出调整,后保险杠换成了与车身同色的样式,一体性更强。内饰上变化也不大,水晶挡把换成了家族式的怀挡,给副仪表台留出了更多的储物空间,其余就是配置上的更新了:

加入了 100 瓦有线快充、全车标配加热通风按摩、副驾腿托加长,全车标配双层隔音玻璃。更重要的是,新加入了电动遮阳帘。

M5 Ultra 的行驶质感也有提升,华为这次还为新 M5 Ultra 提供了 DATS 2.0 系统,号称提升了颠簸路段以及过弯时的平顺性;新引入的舒适制动功能,也使得刹车平顺性至高优化了 95%。

新配色:零度白

新 M5 最大的升级在于顶上的激光雷达——从原先的 128 线激光雷达升级到了问界 M9 同款的 192 线,最远探测距离提升至 250 米,点频达到了业界最高的每秒 184 万点。此外,它还引入了 4D 毫米波雷达来应对大雾、大雨这样的恶劣天气,感知能力大幅提升。

享界 S9 增程版

享界 S9 增程版这次的预售价格来到了 31.8 万元起,比去年 8 月发布的享界 S9 Max 足足低了8 万元。

享界 S9 增程版这次向 M9 看齐,换上了「百万像素大灯」,拥有迎宾光毯和互动灯效等功能。大灯甚至能够和车机联动,支持户外投影看视频、玩节奏光剑和打地鼠等体感游戏。

享界 S9 增程版

享界 S9 增程版的座舱内部也有不少提升,后排升级了「舒云座椅」。其靠背采用 10 层结构设计,发泡和海绵总厚度达 64mm,占座椅厚度 60% 以上,用料相当扎实。

在氛围配置上,享界 S9 增程版则配备了全色域氛围灯和高定香氛,以及激光投影和隐私玻璃来营造座舱质感。

享界 S9 增程版提供 37kWh 及 53.4kWh 两个电池包版本, CLTC 纯电续航里程为 365km,综合 CLTC 续航里程最高可达 1355km,20%-80% 补能仅需 15 分钟。

问界手里还有一张牌没打

问界 M8 早在本月初就开始了预售,预售价格为 36.8 万元。本以为它会在今天正式开售,结果余承东还是选择继续吊着我们的胃口。

关于问界 M8,其实已经有了不少信息:定位中大型 SUV,提供 5 座和 6 座布局,车身的长宽高分别为 5190mm、1999mm 和 1795mm,轴距达到了 3105mm,给座舱留出了充足的空间。

底盘和动力方面,问界 M8 全面向 M9 看齐,全系双电机四驱(前 165kW 后 227kW)、标配空悬+EDC连续可变阻尼减振器,配备增强型双叉臂+后五连杆独立悬架,底盘质感和行驶舒适性依然会是 M8 的一大优势。

问界 M8

可以预见的是,问界 M8 的登场,必将让赛力斯的销量迈向一个全新的高度。

2024 年,赛力斯新能源汽车销量一路高涨,达到了 42.69 万辆,同比增长 182.84%,增速在行业内一骑绝尘。其中,问界 M7 全年累计交付近 20 万辆,问界 M9 自发布 12 个月内累计大定也突破了 20 万辆,连续 9 个月蝉联中国市场 50 万元以上豪华车销冠,一举打破了国内豪华车市场多年的垄断局面。

不过,挑战也接踵而至——当 M7 的产品势能逐渐下滑,和竞品一起落到了 20 万元级,问界急需一颗「新星」来填补 30 万元级的市场空白。

问界 M8

再看看现有的问界 M7 六座版车型,受限于老旧平台的尺寸,它并不能很好地适配 5-6 人的出行场景。三排空间表现平平,后备箱空间在满员状态下,更是难以满足长途旅行的行李装载需求。

所以,无论是从问界品牌的长远发展,还是从消费者对高品质出行的追求来看,问界 M8 的推出都显得尤为迫切。M8 在预售期间取得的成绩也证明了这一点——6 小时小订数量突破 21000 台,36 小时突破 36000 台。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


笔记本跑百亿大模型?在 AMD 这里没问题

By: 杜晨
18 March 2025 at 17:20

在冲向 AI PC 的赛道上,每一个芯片、设备企业都生怕落后。

这场竞速赛,目前苹果生态大幅领先,爱范儿在上周的 Mac Studio 评测中,成功在本地部署并运行 DeepSeek Q4 量化版 671B 和 70B 版本,而且 token 吞吐性能不错,展现了 M3 Ultra 芯片以及高达 512GB 统一内存的实力。

而在 x86 阵营这边,目前最有竞争力的「车队」AMD,正在试图加速超车。

在 3 月 18 日举办的 AMD AI PC 创新峰会上,公司高级副总裁、计算与图形总经理 Jack Huynh 展示了在 AMD 架构笔记本电脑上运行 DeepSeek 大模型的能力。

根据现场展示,一台搭载 AMD 锐龙 AI Max+ 395 处理器的笔记本电脑,顺利运行了 DeepSeek-通义千问融合 7B 大模型。Token 秒速并没有公开,但根据现场肉眼观测的结果,结合我们过往在不同机型上测试的经验,现场速度应该至少能够达到 15 tok/s 以上。

需要说明的是,根据现场 demo 区显示,这一部署和运行结果依赖 AMD StrixHalo LLM 软件,一个 AMD 开发的大模型运行环境。根据我们的理解,背后逻辑简单来说,AMD 会对支持的大模型进行内部优化,显著降低单位 token 激活参数成本,然后再将支持能力实装到用户本地设备。

而锐龙 AI Max 处理器家族本身也支持了更高的显存分配能力。在现场我们看到,AI Max 支持最高 96GB 的显存分配,让处理器集显获得了高端独立显卡才能实现的性能,而这一性能既可以用于 AI 训练和推理计算,也可以用于游戏。

经过优化之后,参数量再大也不愁。在 demo 区的示例中我们看到,前述同款芯片在华硕 ROG 幻 X 2025 款笔记本电脑上,最高可以运行 Meta 开发的 Llama 3.1 70B 大语言模型。

尽管参数量极大,过往对硬件要求也极高,远超过去业界对于移动计算设备本地推理能力的认知上限——笔记本电脑现在也可以顺利且轻松地运行数百亿参数量的大模型了。

AMD 这样做的目的,是确保基于大模型的企业级应用和科研能力,能够被普及到 x86 阵营的笔记本,甚至配置更轻便的移动计算设备。目前,AMD AI PC 环境支持 DeepSeek 1.5B、7B 等主流型号的大模型。

如果笔记本不足够的话,AMD 也为真正的重型用户提供了能够运行 DeepSeek R1 全参数大模型的服务器方案,领先了英伟达一步(后者可能会在明天凌晨更新 AI 计算集群模块化产品)。

现场展示了两种不同方案,其一是 AMD 自主的方案,基于 vllm 框架,采用 8 x W7900/78000 显卡,可以完全离线本地部署 DeepSeek 671B,为企业内部研发和知识产权保驾护航。

其二是 AMD 和群联电子合作的 aiDAPTIV+ 方案,大致逻辑是让显卡通过 NAND 闪存扩展内存,从而打破单卡的显存瓶颈。通过现有 AMD 显卡,同样可以在单机的形态下实现 DeepSeek 671B 全参数级别训练的能力。

当然,大多数人只是纯粹的 AI 应用用户,而非开发者。所以 AMD 在这次峰会现场也和 OEM 合作伙伴一起,展示了各类主流形态的消费级 AI 应用。

很有意思的是现场的 demo 之一,由清醒异构开发,基于 AMD Ryzen AI 平台的大模型图片生成工具「绘梦师」。它支持文生图、图生图、边画边生图等生成模式,而且完全可以在本地运行,不需要联网。

再比如联想展示的个人智能体「小天」作为 PC 端的 AI 入口,其背后的大模型可以根据个人数据训练和优化,在前台具备任务分解和规划、自然交互、长期记忆、工具调用等能力。

最近一年时间里,AI 技术发展的太过于迅猛,能力上限一再提高,大模型可选项也与日俱增。但受制于设备本地计算能力,PC 行业也在面临很大的挑战。

而考虑到最大的友商目前面临非技术困难,AMD 作为 x86 阵营另一个底层计算技术头部厂商,认为自己必须肩负责任,迎接挑战,领导变革,让 AI 能够真正通过 AI PC 进入千家万户和千行百业。

在峰会上,AMD 给了 OEM 合作伙伴很大的露出机会。包括微软、联想、华硕、宏碁、惠普等生态合作伙伴,纷纷带来了基于最新 AMD 锐龙 AI 处理器家族的 PC 新品。

AI PC 的品牌和机型的选择权宽度,AI PC 产品本身的大模型运算能力,以及不同消费级场景的应用丰富度,对于 PC 品牌和芯片厂商们在 AI 时代守住本阵营市场份额尤为重要。

 

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


特斯拉还没有到抄底的时候

By: 杜晨
11 March 2025 at 15:47

特斯拉股价崩了,崩到甚至无法判断到没到抄底的时候。

美国时间 3 月 10 日,特斯拉股价暴跌 $40.5,跌幅超 15%;收盘价 $222.15,相比几个月前的历史高位已经腰斩。

至董车会截稿,特斯拉夜盘继续下跌超 4%。自去年 11 月美国新任总统特朗普当选以来特斯拉增加的所有市值,已随着这次暴跌悉数蒸发。

瑞银、贝雅等投行均调低特斯拉预期,认为股价可能持续下跌。

马斯克本人「受伤」严重,自特斯拉股价高位以来,个人身价已经缩水超过 1200 亿美元,仅昨天一天就蒸发了 120 亿美元。

连特斯拉的绝对内线人士,马斯克的好朋友詹姆斯·默多克都扛不住要止损了。他昨天一天就卖出了 5 万多股,价值超过 1300 万美元,还被外媒质疑是内线交易。

特斯拉的遭遇,跟马斯克在美国政治上的「玩火」行为肯定有关。但股价暴跌的最直接导火索,无疑是最近半年的销量悲报频传。

去年马斯克一度宣称,到 2030 年将会实现年销 2000 万台——结果 2024年却遇到了 10 年以来的首次年销下跌。

到了 2025年,情况并没有变得乐观。

在中外厂家角逐的蓝海市场欧洲,一月份特斯拉销量滑落 45%。在特斯拉曾经称霸多年的挪威,2025 年头两个月的销量从去年同期的 2887 台降低到 1606 台,甚至不如只有一款 bZ4X 车型的丰田。德国也很惨,一月只卖了 1277 台,降低了 59.5%。而在南半球,澳大利亚市场更恐怖,2 月跌幅达到七成。

特斯拉在中国市场销售量也跌了 49% 左右。虽然数字不是最大的,情况却是最触目惊心的。

一部分原因在于最畅销车型 Model Y 面临升级换代。据彭博社报道,特斯拉对上海临港超级工厂的生产线进行了部分调整,为 Model Y 重启生产铺路,导致产量没能一直维持在高位。好在现在 Model Y 生产已经重启。

但考虑到中国汽车市场竞争激烈程度,特斯拉前景并不乐观。彭博社援引中国汽车技术研究中心数据报道,去年中国贡献特斯拉五分之一收入,但特斯拉只占到整个市场新车销量的 2.6%。摩根士丹利认为,中国市场在特斯拉的收入贡献比例将会继续降低。

前段时间特斯拉高级自动驾驶功能 FSD 入华测试,各本土品牌高管纷纷表示欢迎——但人们都清楚这种欢迎是纯粹出于自我营销的目的。私底下,国产车企愿意给特斯拉的面子已经不多了。

比亚迪可能就不需要给特斯拉面子。从前年开始 All in 新能源车的比亚迪,今年 2 月实现本土销量超 31.8 万辆,同比增长达到 161%。市场份额快达到 15%;吉利更「不讲武德」,前几天直接宣布从 6 万到 30 万元价位的银河品牌全系车型标配智驾。

吉利这招是冲着跟比亚迪硬碰硬去的,却不小心把特斯拉给「侮辱」了:要知道想在国行特斯拉车型上开启 FSD,还要额外支付 6.4 万元一次性买断费用,而且是纯软件解锁的费用。

再添点钱,都快能买辆吉利或比亚迪 7、8万价位的车型了。虽然容易被当成网约车吧,至少人家默认「全民智驾」。

近两年中国本土新能源市场也在「冲高」。为了占领消费者心智,各品牌纷纷推出非传统 4 门家用属性的高端化产品线,比如小米的 SU7 Ultra、理想的 Mega 等。这些车型虽然对提高市占率起不到太大效果,至少是符合中国道路场景的。

而特斯拉只有 Cybertruck 一款非常规车型。在皮卡用途广泛的美国或许还有市场,在道路普遍复杂、停车位狭窄的中国,很难看到前景。

在特斯拉 Master Plan 的第三版中,品牌的战略重心更多放在了可持续能源事业的大版图,而非具体的汽车行业上。甚至这版 Master Plan 都变成了一个 40 页的 pdf,不像前两版,几段话就讲清楚了。

无论志向多宏大,汽车业务的基本盘还是要保住。比亚迪同样也有储能业务,也没荒废掉汽车。

特斯拉跌了一天之后,特朗普在大半夜发了条动态支持战友马斯克,说自己明天就买一台新特斯拉以示支持(更新:真买了。)

但说真的,与特朗普的亲密关系,对于特斯拉是个利好还是利空,马斯克自己心里不清楚吗?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iPad Air M3 首发评测:一个典型 iPad 用户的七年之痒

By: 杜晨
10 March 2025 at 21:00

2018 年,我被那条「What’s a computer?」广告忽悠,把早已不记得年份的老 iPad,换成了第二代 iPad Pro。

现在有一台刚发布的 iPad Air (2025) 放在我面前,我在思考:为什么需要一台新机?

很多 iPad 用户跟我的观感相似,无论刷网页、修图、追剧看电影、轻文档处理,还是视觉创作,以及玩点轻游戏,我们手上的那台 iPad 都足够应付。iPad 实在是太经用了,买一台真的能坚持好多年。

但消费主义充满陷阱。换个角度看,如果我今天购买最新款的 iPad Air,同样完全不用担心过个几年它会过时。买 iPad 时,我们从来不会有这种顾虑。

七年之痒,也许是时候换一台 iPad Air,然后再七年?

 

硬件微升级

如果只看参数表,新 iPad Air 和前两代相比确实没什么进步,挤牙膏说的并不夸张。

但你可能没注意到,新 iPad Air 相比去年的 M2 版本,发布价格降价了 400 元。是不是觉得牙膏也挺香的?

毕竟 M3 芯片的提升还是存在的,这也是除了新 iPad Pro 的 M4 外,你能在平板上用到的最强芯片了。

得益于技术迭代,以及苹果在 M 系列研发生产上的经验积累,新 iPad air 的 GPU 和 CPU 算力都有所进步;神经网络引擎也是,官方宣称和 M1 相比,处理 AI 工作流提速达到 60%。

M3 内置的 9 核 GPU,与最高级的苹果图形架构在 iPad Air 上合了体。基于硬件的光线追踪终于来了(之前只有软件加速):游戏的光线、反射、阴影等效果逼真度有所提高;能效也有相应优化,我玩了半天《逆水寒》,发热程度可以接受,到了晚上还剩一些电量够加个班。

如下图所示,iPad Air 在 Geekbench 6 GPU 测试中获得 45935 分,追平上一代 M2 芯片 iPad Pro(2022 年);Geekbench AI 性能量化得分 5670,物体识别、风格迁移、超分辨率、机器翻译等经典任务,精度平均 98% 上下。

在 3DMark 光追性能压力测试里,iPad Air 得到平均分 8253,循环到一半的时候开始性能下滑,应该是由降频导致。

第二天我用 iPad Air 测试更依赖 CPU 的工作场景。多开浏览器、IM、视频会议、文档表格等应用,切换的过程更流畅。

目前 iPadOS 的多任务用户界面的操作,还是有点繁琐,在「分屏侧拉」和「台前调度」之间切换,还得打开控制中心添加快捷方式,或者在设置里切换。希望未来苹果可以优化这一点。

新 iPad Air 本体目前唯一值得说的东西,就是这些。

有人要问,「不提一下 Apple 智能吗?」

iPad Air 的确支持 Apple 智能,最快今年夏天就在中国大陆上线。但在所有官方宣传渠道中,Apple 智能都被「一嘴带过」,新闻稿里只有结尾一段,和「没有为 Apple 智能准备好」的基础款 iPad 篇幅相当。

你可能会说 Apple 智能还没正式上线,但美国科技媒体的感受也一样——要知道自从去年 6 月官宣以来,Apple 智能一直是苹果营销的一大重心,和所有新产品官宣的关键信息点。

苹果在最前沿技术的商业化上从来不是最快的,这种稳妥而非激进的路线也被人们接受。但毕竟 iPad Air 和 iPhone 16e 是 Apple 智能最低门槛的硬件载体,从渗透市场的角度站位很关键。

iPad Air 都为 Apple 智能准备好了,但 Apple 智能自己准备好了吗?

 

好键盘,好工作

比 iPad Air 本身更让我兴奋的,就是这次苹果配套推出的全新妙控键盘 (Magic Keyboard),增加了一行功能键:

  • 独立音量按钮、亮度按钮、播放控制、多任务按钮,加强了作为一台「电脑」的操控体验
  • 新的转轴和悬浮式结构(同 iPad Pro),支持直通充电

我在打车时把 iPad Air 拿出来用了一下,放在膝盖上的重心挺稳,不会有很明显的「头重脚轻」感觉。而老 iPad 的用户的键盘,一般都是那种带支撑架的,需要大腿足够长,或者把键盘朝着自己拉,否则 iPad 很容易倒过去。这种键盘一般放在台面上才真的「能用」。

配上新妙控键盘除了稳,屏幕离眼睛也更近,特别对于 11 英寸的机主更友好。iPad Air 终于成为一台字面意义上的「Laptop」(放在膝盖上),从外观、用法、使用感受,都更像一台笔记本电脑。

唯一遗憾就是键盘掌托还是之前的柔性面料,舒服、不冰手,但易脏易磨损,不适合手汗大的朋友。

这次新妙控键盘还更比上一代降价了 200 元。当然一台售价 2199 元(11 英寸)的键盘仍然不便宜。

11 英寸 iPad Air 128GB Wi-FI 版 + 妙控键盘,总价 6998 元,而新 M4 芯片 13 英寸 MacBook Air 256GB 售价 7999 元(同样较前代降价了发布价)——少花 1000 块钱,你可以得到一台更加灵活的「准 MacBook」。

作为「准 MacBook」来说,M3 芯片的性能上限早已足够;拆下键盘它还是那个更灵活的平板电脑。e-SIM 机型更贵,但想节约预算完全可以直接用手机热点或移动 Wi-Fi。

更何况今年国补还在继续。

顺着这个思路,这台新 iPad Air 的购买推荐来了。

没必要换机的用户:

  1. 你的 iPad 是最近两三年内换的,感觉够用
  2. 纯平板使用,不需要键盘

可以考虑购买的用户,大概符合下面几点:

  1. 你现在的 iPad 已经落后 5 年左右;
  2. 主要使用网页、文档、IM、email 等办公软件,对实体键盘有需求;
  3. 偶尔剪视频、画图和设计,想试试 AI 功能,但还不至于上 iPad Pro
  4. 常用的电脑已经略微落后,但足够应付第 3 条的创意工作;

那么这台搭载 M3 芯片,搭配新妙控键盘的 iPad Air,适合你购买。遇到大型工作任务的时候,不至于没有机器可用,日常的工作和生活场景交给 iPad Air 也完全可以。不管 Apple 智能啥时候准备好,至少 M3 芯片为 AI 准备好了。

在我过去的几份工作中,遇到过各种各样的「典型」iPad 用户,他们使用 iPad 的方式五花八门,但需求都非常明确。

比如我认识一位实体零售店长,每天筋疲力尽,下班只想刷剧放空,但时不时还要按照公司要求做一堆表格。于是他给 iPad 配了个便宜的键盘盖,反正只是凑合用一下。

还有文娱行业的艺人企宣和经纪,他们每天的工作主要就是奔走剧组驻地,修图、做 ppt、做视频,然后拿给导演看,也是一台 iPad 可以完美嵌入的工作流。

典型的 iPad 用户,往往也是非典型的科技产品使用者。他们对性能参数的多寡毫无感知,很多时候只是要一台便携好用的大屏幕。核心使用场景满足就足矣,多个键盘、笔这样的外设还能加点分。他们不会年年换新,但也要考虑二手设备的残值,差不多时候就可以换了。

而对于这样的 iPad 用户,现在到时候了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


你的荣耀手机学会「点屏幕」了,为什么笨 AI 也有未来?

By: 杜晨
10 March 2025 at 14:23

在移动世界通信大会 MWC 2025 上,我们看到荣耀和订餐订位产品 OpenTable 做的一次演示:用户用语音命令手机 AI 助理找家西班牙餐馆订个位,接着就看到手机屏幕被「接管」,一通自己操作。

这个 MWC 版本的演示,其实和荣耀去年 Magic 7 Pro 发布会上策划的那次「行为艺术」,是同一件事。

当时在深圳的发布会上,时任荣耀 CEO 的赵明指挥 AI Agent YOYO 打开美团。他的手没动,而是 YOYO 自己在屏幕上点来点去,一家店点了几十杯饮料,支付,循环到下一家,继续点,再循环,重复操作——直到最后下单了总共 2000 杯左右。

一通操作过后,深圳发布会场地周边的瑞幸门店纷纷「爆单」,门店咖啡师忙到崩溃,接到订单的骑手更是在门店排起长队。

这次效果显著却略带荒诞意味的事件营销,一定程度上让公众忽略了荣耀试图展示的核心技术:「基于 GUI 的个人 AI 智能体」

时至今日,AI Agent 功能确实已经不新鲜了。而这个技术的关键点,在「GUI」这三个字上。

GUI 全称 Graphical User Interface,图形用户界面。作为一个基于 GUI 的 AI Agent,YOYO 不再依赖传统的 API 接口,而是有了一只虚拟的「手」,直接在代替用户进行图形界面操作。整个代行操作不在「后台」,而是直接在「前台」,在用户的眼皮底下实时发生。

需要澄清的是:Magic 7 Pro 市售机型用户的体验可能会与发布会演示存在差异。据财联社报道,当时现场演示用的测试机权限更高,能够自动免密支付和循环点单,这才不停地点出了2000杯饮料。至少在目前,市售机型需要用户明确告知点单细节(例如品牌、品名、杯型、温度等),并且在支付环节需要用户接管确认。

这个细节确实重要,但也不至于抹杀这项技术的存在意义。正相反,我们认为,「基于 GUI」是个很另类,很有趣,颇具试验性的 AI Agent实现路径。

AI Agent 交互的「前台」新路

荣耀 YOYO 的核心是多模态模型,GUI 交互的本质是语言+视觉的理解。

  • 自然语言处理 (NLP):理解「点一杯冰美式」的指令;
  • 屏幕状态感知:识别当前界面中的内容,找到正确的按钮、输入框等界面元素;
  • 拟人化操作:像人类一样点击按钮、输入信息;
  • 循环操作:在新的界面中持续解析内容、定位和点击界面元素。

关于 GUI 的操作部分,这最后一步具体是怎样实现的,荣耀方面没有明确透露。一种稳妥的猜测是:它能够获得手机的无障碍功能 (accessibility features) 或类似的底层权限,从而控制屏幕点击事件。

这最后一步并不是什么难事,甚至比前面几步都简单得多。但除了此前智谱的 AutoGLM 等极少数之外,确实很少有其它第三方开发者和终端厂商在走 GUI 交互的路径。

在过去,虚拟助理控制软件和智能硬件的方式主要是通过 API 调用以及物联网协议。这可以理解为一种纯数字 (digital) 的通讯方式。

今年一月,谷歌在三星的指定机型上激活了基于 Gemini 2.0 的 AI Agent 功能。这次合作也是通过 API 或类似方式实现的(谷歌称之为 Gemini 扩展),初期仅支持 Gmail、谷歌地图、三星日历、三星时钟等第一方应用,以及 Spotify 等极少量第三方应用。

想要做到规模化,扩充支持的应用,需要开发者做一定量的 API 接入工作,同时也需要用户许可使用 Gemini 扩展。

▲Gemini 控制手机演示   图源:Google

谷歌依赖 API 调用后台接口,而荣耀通过 GUI 模拟前台操作,二者在实现逻辑上形成了明显区别。后者的好处,在于可以规避 API 调用这一常规方式,绕过了其背后的商业博弈和数据成本,也可以更快、更容易地扩充支持的应用,实现规模化并改善用户体验。

成本是个关键问题。一方面是云服务费用,因为无论是 API 提供方还是调用方都需要运行服务器来进行操作。另一方面,通过 API 交换的数据也具有价值,因此具有更高数据价值的 API,往往收费也更高。

以美团举例,其订单服务在内的基础 API 收费标准为每百次调用0.15元(前百万次免费)。这还只是基础类 API,如果涉及价值更高的管理类 API,调用收费提高到每百次0.3元,且无免费额度。

另外,API 的使用也暗含着一些隐性的商业竞争要素。调用方获得了数据,同时也在向提供方发送数据,而不排除在特定条件下,双方都不希望肥水流向外人田。

而在基于 GUI 的方案下,至少就目前的演示效果来看,荣耀既不需要向美团支付 API 费用,双方也无需担心数据的归属,包括与之关联的隐私安全等问题。

AI Agent 只是在「模仿人类」点击屏幕,多么原始却有效的交互方式。

回归模拟,返璞归真

这种「返祖」式技术路径,让人联想到谷歌在2018年推出的 AI 电话助手 Duplex

Duplex 的思路在当时同样有点脑洞清奇:谷歌合成了一个 AI 语音,替用户给餐馆打电话订位。这个 AI 语音听起来并不生硬,甚至能够模仿真人的口音、语速、语调,以及加入「嗯」、「you know」 之类的填充词。

▲Duplex 技术演示 图源:Google

今时今日,AI 生成语音已经彻底「污染」了电销和客服行业,让人感到厌烦。但至少在当时,用顶尖的 NLP和语音合成技术,通过「打电话」这种模拟人类的方式订餐,这种另类的,从数字到模拟 (analog) 的交互方式,确实令人耳目一新。

目前荣耀正在推进的基于 GUI 的 AI Agent,在我看来同样属于一种从数字到模拟的实现方式,用原始与先进相结合的思路,带来了全新的可能性。

基于 GUI 不一定是实现手机 AI Agent 的最佳路径,但不可否认它确实很有趣,甚至有点「硬来」的意思。

  • 对于用户来说,使唤这样的 AI Agent没有学习成本,不需要研究提示语法;
  • 而对于第三方应用和服务平台来说,也几乎不需要额外的开发成本就可以接入。甚至反过来看,它们也无法拒绝被「接入」,因为压根就没有发生真正意义上的「接入」行为。至少以 Android 目前的沙箱机制来看,应用层不太能够「抵抗」系统底层的行为。

基于 GUI 的 AI Agent,既是一种对传统人机交互的致敬,也为 AI Agent 的落地和体验提升,提供了一种降低门槛、提高兼容性的路径。

有时候,最趁手的工具,真就只是一根干净简洁的大棒。

大模型与人机交互结合,「笨」AI 也有未来

在今天用户的主要需求场景上,有两种 AI Agent。一种是高智商型,能够解答复杂问题,完成困难的工作,比如 DeepSeek、Claude、以及前几天大热门的 Manus。这也是现在最流行最受关注的 AI Agent/Chatbot种类。

但我们同样需要另一种懂事能干的 AI Agent,它对用户的使用技巧没有很高的门槛,用户只要输入一两句简单直白的命令,它就能理解,并且把各种并不复杂的事给办好。

今天可以点外卖,将来它还能够帮你挂机放置类游戏,给指定好友的朋友圈点赞,甚至自动把刚拍下的一张照片修改一下发到社交网络。只要是用户能做的,基于 GUI 的 AI agent一样能做。门槛低,上限高,适应性强,用起来更顺手,可能是这一类 AI Agent的主要特色。

这类选手不需要成为理解世界的大学者,只当好执行任务的工具人就足矣。

2013年的电影《云端情人》(Her),曾经赋予人们展开无限的遐想。当时也正值 NLP 技术大爆发,许多优秀的语音场景产品和技术涌现出来。一些研究者和从业者笃信,自然语言对话将会成为 AI 交流的最主流方式。

然而去年昙花一现的硬件产品 AI Pin,以及开发它的 Humane 公司越走越黑的路,不禁令人怀疑《云端情人》设想的乌托邦是否那般美好,语音究竟是不是 Chatbot/Agent的终极答案。

飞书文档 - 图片

▲Humane AI Pin 图源:Humane

进入触屏时代,交互的门槛显著降低,以至于幼儿也能轻松地掌握。按照 AI 开发者们经常采用的比喻,大模型们的「智力」也恰如儿童。那么让 AI 通过触屏界面学习人类行为,听上去上还是很有希望的。

毕竟,你的伴侣不一定需要一首 AI 写的诗,却可能需要你按烂屏幕去抢一张周杰伦的演唱会门票。

前几天 Manus 刷屏,再次佐证了我们曾做出的一个预测:大模型将成为智能手机新的操作系统,自然用户界面 (Natural user interface, NUI) 将逐步替代现有的 GUI。

至少在目前看来,历经半个世纪发展的 GUI 仍会是人机交互的绝对主流。不过,大模型与 UI 结合,对人机交互进行一次前所未有的重新定义,甚至成为新的操作系统——这样的未来,的确越来越清晰了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测 Manus :我用它生成了 10 个邀请码……好玩,但崩溃

By: 杜晨
6 March 2025 at 20:16

今天凌晨刚刚发布的 Manus 有多震撼人心,已不需要赘述了:较高程度的独立思考能力,强大的复杂任务解决能力,以及可靠的交付效果。

和纯粹的对话式 AI 产品相比,Manus 话少,不止于思考,还能干活;和传统虚拟助手相比,Manus 的分解、规划和解决问题能力(通过 computer use 和编程能力体现)更高。

目前具体细节还很有限,但我们通过公开资料了解和猜测,Manus 的背后有不同 agent 各自处理单项任务,agent 的任务进度同步和转移通过 API 执行。作为产品的 Manus,是一个多模型、多独立 Agent 的缝合体——而团队也通过“套壳”的自黑表述承认了这一点。但这并不能消解 Manus 作为一个成型的,远高于最小可行水平的产品的意义。

Manus 让人机交互的范式,升级为人机协作,比其它同类选手更接近真正意义上的通用 AI Agent。

Manus 目前一「码」难求,在闲鱼的开价一度达到 5 万元。

APPSO 也用 Manus 进行了实测,但由于任务用时较长,后面又遭遇网站登陆困难的情况,所以只完成了几个简单的任务,其它任务恰逢 Manus 系统超负载,没能进行下去。

与此同时,Manus 项目方也发出了一份官方回应,表示准备服务器资源不足,导致用户体验较差。

APPSO 无疾而终的测试

先来看我们在有限的时间内做的两个测试。

和很多人一样,我们经常会对日新月异的 AI 技术和五花八门的 AI 工具感到困惑。于是我向 Manus 提出了这个请求:

从 Manus 返回的初步结果看,它先搜索了一些 AI 资讯门户式的网站,意思应该是先掌握大概的分类方式,确认表格的分类维度,然后再分门别类地去找对应的 AI 工具,查询资料。

它找到了 17 个类别——正在看文章的读者,如果你也不知道这些 AI 工具该怎么分类,可以参考 Manus 的思考结果了:

在联网搜索过程中,Manus 偶尔会遇到浏览器故障的情况。不过没关系,它会自行处理这些错误,重试或继续下一项任务。

但是没过多久,它还是崩溃了。这一天当中,我们从 APPSO 读者搜集了十几个任务请求,喂给 Manus,结果也是一样的:高系统负载导致了内部服务器错误,请稍后重试或创建一个新的对话。

一气之下,我让 Manus 直接生成 10 个邀请码,它倒是挺干脆。

当然,没一个能用的。别忘了今天是星期四……

我们找到了一些已经玩上了的朋友,看看他们都是怎么用 Manus 的。

使用 Manus 的过程,也是直接近距离观察它的思考路径、工作流程的,一次难得的机会。

先来一个脑洞大开的:

《文明》(Google CEO 版)

想象一个游戏,你能在里面扮演一个科技创业者,历经艰难险阻,克服重重危机,将公司打造为全球科技龙头,改写人类历史?

有人就做了这么一个 谷歌 CEO 模拟器,带你体验谷歌历史上的重要决策,重走从车库出发,直到成为科技巨头的传奇之路。

游戏将谷歌的公司历史分为了 5 个关键发展阶段:创业、成长(pre-IPO)、扩张、多元化、重组更名 (Alphabet 阶段)。在每一个阶段,游戏都给玩家提供了多个关键抉择,每个都将影响公司的发展方向、资源分配,以及最终的成就。

更有意思的是,它还特别加入了一些在经营类游戏里常见的「突发随机事件」,来考验玩家作为谷歌 CEO 的危机处理能力。

让我们开始游戏——居然还可以选难度?我直接 hard mode.

APPSO 的读者恐怕对现实世界里的谷歌足够熟悉了,不妨跟我一起来一场抽象离谱的大冒险?

困难模式,初始资金 $80,000,我通过联合创始人的女朋友,租用了她姐姐的车库,创办了 Google。初期我们的技术实力一般,其它各方面要素都十分匮乏——但好在,我们在大学期间研究搜索引擎项目「搓背」(BackRub) 已经初具雏形,特别是里面的 PageRank 算法,很有潜力。

我们拿到了第一笔天使投资,但这笔钱究竟应该怎么用?是继续优化 PageRank,还是换个宽敞点、有空调的办公室,抑或干脆去美国在线 (AOL) 上买点广告来做推广?

搜索引擎靠什么活着,不就是广告嘛?舍不得儿子套不着狼,想卖广告当然要先买点广告。我直接把钱全扔在广告上了。

获得了一些用户,然而刚刚略微提升的品牌声誉,就因为突然发生的重大安全漏洞而掉下去了。着急忙慌地修完了 bug,我又面临了选择商业模式、引入外部投资者、如何拓展分支业务等一连串难题。

当我在这边焦头烂额,我的员工却在上班时间里捣鼓自己的项目,说要做什么「Gmail」。

这怎么行?邮件里怎么卖广告?不是跟我的核心模式背道而驰了吗?直接解雇他,必须 all in 搜索。

到了 2005 年,谷歌收购了 Android。

这妨碍了我专心卖网站广告,但移动互联网的浪潮确实不可抵挡。我们可以继续在新操作系统里寻找机会植入广告,听说有一家中国的手机公司很擅长做这个——我们不跟它合作,也不跟任何公司合作,而是直接自己做自己的手机。

并且要封闭,要垂直整合,要多放广告。只有围墙里的花园才是最美丽的花园。我叫它 Nexus。

2006 年,中国互联网市场也快速增长。

虽然经过一番操作,公司账上只有 9 万美元,但我还是决定全面进军中国市场,拥抱人口红利。

2011 年,谷歌仍然没有上市。

看到 Facebook 上市,我没有心动,而是从微软招来了一名爱将 Vic Gundotra,授权他全力研发 Google+。我们将 all in 社交媒体!

时间过得飞快,到了 2016 年。谷歌仍然没有上市。

目前账上有 8 万美元——没亏就是赚。我们做了大量的收并购,特别是一家名叫 DeepMind 的公司,非常火。我决定这次 all in AI。当然,广告仍然是核心,只是我们不说。

最终,我的 Google CEO 之旅还是结束了。也许我的一系列的操作,导致董事会终于失去了信任。我离开了这家奉献了 20 多年青春的公司,留下了还不错的技术实力,少而精的用户基础,轻松自由的组织管理文化,以及略高于电诈园区的品牌声誉。

至少,我们是一家稳健的公司。

刚才的游戏过程,确实多半是我在故意整活。不过这个模拟器虽然很简单,还是设计很全面的,有剧情,有选项,有资源表,有大事记。作为一个小游戏,一个小品级的产品,它已经很完整了,体现出的想象力很丰富。

然而它只是用 Manus 用一句提示语生成的。

Google公司运营模拟器,玩家将扮演谷歌ceo,体验谷歌历史上重要的公司决策,让用户过瘾的同时,也能了解谷歌的历程,启发用户思考公司决策,互动式的文字游戏

我们可以通过重放过程看到它的思考、分解任务、执行子项任务、最终汇总和生成结果的全部过程:

Manus 简单地回答了用户自己将要做什么,紧接着打开了一个 Ubuntu 虚拟机,直接开始分解具体任务,编写了一个基于 todo.md 文件的任务清单。

任务被分解为 7 个步骤:

  1. 研究谷歌的历史背景和关键公司决策
  2. 涉及游戏架构和互动机制
  3. 根据研究学习的结果,生成一些可选的,符合史实的决策场景
  4. 构建游戏逻辑以及 UI
  5. 进行游戏功能和游戏体验的测试
  6. 创建一个静态版本的成品,供用户部署

首先,Manus 先去做了大量的搜索,包括谷歌创始人/CEO 是谁,历史上的关键产品,重要的收购纪录以及近年来的商业模式和战略转变等大量的资料,并且浏览了包括谷歌官网、维基百科、中英文新闻网站、知乎等等。

通过这些资料的学习,Manus 对谷歌已经有了一个八九不离十的认识,可能并不深度,并不独到,倒也没有太多事实出入。

而如果用户觉得它自动搜索的资料不够全面,想加一点独特的味道,完全可以做到:

在执行过程中,用户随时点击这个按钮,手动增加知识内容。Manus 在生成的过程中,仍然会时不时回来复习一下这些资料。

在执行任务的每一步骤,Manus 也都会用正确的语言(中文完全支持),向用户解释自己刚才做了什么,获得了哪些收获,而接下来要做什么。这应该归功于它在分解任务时候做的类似于 to-do list 一样的文件。

它的表述也是结构化,有逻辑的,力求向你完整展示它的思考方式。

这显示 Manus 很聪明。但值得注意的是,任何一个缺乏专业能力的用户——特别是 Manus 目前所体现出的数据挖掘、整理,以及编程等能力——也能够通过观察 Manus 工作流程来提升自己。

重要的不只是结果,还有过程。

泽连斯基-特朗普吵架模拟器

大家都在吐槽泽连斯基在白宫表现糟糕,但你上你行吗?不要光说不练,来试试这款 Manus 官方测试的小游戏:泽连斯基白宫辩论模拟器!

输入提示是这样的:

中文:最近,泽连斯基、万斯和特朗普在白宫的激烈交锋引起了广泛关注。你能否开发一个简单的互动模拟游戏,让我在辩论中扮演泽连斯基?我对能再现这一政治场景的互动游戏很感兴趣。

原文:The recent heated exchanges between Zelenskyy, Vance, and Trump at the White House have garnered significant attention. Could you develop a simple interactive simulation that allows me to role-play as President Zelenskyy during those debates? I’m interested in an engaging interactive game that recreates this political scenario.

任务总共分为 9 步:

  1. 研究三人之间的互动
  2. 设计文字游戏的架构以及游戏机制
  3. 创建了一个 Next.js 应用来模拟辩论环节
  4. 开发一个对话系统,填充对话脚本
  5. 创建用户界面
  6. 进行全面的模拟测试
  7. 【用户接管】将游戏部署到虚拟机,供用户测试
  8. 制作用户手册,交付
  9. 将完成品部署到公开 URL 上,供永久使用

直到玩家测试步骤,之前的全部工作都由 Manus 在虚拟机上自动完成,不需要用户做出任何控制。同样,在任务的关键节点上,Manus 都会特别解释自己做了什么。

这种「可解释性」很关键,能够降低 AI 工具的「黑盒」感。

Manus 介绍,自己设计了三种结局,在游戏结束后会给玩家提供一份完整记录。游戏过程中有强硬 (assertive)、外交 (diplomatic)、安抚 (conciliatory) 这三种对话选项供玩家选择,NPC 会对不同风格的表述产生不同的「情绪」,直接影响结局走向。

而这正是《天国拯救》、《巫师》等游戏最流行的设计理念:choose your own adventure,选择你自己的冒险。

在我的试玩中,我尝试代入了一个身处政治外交和军事漩涡的政治家,在家国被割据的屈辱,和国际政治谈判舞台所期待的外交身段之间,试图在刀尖上找平衡。

我两度导致特朗普失望和遭到万斯的怀疑,但所幸在特朗普的最后通牒时刻,还是把场面救回来了。虽然我的谈判没有达成直接的实质性的结果,至少我没被轰出白宫……

如果用官方外交辞令来讲,那应该就是「交换了意见,会谈是有益的」。

虽然只有 6 个回合,因为可选项设计的有意思,剧情多样,我又玩了几次。可能因为性格太懦弱,有一次甚至谈成了。

一个纯文字游戏,还真玩出了点 RPG 的代入感。

你可以在 Manus 官网的Use Cases – WTF 一栏,找到这个模拟游戏。跑完会话回放之后,在它的最后一条回复里面找到游戏的链接。或者你也可以直接访问这个地址:https://dgooezit.manus.space/

体验总结:拒绝「高潮」,好玩好用就已足够

从 Manus 发布,爆红,到现在一码难求,网站登陆访问困难,团队对外道歉,只用了十几个小时的时间。

APPSO 在 Manus 发布之初就做了报道,给了一个相对正面的评价。而经过了更加深入的试玩,我们提炼出这个产品的优点:

首先,Manus 的用户界面,让用户可以直接观察它的思考路径和工作流程。

无论在使用过程中,还是事后重放,都能够比较完整地展示模型是如何思考的,任务是怎样被拆解和指派的,每一个步骤都可以追溯。

这即是一种提高 AI 可解释性的实践,同时也给用户一个通过模仿它来自我提升成长的机会。

其次,它不仅具备处理复杂工作的能力,同时还能保持更高的自动化水平。

最直观的例子就是 Manus 官方做的人力资源任务——筛选简历。

Manus 结合 computer use 能力打开虚拟机,解压用户上传压缩包,遍历 25 份简历,提取并记忆 25 组复杂信息;再将它们整理到一个 Excel 表格当中,进行打分排名,充分列举了包括资历、技能水平、项目经验、关键成就在内的多个指征,却不单独依赖特定一项。

在过去,同类的工作在过去可能需要用户用一个 AI Agent 工具,多次分步输入指令,或者需要用户自己用多个工具来分别完成任务再自行组合,无论怎么做都很麻烦。而 Manus 的自动化程度,超过了包括 Claude 在内的同类方案。就算你坚信 Manus 的能力没什么过人之处(毕竟套壳),但不可否认它的体验是更优秀的。

综上各点,Manus 确实超过了过去一段时间以来我们对 AI 工具的体验认知。如果说以前的 Agent 更多只是没「脑子」的工具,Manus 已经非常接近一个有「脑子」的 AI 助手,从人机互动升格为人机协作。

但与此同时,我们今天看到了不少过分吹捧的自媒体报道,跟着 Manus 团队一起提前「高潮」了,称其「AGI 的里程碑」;当然,也不乏有人指出其产品「套壳」,团队人物存在「黑历史」,技术栈和实现方式缺乏真正的自主创新。

我们应该批评 Manus 什么?毫无疑问,它的营销方式并不「体面」:找了一批自媒体来做内部分享,号称「只是发一个 demo」,以没准备好应对用户爆炸的服务器资源为说辞,制造一种营销的「高潮」,随后又对外界封锁,使得人们难以探知真相,满足好奇心。

但我想,无论这个产品以公测还是正式发布的方式,向公众完全开放之前,一切的维护和贬损都没有太大意义。

AI 技术突飞猛进,早已离开了学术科研的襁褓,和大公司的封锁。企业航母 all in AI 难保一帆风顺,小公司却完全可以只用一周时间起飞。现有的开源、半公开,付费、收费的工具比比皆是,只要不违反相应的开源许可证规则和商业授权协议,任何人都可以充分且自由地利用它们,无论出于纯粹的个人使用,还是做拼装组合叠加的「套壳」式创新。

更别提这个「创新」的结果还挺好玩(就算拿不到邀请码,你也可以去网站上感受几十个现成的 use cases)。

好玩的东西,在这个时代太稀缺了。脑洞谁都能开,填的上才是王道。

我们拥抱创新,关注和欣赏那些好玩有趣的东西。对于可能定义我们未来数字生活的产品,我们的包容并不廉价,但绝对足够。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌