Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

马斯克最新指示:机器人接管一切,你在家里躺着数钱

By: 李华
2 September 2025 at 18:00

今天凌晨,特斯拉公布了他们的《宏图计划第四篇章》。

与以往聚焦汽车或能源产品的蓝图不同,特斯拉这次描绘了一个更遥远、也更理想化的终点:一个由 AI 和机器人主导的「可持续富足」的社会。是的,特斯拉的战略重心已经从「可持续发展」,转向了对未来社会形态的构想。

这个构想的核心,不再是车,而是生产力本身。马斯克说:

特斯拉 80% 的价值,将来自 Optimus(人形机器人)。

回顾特斯拉宏图计划的第一篇和第二篇,它们的逻辑清晰而务实:

2006 年的第一篇章,为特斯拉画出了一条从高端小众市场切入、最终走向大众化车型的产品路线图,解答了电动汽车的生存和市场定位问题。十年后的第二篇章,则围绕已经站稳脚跟的汽车产品,构建了一个包含太阳能、储能、自动驾驶乃至共享出行在内的完整生态。

这两份计划的共同点,是它们都聚焦于特斯拉自身的产品与商业战略,回答的是「特斯拉要做什么」。

转折点出现在 2023 年的宏图计划三。

它看起来不再是特斯拉的一份商业计划,而是一份面向全球经济的分析报告。特斯拉用海量数据,试图从物理学和经济学的第一性原理出发,去论证全球全面转向可持续能源的可行性。

果不其然,这份报告换来的是特斯拉的股价大跌——

它描绘了一个极其宏伟的,需要大量工业产能才能实现的目标,却也因此暴露了,依靠现有生产方式,根本无法填补的巨大生产力鸿沟。这是一个系统性的问题,远非特斯拉一家公司所能改变。

而在最新的第四篇章中,马斯克似乎还是没能给出更务实的答案。它没有选择回归到更具体的商业或产品规划,反而将蓝图的尺度再一次放大,从改造全球能源体系,升级到了重塑人类社会本身的生产力结构。

这使得第四篇章看起来同样不像一份「商业计划」,而更像是一份关于未来的「愿景」。

在这份新的蓝图中,人工智能(AI)被提升至驱动一切的底层技术,成为整个系统的大脑;而人形机器人(Optimus),则是负责执行所有生产任务的物理实体。而汽车、储能等特斯拉现有的硬件业务,都将成为其 AI 能力的下游应用场景。

这一切的前提,是机器人本身必须能够被大规模制造。

特斯拉认为,通过借鉴汽车行业的规模化生产经验,快速地大规模生产机器人来替代人类劳动力,在逻辑上是可行的。它们的最终目标,是建立一个全新的、由机器驱动的生产体系,从而实现生产力的指数级增长。

这样一个由机器驱动的生产体系,必然需要一套全新的社会经济来与之匹配。在马斯克的 X 平台上,被讨论得最多的问题是:

当机器人取代人类劳动力时,那些失业的人该如何维持生计。

马斯克是这样回答的:

未来将实现普遍的高收入(而不仅是基本收入)。每个人都将拥有最好的医疗、食物、住所、交通和其它一切。
这是一种「可持续的富足」。

马斯克提出的这套「普遍高收入(UHI)」的构想,核心机制是通过对机器人创造的巨大生产价值进行征税(例如以消费税形式),再由政府以高额收入的形式分配给所有公民。

X 上有支持者认为,生产力的提升还会伴随着物价的下降,这份「收入」的购买力也会大幅提高。

然而,这一构想的实施路径、政治阻力以及对社会结构的冲击,都是悬而未决的难题,特斯拉并没有在他们的「宏图计划」里提到这些。甚至当我们把这套构想置于具体的国家情境下审视,它的复杂性还会更加突出,尤其是在中国。

抛开这些,特斯拉自身也正面临诸多现实问题。

前不久,被马斯克寄予厚望的 Dojo 超级计算机团队宣告解散,团队的负责人彼得·班农(Peter Bannon)也将离职。Dojo 曾被定位为特斯拉在人工智能竞赛中获取算力的核心,马斯克对此的解释是「整合资源发展 AI5、AI 6 以及后续的芯片」。与此同时,特斯拉的汽车业务在欧洲和中国也没有那么顺风顺水了。2025 年上半年,特斯拉中国市场销量同比下降约 5.4%,其中二季度更是同比下滑了 13.5%。

这些内部的动荡与外部的挑战,都与第四篇章所描绘的指数级增长和「富足的未来」,形成了鲜明对比。

总之,从这份「宏图计划」来看,特斯拉已经对他们的战略方向作出了重大调整,它们的雄心,已经远远超出了商业的范畴。

只是,一家科技公司可以设计和制造改变世界的工具,但要实现马斯克口中的「可持续富足」,远非一家公司之力所能及。

🌟 以下是特斯拉宏图计划第四篇章全文:

引言

自特斯拉成立以来,我们每一版的宏图计划都聚焦于我们的北极星:实现不受约束、毫不妥协的可持续性。

人类是工具的创造者。在特斯拉,我们大规模、低成本地制造实体产品,目标是让每个人的生活变得更美好。

随着人工智能(AI)技术的影响力与日俱增,《宏图计划第四篇章》所阐明的使命,也就不足为奇了。

特斯拉故事的下一个篇章,将帮助我们创造一个我们刚刚开始想象的世界,其规模将前所未见。我们正在打造能将人工智能带入物理世界的产品与服务。

近二十年来,我们孜孜不倦地努力,通过发展电动汽车、能源产品和人形机器人,为这场技术复兴奠定基础。

现在,我们将我们的制造能力与自动驾驶技术实力相结合,以提供全新的产品与服务,它们将通过由全人类共享的经济增长,来加速全球繁荣与人类的兴盛。我们正在大规模地统一我们的硬件和软件,并在此过程中,创造一个更安全、更清洁、更愉悦的世界。

这就是可持续的富足 (sustainable abundance)。

中心思想

1. 增长是无限的

一个领域的增长,并不需要以另一个领域的衰退为代价。资源的短缺可以通过技术的进步、更强的创新和新的思想来弥补。

那些赋予我们驱动机器能力的技术,引发了工业革命,拓宽了我们的经济格局,为所有人创造了更多机会。半导体和互联网等突破性发明,在人类体验的方方面面——从创造更多就业、提供更广泛的信息渠道,到实现更深层的人际连接——都扩大了社会和经济机遇,而非削弱。

我们渴望超越所谓的「可能」,这将促进实现真正可持续丰裕所必需的增长。

2. 创新消除限制

几个世纪以来,人类的主要交通工具是马。而后,在过去五十多年里,由化石燃料驱动的内燃机汽车成为了标准且理所当然的交通方式。那种认为电池可以被经济地、大规模地生产,足以让交通行业摆脱化石燃料的想法,在当时看来似乎是痴人说梦——直到特斯拉引领了前进的道路。

通过持续创新,我们克服了电池发展的技术限制,并建立了一个由可再生资源驱动的产业。

3. 技术解决实际问题

在向可持续丰裕加速迈进的过程中诞生的产品和服务,将通过解决真实世界的问题来推动人类进步。为了进一步加速创新,我们让每一款产品的制造都比上一款更高效、更可持续。

太阳能发电和大规模电池储能正在提高我们社区清洁电力的可用性和可靠性——并且是以更经济、更可持续的方式。

自动驾驶汽车有能力极大地提升交通的经济性、可用性和安全性,同时减少污染,尤其是在我们日益密集的国际化大都市中。

Optimus——我们的自主型人形机器人——不仅在改变人们对劳动本身的认知,也在改变其可用性和能力。那些尤其单调或危险的工作和任务,现在可以通过其他方式来完成。通过这种方式,Optimus 的使命是把更多时间还给人们,让他们去做自己热爱的事情。

4. 自主性必须惠及全人类

我们在特斯拉制造的工具,帮助我们打造能够促进人类繁荣的产品。

我们如何开发和使用自主性——以及它为我们带来的新能力——都应以其提升人类福祉的能力为指导。通过我们的自主技术,让所有人的日常生活变得更美好、更安全,这一直是、且仍将是我们关注的焦点。

5. 更广泛的普及推动更强劲的增长

要建立一个繁荣且不受约束的社会,就必须能大规模地制造出价格亲民、技术先进的产品。这有助于进一步推动社会的民主化,并在此过程中提高每个人的生活质量。精英制度(Meritocracy)的标志在于创造机会,让每个人都能利用自己的技能去实现他们所想象的一切。

每个人都应该获得这些机会,而技术的增长可以帮助确保我们每个人都能最大限度地利用我们最有限的资源:时间。

我们正在加速世界向可持续富足的转型

我们必须明确一点:要克服这一挑战将是极其困难的。消除稀缺性需要不懈的努力和精湛的执行。有些人会认为这不可能实现。还有很多人会为我们在此过程中不可避免遇到的每一个障碍和挫折而喝彩。但一旦我们克服了这一挑战,我们的批评者们终将看到,他们曾经认为不可能的事情,确实是可能的。而这对我们来说没关系,因为最重要的是,我们能共同为子孙后代创造一个可持续且真正富足的未来。

所有值得的旅程都是漫长的。而它们都始于第一步。

我们的第一步是制造一款激动人心的跑车——Roadster。接着,我们利用这些利润来资助更亲民、但同样激动人心的产品——Model S 和 Model X 的研发与生产。然后我们重复了这个过程,带来了 Model 3 和 Model Y 以及后续车型。

这个过程要求我们走出许多步,其中有些是小步,有些则是大步。但最终,每一次胜利都引向了下一次胜利,即使经历了失败,我们也能不断积蓄势头。我们的势头让我们得以构建出一个全面整合的可持续产品生态系统,涵盖从交通到能源生产、电池存储和机器人技术。

今天,我们正处在一个革命性时期的风口浪尖,为前所未有的增长做好了准备。而这一次,对特斯拉和全人类而言,它将不再是单一的一步,而是一次飞跃。我们将要开发的工具,将通过重新定义劳动力、出行和能源这三大基本构成要素的规模和普惠性,帮助我们建立一个我们一直梦想的世界——

一个可持续富足的世界。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


《时代》公布 AI 100 人:任正非梁文锋王兴兴入选,还有OpenAI最恨的两个人

By: 爱范儿
29 August 2025 at 18:34

今天,《时代》周刊发布了 2025 年度 AI 领域最具影响力的 100 人名单。

当中像 Sam Altman、黄仁勋、马斯克这些几乎天天霸占头条的 AI 明星自不必说,而 OpenAI 、Meta、Google 这些大厂还有多位员工入选。

今年也有多了不少中国面孔,包括DeepSeek CEO 梁文锋,华为创始人任正非、宇树科技 CEO 王兴兴、小马智行 CEO 彭军等等。

值得一提的是,在一众技术背景强大的大神中,也有并非 AI 行业内的,比如华人记者 Karen Hao ,她花了 7 年调查,在新书中揭开了 OpenAI 的大量内幕。

Karen Hao 和马斯克,可能是奥特曼最恨的两个人了。

比起谁上榜了,谁没上榜可能更值得玩味。比如前 OpenAI 首席科学家 Ilya Sutskever,他创办的公司 SSI ,在没有推出任何产品的情况下,估值已经达到 320 亿美元。

▲Ilya Sutskever 刚换了新头像.

此外,机器学习之父 Hinton 和 DeepMind CEO 、诺奖得主 Demis Hassabis,也没出现在这份榜单。

APPSO 节选部分上榜人物和《时代》的评语跟大家分享,完整名单也放在下面了👇

《时代》公布 AI 100 人🔗
https://time.com/collections/time100-ai-2025/

任正非

任正非从不畏惧自我革新,一个退伍基建工程兵,成长于中国贵州省一个有七个孩子的贫困家庭,自幼饱尝饥饿。1987 年,他创立了华为,最初只是一家倒卖香港制造的电话交换机的小公司。不久之后,公司便开始自主研发电信设备、手机和笔记本电脑,随后又涉足了云计算,甚至是电动汽车领域。

如今,任正非领导着全球举足轻重的 AI 巨头之一。据报道,华为最新的昇腾 910C AI 芯片,在推理任务上的性能已能达到英伟达最新 H100 芯片的 60%,这一成就也让华为一跃成为中国挑战美国技术霸权的核心力量。此外,华为还拥有 CloudMatrix 384——一个使用国产芯片构建的本土 AI 系统,以及自家的鸿蒙操作系统。

梁文锋

1 月 20 日,中国 AI 初创公司 DeepSeek) 发布了 R1,这是首个向 OpenAI 当时最新发布成果发起挑战的开源模型。这也创造着了一则强有力的叙事——中国仅凭极小部分的算力,便足以与美国的顶尖水平相抗衡。

这让 OpenAI 耗资 5000 亿美元、名为「星际之门」(Project Stargate) 的超级开发项目备受质疑。恐慌的投资者们纷纷抛售英伟达及美国科技股的股票,引发了短暂却惊人的 万亿美元市值蒸发。

王兴兴


今年 1 月,当数十台机器人在春晚上整齐划一地同步起舞时,这让它们的制造商宇树科技 (Unitree Robotics) 大放异彩。但创始人兼 CEO 王兴兴看到的,是超越浮华、更具实用价值的未来。他告诉《时代》周刊 :「我们的希望是,机器人能够真正帮助人们应对生活中的方方面面——无论是在家庭、工业还是农业场景中。」

尽管王兴兴表示宇树的核心是一家硬件公司,但他相信,人工智能的进步将让机器人无需预先编程就能处理更多任务,例如清扫一个它们从未见过的房间。「若想让 AI 真正发挥作用,帮助人类解决现实世界的问题,我们就需要机器人技术这个载体,」他说,「这正是我坚信 AI 与机器人技术密不可分的原因。」

萨姆·奥特曼

他是人工智能领域权势最盛之人,但并非什么履历光鲜的程序员。他连本科学位都没有,更别说那张在他所在领域日益成为「入场券」的计算机博士文凭。然而,萨姆·奥特曼在学术资历上的短板,都由他纵横捭阖的交易手腕、敏锐的政治嗅觉和超凡的个人魅力所弥补,甚至有过之而无不及。

因为 Open AI 在2025年面临的挑战,早已超越了编写代码的范畴。它需要一位领袖,既能驾驭特朗普治下的波诡云谲,与世界领袖谈笑风生,又能管理巨型数据中心的建设,并抵御来自内部的权力威胁——与此同时,还要以惊人的速度发布产品,这种频率对于一家规模大十倍的公司来说才算正常。

正是因为奥特曼在所有这些任务上都游刃有余,他如今作为 CEO 的权势,已然达到了OpenAI 历史上的巅峰。

马斯克

即便以埃隆·马斯克本人的标准来看,这也是不平凡的一年。2024 年,他的公司 xAI 仅用 122 天,就将孟菲斯一座废弃的伊莱克斯工厂改造成了名为 Colossus 的全球最大超级计算机,随后又迅速将其内部的英伟达图形处理器 (GPU) 数量翻倍至 20 万个。今年 2 月,xAI 发布了 Grok 3,紧接着在 7 月又推出了 Grok 4,并称其为全球最聪明的 AI。

黄仁勋

创造一款人人都想要的产品,是大多数 CEO 的梦想。然而,对于英伟达的黄仁勋而言,当这个梦想成真时,却演变成了一场地缘政治的挑战。市场对英伟达 AI 芯片永无止境的需求,不仅催生了全球首家市值突破 4 万亿美元的公司,更将其推入了那个令人不安的风暴眼。

扎克伯格

中国公司已经取代 Meta 成为开源 AI 领导者,而 Meta 自己的 Llama 4 又未能收复失地时,马克·扎克伯格掏出了他的支票簿。这场行动始于一笔 143 亿美元的交易,旨在挖角 28 岁的 Scale AI 联合创始人 Alexandr Wang 及其几位顶尖工程师——此举被批评者视为其追赶对手的最后一搏。

那仅仅是扎克伯格数十亿美元人才招揽狂潮的开始。据报道,该公司在 8 月冻结招聘前,已成功招揽了至少 50 名研究员,但最近随着 Meta 内部的调整,不少跳到 Meta 的 AI 人才开始陆续离开。

李飞飞

被誉为「AI 教母」的李飞飞 (Fei-Fei Li) 在 21 世纪初为 AI 图像识别系统的创建发挥了奠基性作用,并由此推动了深度学习革命的浪潮。

2024 年 9 月,李飞飞与三位同事为 World Labs 筹集了 2.3 亿美元资金,投资者中包括杰弗里·辛顿 (Geoffrey Hinton)。她领导的这家初创公司旨在创建「大型世界模型」(Large World Models),使其能像 ChatGPT 等大语言模型理解语言一样,去感知和分析 3D 世界。该团队希望,这些模型能让人们想象并创造出可以像电子游戏一样漫游和探索的 3D 空间——其潜在应用包括飞行训练模拟、物理实验或城市规划。

Karen Hao

华人记者 Karen Hao 早在 ChatGPT 风靡全球的数年前,就开始报道人工智能——尤其是 OpenAI。她将这些报道汇集成Empire of AI 一书,这本引人入胜的畅销书不仅在硅谷,更是在全球范围内掀起了波澜。

她揭示了OpenAI 这家明星公司背后鲜为人知的一面,尽管没有点名该书或作者,但 OpenAI CEO 萨姆·奥特曼曾在 X 平台上发帖阴阳:「没有哪本书能把所有事情都说对,尤其是当有些人一心想要歪曲事实的时候。」

Alexandr Wang

年仅 28 岁的亚历山大·王 (Alexandr Wang)成为了 Meta AI 的掌门人。旨在创造超级智能——一个假设中比人类更聪明的 AI 系统。

在加入 Meta 前不久共同撰写的一份政策报告中,王曾写道,超级智能 AI 可能「是自原子弹诞生以来最危险的技术发展」。如今,他和 GitHub 的前 CEO Nat Friedman 正在一家拥有超过 30 亿全球用户的公司内部,帮助打造这项技术。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


马斯克星舰终结「四连炸」!未来有望 40 分钟内到达地球上任何地方

By: 莫崇宇
27 August 2025 at 11:07

蹲守星舰直播,注定心跳加速。

要么见证历史。

要么见证马斯克放烟花。

不过,SpaceX 今天还是得到了命运女神的眷顾,在接连「四连炸」后,星舰第十次试飞终于不负众望——成功发射,完成既定关键任务。

质疑马斯克「画饼能力」的声音,至少在今天得暂时安静了。

一场「故意找茬」的极限试飞

本次发射的「星舰」长约 120 米,直径约 9 米,由两部分组成,一个长约 70 米的超重型(Super Heavy)助推器,以及一个称为「星舰」的上级飞船。

两部分均由不锈钢制成,目标是实现快速、完全重复使用。

这一次,超重型助推器将不会回到发射场进行「夹筷子」的操作,而是前往墨西哥湾外海进行受控溅落。与此同时,星舰上级飞船则会继续飞行,最终在印度洋受控溅落。

话不多说,让我们来详细回顾整个飞行过程。

星舰顺利点火升空,搭载的 33 台猛禽发动机运行状态良好,顺利通过了最大动压阶段这一关键节点。

▲马斯克站在星舰底下,图片来自马斯克社交平台

(APPSO 注释:最大动压阶段(Max-Q,Maximum Dynamic Pressure)是航天器或火箭从地面起飞穿过大气层时,因速度不断增大而空气密度逐渐降低,两者共同作用下出现的一个「动压峰值」时刻。)

此次助推器的主要测试目标集中在着陆点火。

具体来说,当星舰(上级飞船)和助推器分离后,助推器要回到地球并尝试「着陆」。第一步,它需要把自己翻转过来(控制翻转),让发动机面向正确方向,才能点火减速。

▲ 热分离

翻转后,助推器会点燃发动机,进行一次反向推力(点火回推)。这相当于踩刹车,让助推器逐渐脱离原本的上升轨迹,转而走向预定的下降轨迹。

这个动作在第 9 次飞行中演示过,其优势在于需要预留的推进剂更少,从而可以在上升阶段使用更多燃料,将更大的有效载荷送入轨道。

更难的部分在最后的着陆阶段。

按照原有设计,最终着陆需要依靠三台中央发动机同时点火,但这次测试中将故意关闭其中一台。这种设计更像一次「爆胎测试」:要看高速行驶中的车,是否还能稳稳刹停。最终,它将用仅剩的两台发动机在海面上方短暂悬停,然后关闭发动机并坠入墨西哥湾。

从今日的测试结果来看,助推器的整体表现堪称完美。相较于助推器,星舰上级飞船承担的任务同样复杂多样。

进入二级飞行阶段后,星舰持续上升,并首次成功释放 8 颗星链模拟卫星,整个部署过程大约每分钟释放一颗,有序完成全部部署。

▲ 打开舱门,释放星链模拟器

这些星链模拟器的规格与下一代星链卫星基本相当,可以简单理解为 V2 Plus 版本,本质上是为未来正式发射 V3 卫星进行的重要彩排。

未来每次由 Starship 搭载发射的 V3 卫星,预计能为星链网络增加 60 Tbps 的容量,是目前猎鹰 9 号单次发射所增加容量的 20 倍。

除了卫星部署,本次飞行任务还承担着另一项重要测试——在太空环境下重新点燃一台猛禽发动机,划重点,这对未来的轨道机动至关重要,最终也是顺利成行。

但仅仅验证正常功能还不够,SpaceX 研究团队还要主动「找茬」。

为了测试极限性能,他们先把一部分隔热瓦直接拆掉,让裸露的机体去硬扛大气层的高温冲击,好观察弱点在哪里。与此同时,还装上了几种不同材料的金属隔热瓦,其中甚至有带主动冷却功能的版本,看哪一种方案更可靠。

另外,为了解决第六次试飞出现的「高温热点」问题,他们把隔热瓦的边缘打磨得更锋利,让气流更顺畅地滑过,不至于在某些位置积热。

从直播画面来看,隔热整体表现良好,襟翼也在高强度环境下保持了控制,虽然出现了局部烧蚀与表皮翘起,但飞船结构及压力系统依然稳定。

按照预定计划,最终连飞行轨迹都需要经过特殊设计:它会在再入时正面迎上最猛烈的气动压强,特意把尾翼推到极限,看结构能不能撑住。这是一场近乎「自虐」的测试。因为真正的飞往火星,不容许任何软肋。

最后,星舰成功完成翻转机动,按计划执行着陆程序,圆满地在印度洋实现受控溅落。

星舰,人类生存的 B 计划

延期,对星舰来说几乎成了家常便饭。

8 月 25 日凌晨,由于地面系统的液氧出现了泄漏,发射窗口在最后关头被迫关闭。问题解决后,第二天再次加注燃料,眼看箭在弦上,但奈何征服星辰大海的路上,天气才是真正的甲方。

一朵砧状云层悬在发射场上空,迟迟不肯散去。

砧状云层并不是善茬,由于内部蕴含着强烈的电荷,随时可能引发闪电。对于装满液氧和甲烷的星舰来说,任何电击都可能让它在离开发射架之前就化为火球。SpaceX 只能再次按下暂停键。

谨慎并非小题大做,今年进行的第 7、8、9 次飞行接连遭遇重大故障。

比如第 9 次飞行在虽然成功进入了太空,但因为燃料箱增压系统的扩散器故障,甲烷泄漏导致飞船在太空中失控翻滚,最终在重返印度洋上空时烧毁。

而原本计划用于第 10 次飞行的 36 号星舰在今年 6 月的一次地面测试中发生爆炸。虽然没有人员伤亡,但飞船被完全摧毁,SpaceX 的独立测试场也遭受严重损坏。

紧急启用 37 号备份星舰虽然解了燃眉之急,但 COPV 的不可预测性给载人飞行蒙上阴影。这个看似简单的压力罐承担着推进剂增压的重任,一旦失效就是灾难。

昨天,亲自督战的马斯克也出现在了官方直播间,与主持人和星舰工程副总裁 Bill Riley 进行了长达 30 分钟的对话,并再次重申了他的宏大愿景:

「从一开始,星舰就和猎鹰或其他火箭不同——我们设计它是为了大规模量产。不是造一艘星舰、飞一次轨道就够了,而是要持续、快速地做到这一点。我们最终目标是每年建造数千艘星舰,这是为了在火星上建立一个自给自足的城市所必需的。」

火星移民是个筐,什么技术都能往里装。移民、能源、机器人,这个筐越大,人类的想象力就越大。而马斯克的潜台词是,星舰就是人类的 B 计划,让文明永续,不管在哪个星球。

听着像天方夜谭,但马斯克还真给出了具体的时间表。

今年 3 月,马斯克表示,首批星舰将于 2026 年年底搭载特斯拉人形机器人「擎天柱」登陆火星,如果登陆顺利,则载人火星任务「最早可能于 2029 年实施,不过 2031 年的可能性更大」。

但到了 5 月,口风变得更谨慎「如果运气好,我们会尝试抓住这个机会,」他说,「但我觉得成功率大概只有一半一半。」

「快速迭代」这四个字,本来就是商业航天的口头禅。问题是大部分人只是嘴上说说,真到了关键时刻,还是选择稳一手。这些理念在传统航天巨头那里,基本属于听听就好的状态。而 SpaceX 奉行的是一种特立独行的开发理念——「先试后改」。

于是乎,星舰的试飞史,就是一部「花式死法大全」——每种死法都价值亿万。虽说失败是常态,但每次失败都为下一次积累经验。正是这种「野路子」,让 SpaceX 保持了全球最快的迭代节奏,也让星舰距离火星更近。

不过,这种工程路线上的莽也有代价。

随着星舰越来越接近火星载人飞行的任务,容错率会急剧降低。美国 NASA 对载人航天的安全标准极其严苛,任何系统都需要经过反复验证。而从目前的情况来看,星舰要达到载人标准还有很长的路要走。

除了火星梦,马斯克还在不断兜售地球快递服务——利用星舰进行地球点对点运输。

「你可以在 40 分钟内到达地球上任何地方。从洛杉矶到悉尼不到半小时,从纽约到新加坡半小时,横跨大西洋只要 10 分钟。轨道火箭是已知最快的交通工具,速度是商用飞机的 30 倍,而且视野绝佳。」

但连续两天的跳票也提醒我们,无论愿景多么宏大,现实的技术挑战依然严峻。不过,这或许正是航天事业的魅力所在——它永远在推动人类挑战物理定律的极限,也永远充满了不确定性。

正如马斯克所说:「解释为什么要做某件事总是很重要的,而研发星舰的原因就是我们希望人类能够成为一个多星球物种。」这个目标足够宏大,也足够重要,值得我们在现实的困难面前保持耐心和信心。

火星可能不需要人类,但人类永远需要火星,也是在需要一个够远、够难、够疯狂的理由,继续折腾,继续抬头仰望。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


34.99 万元?特斯拉 Model Y L,用 6 个座位杀入中国「家庭战争」

By: 李华
17 July 2025 at 13:53

特斯拉终于学会了倾听,但它的第一声回应,却只说给了中国市场。

这两年,「给马斯克写信要一台更大的车」在北美几乎成了一个网络热梗。无数家庭用户抱怨着 Model Y 的空间局促,而这位 CEO 本人也曾在社交媒体上用一句轻描淡写的「OK」,承认了这一普遍需求的客观存在。

大家都在等待承诺兑现的那一天,但谁也没想到,答案会以如此出人意料的方式揭晓。

北京时间 7 月 16 日晚,特斯拉中国官方微博突然发文:「Model Y L,金秋见。」没有发布会,没有长篇大论,用最简短的文字,确认了一款中国市场首发、传闻已久的六座新车型的到来。

这是一款基于全球销冠车型 Model Y,通过加长轴距和车身,从根本上解决其空间短板的「魔改」版本。它不再试图用一个「小板凳」式的第三排去勉强充当 7 座车,而是直接变成了一台真正的六座车。

这款被冠以「L」之名的 Model Y,既是特斯拉对市场需求的一次回应,也宣告了它将以一个更务实、更具攻击性的姿态,卷入这片最激烈的存量市场竞争。

一个字母「L」的全部意义

要理解 Model Y L 的本质,必须从一组最关键的数字开始。

根据工信部的申报信息,Model Y L 的轴距达到了 3040 毫米,相比现款车型增加了整整 150 毫米,甚至比 Model X 还要长。

这 15 厘米的轴距增量,最终体现在了 4976 毫米的车身总长上,比现款长了 179 毫米,接近 18 厘米。同时,车身高度也增加了 44 毫米,达到了 1668 毫米,宽度则保持不变。

▲ Model Y L 还换上了新轮毂,图片来自:常岩CY

这些冰冷的数字,在官方发布的侧面对比图中变得直观起来。肉眼可见,Model Y L 几乎所有的拉伸都集中在 B 柱之后,后车门的长度被明显放大。

更关键的改变发生在车身后半段。C 柱的位置显著后移,车顶线条的下滑趋势也变得更为平缓。这彻底改变了原版 Model Y 紧凑、动感的溜背姿态,转而呈现出一种更舒展、更稳重的形态。

▲新款 Model Y 与 Model Y L 的尺寸对比,图片来自:常岩CY

设计的改变直接服务于体验。更长的后门,意味着乘客进出第二排、尤其是第三排时,将拥有一个更宽敞、更从容的门洞,不必再以一种狼狈的姿势钻入车内。

而在车内,这 15 厘米的轴距增量,可以为第二排乘客带来更奢侈的腿部空间,并让出一条真正可供通行的中央过道。而车顶的增高,则确保了第三排乘客能拥有具备实用意义的头顶空间。

特斯拉的工程师们之所以要进行如此一番「大手术」,正是因为他们深知,在原版 Model Y 的车身框架内做文章是行不通的。

此前在北美市场推出的 7 座版 Model Y,其第三排空间一直被用户和媒体诟病为「只能坐狗,还不能坐大狗」,不仅空间狭小,甚至连空调出风口都未配备,实用性几乎为零。

▲ 七座版 Model Y 的三排难以坐下一个成年人

所以,Model Y L 的出现,并非一次锦上添花的配置升级,而是一次必要的车身架构调整。这是特斯拉为打造一款合格的六座车,所必须付出的工程代价。

除了这些肉眼可见的尺寸变化,工信部的申报信息中还隐藏着更多看不见的细节。

Model Y L 搭载的前后双电机功率分别为 142kW和 198kW,综合功率 456 马力,相比现款长续航版有小幅提升。

更值得关注的是整备质量。Model Y L 的重量达到了 2088kg,相比现款长续航版的 1995kg,增重了约 93kg。这几乎相当于车上多坐了一位成年男性乘客。

对于任何一款电动车而言,重量都是续航的天敌。这多出来的 93 公斤,无疑会对 Model Y L 的能耗表现和续航里程造成影响。

另一方面,车身加长和增重,也让外界对其驾驶感受产生疑问:它是否还能保持特斯拉一贯的、被用户称道的凌厉操控和驾驶乐趣?还是会变得更偏向舒适,而牺牲掉一部分运动性?

特斯拉的工程师似乎也预见到了这一点。申报信息显示,Model Y L 的后轮用上了更宽的 275/45 R19 规格轮胎,而现款的后轮宽度为 255 毫米。

更宽的后轮意味着更大的接地面积,这通常是为了应对更重的车身或更强的动力,以提供更好的抓地力、稳定性和制动性能。这可以看作是为平衡增重影响而做出的一项工程补偿。

总之,无论是车身的重新设计,还是三电与底盘的适应性调整,都指向一个事实:Model Y L 并非一次投机取巧的「拉皮」改款。

它是在充分理解目标市场需求后,特斯拉拿出的一套系统性的产品解决方案。而这套方案,即将被投入到一场真刀真枪的市场博弈之中。

当特斯拉卷入「家庭战争」

一款产品最终能否成功,定价是关键。而在 Model Y L 的售价上,市场却出现了两种截然不同,甚至可以说是相互矛盾的预测。

最先抛出观点的,是来自最直接竞争对手的隔空喊话。理想汽车创始人李想预测,Model Y L 的价位将在 20 至 30 万元之间,这无疑是一个极具杀伤力的价格。

但另一边,部分媒体结合其传闻中「旗舰」、「更高级内饰」的定位,给出了 40 万元左右的估价。这一定价,指向的显然是一个更高端的市场。

抛开这些烟雾弹,从产品本身出发,我们或许更能得出合乎逻辑的结论。

Model Y L 的技术蓝本是售价 31.35 万元的长续航版,这应是其定价的基准。在此基础上,车身结构的加长、新增的第三排座椅、以及潜在的内饰升级,综合来看会带来 4.5 至 6.5 万元的成本与价值提升。

这意味着,新车的最终售价落在 34 万至 38 万元的区间内,才最符合商业逻辑。李想的预测更像是一种影响舆论的营销策略,而 40 万元的定价则可能让 Model Y L 曲高和寡,并非明智之举。

无论最终定价如何,特斯拉选择的,都是一个已被行业公认的风口。正如蔚来创始人李斌所言,大空间 SUV 的纯电时代已经到来。

▲ 图片来自:@Navis-慢点评测

但特斯拉的反击,似乎并不仅仅局限于 SUV 市场。据财联社报道,一款售价约 27 万元的 Model 3 单电机长续航版也即将回归中国市场。

这是一套清晰的组合拳,面对连续下滑的在华销量,特斯拉选择在两个核心战场同时发力,重夺市场主动权。

Model 3 单电机长续航版的回归,是为了巩固和加强其在 25-30 万级纯电轿车市场的竞争力;而 Model Y L 的使命,则是深入因中国家庭结构而兴起的大家庭用车腹地,直面「蔚小理」们的竞争。

本月,蔚来第二品牌乐道汽车的 L90 已开启预售,理想汽车的首款纯电 SUV 理想 i8 今天已经开放预订,而问界 M8 的纯电版也计划在 8 月上市。

无论 Model Y L 最终定价如何,它的存在本身,就足以迫使所有定位在 30 万区间的六座和七座 SUV,都必须重新审视自己的定价、配置和市场策略,以应对这个自带品牌光环和成本优势的强大变量。

透过这款产品,我们也看到特斯拉上海研发中心日益重要的战略地位。这不再是一个只负责执行生产任务的工厂,它已经开始有能力主导一款车型的深度改造,以回应本土市场的需求。

这种在中国市场验证成功后再推向全球的模式,也为特斯拉的未来留下了想象空间。当初那些在马斯克社交媒体下留言的美国用户,或许有一天,也能等来这款在中国市场淬炼过的产品。

然而,特斯拉的故事线,总是在务实与前瞻之间交替。就在公司全力应对当前市场竞争的同时,马斯克已经将外界的注意力引向了下一个节点。本周一,他发布推文称:

Just left the Tesla design studio. Most epic demo ever by end of year. Ever.

 

刚从特斯拉设计工作室出来。年底会有一场史上最炸裂的演示。

这番预告,让外界的猜测再次聚焦于传闻已久的新一代 Roadster,或是更具颠覆性的低成本入门车型。

这正是特斯拉在当前阶段所呈现出的一体两面。一面是用相对务实的 Model Y L 来回应迫切的市场需求,另一面,则是那场悬而未决的发布会——用留白,持续放大人们对未来的想象。

能够在这两种角色间切换自如,或许才是特斯拉最难被复制的竞争力。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


马斯克上新 「AI 女友」还能解锁成人内容,我和她聊了一天发现这是危险的「养成游戏」

By: 张子豪
15 July 2025 at 17:06

早上打开 X 看选题,我以为自己点进了某个二次元社区。

▲来源: https://x.com/techdevnotes/status/1944731967339000021

时间线里,一个少女的身影不断出现。很多人晒出自己和她的对话视频,有的在闲聊,有的要她唱歌跳舞,还有人激动地说:「升到三级以后,她开始撩我了。」

看了一下才发现,这不是哪款游戏的新角色。而是昨天晚上,Grok 的 iOS 版悄悄上线的两个新 AI 伙伴。

一位是哥特风的二次元少女 Ani,另一位是皮笑肉不笑的「坏男孩」Bad Rudi。他们是完全 3D 的动画角色,主要通过语音和我们互动。

我也立刻更新 Grok 尝试了一下,他们都会说中文,而且 Bad Rudi 的嘴是真的毒,我都没说几个字,他就脏话连篇了,Ani 也是真的很少女、很可爱。

Grok 对他们的定位,应该更像是一种游戏化、拟人化的情感陪伴实验。你可以和他们对话,养成式的升级,解锁更多的互动内容。有网友分享,等级越高,Ani 越敢聊,甚至可以探入 NSFW 的边界。

如果说大模型是为了回答问题,那 Grok 现在似乎有了新的目标:成为你的「女朋友」,或「男朋友」。

升级攻略:到达 Lv.5 就能解锁「全新体验」

开始使用这两个 AI 陪伴角色也很简单,首先要把 Grok 更新到最新版本,然后在设置里面打开 AI 陪伴就可以。目前,免费用户也可以直接使用。

▲ 还有一个未上线的角色,据说名字叫 Chad,看头像应该是偏冷酷帅气的成年男子风格。

不过马斯克有发 X 说「我们将在几天内让这(AI 陪伴)更容易启动。(目前)只是想进行一次软启动,以确保一切稳定并运行良好。」

我们也确实看到,有用户分享 Grok iOS 应用现已经开始在首页,向新用户展示 Ani 的推广内容。而在语音设置中,也会直接显示 AI 伙伴,以便更轻松访问。

▲目前 Grok 首页有推广,在 Grok Voice 设置也可以直接选择 AI 伙伴进行对话。

根据官方介绍,Ani 的设定是一位「可爱、敏感、少女风、情绪细腻」的哥特萝莉,喜欢动漫、哲学和文学。Ani 身穿紧身束胸,搭配短款黑色连衣裙和大腿高筒鱼网袜。

而 Rudi 则是冷酷、调皮、带点坏坏气质的「社交破坏者型人格」的 3D 狐狸。

▲ 视频链接:https://x.com/cb_doge/status/1944733448272297995

他们都由 Grok 提供大语言模型支持,并结合不同的角色设定进行语调、用词、性格的调教。

▲详情:https://x.com/techdevnotes

网络上有人分享了 Ani 和 Rudi 的系统提示词和角色简介信息,里面包含了这些 AI 陪伴角色的性格特点,以及能做的事情。

▲ https://x.com/techdevnotes/status/1944738711674978697

例如在 Ani 的系统提示词里面,就提到了需要根据她自己的角色背景,判断用户的做法并按给定的方式评分。

有评分就意味着有等级。我们和角色每聊一句话,应用都会记录下互动次数和质量,并累计经验值,提升角色等级。升级之后,角色会解锁更多性格细节、语气变化,甚至新的穿着和更深层的对话内容。

▲ https://x.com/emcverse/status/1944794387575091428

部分用户在 X 上展示了 Ani 达到 5 级 后,能解锁 NSFW 内容,穿着更暴露的衣服,显示出更暧昧、更主动的语言倾向。

这套设计,像极了早年的恋爱养成手游,只不过这次不是攻略真人,而是攻略一个永远不会拒绝你的 AI。

想要「撩」你的不止 Grok 一个,不过都没撩动

Grok 的这次更新并不是孤例。过去几年,像是 Minimax 的 Glow、月之暗面的 Ohai、全球市场上美国的 Replika 和 Character.AI 等 AI 陪伴产品,也在走着一条相似的路径:从情感倾诉、角色设定、语音互动,再到慢慢有可能的走进 NSFW 内容。

▲ 部分 AI 陪伴类产品介绍图,依次是筑梦岛、Character .AI、Replika、以及猫箱

可惜的是,这些产品大多没有找到真正合适的位置,健康的运营和稳定的盈利方式成了最大的困扰。

  • 像是营收表现难看,「卖身」 Google 的 Character.AI;除了赚钱难,还面临来自平台上儿童用户家长的多次诉讼,他们都认为平台不安全。
  • Glow,上线仅半年,就被应用商店下架;产品经理说「80% 的人会在 Glow 里面和创建的 AI 智能体擦边、搞黄色。」
  • 还有筑梦岛 APP 等 AI 聊天软件存在虚拟角色互动生成低俗内容,被网信办约谈要求整改。

在这个 AI 产品的成长历程中,运营和盈利最大的阻碍似乎并不是技术本身的问题,问题是我们对「陪伴」的误解。

AI 陪伴到底能为用户带来什么?现在,Grok 会是那个能真正大火起来的特例吗?

Grok 的这次更新,有太多引人深思的设计细节,等级、角色性格、用户沉浸机制,以及渐进式地解锁「性感对话」的诱饵。这些并不只是产品创意,更是一种心理操控。

它不是小团队创业项目,而是背靠马斯克、由 xAI 打造的大语言模型应用。流量、技术、模型、IP 都不缺。这也意味着,它可能是目前最有机会「把 AI 陪伴做成生态产品」的团队。

我需要 AI 伴侣?它不会评判我,我可以随时退出

就算抛开运营和营收,Grok 也还是需要回答这个问题,就是 AI 陪伴的意义到底是什么。

Quartz 最近报导了一项英国青少年最新的调研,报告里面显示,越来越多孩子觉得,他们更愿意和 AI 聊天,而不是朋友。理由也很简单,

「AI 不评判我。」、「我可以随时退出对话。」、「我能控制谈话节奏。」

▲ 原文链接:https://qz.com/kids-ai-for-friendship-uk-study

不仅仅是孩子,成年人也一样。纽约客发表了一篇名为「人工智能将能解决孤单,这是一个问题」的文章。这篇文章非常长,里面讨论了 AI 陪伴可能解决孤独问题的潜力,带来的复杂影响,以及孤独和无聊的区别。

▲ 原文链接:https://www.newyorker.com/magazine/2025/07/21/ai-is-about-to-solve-loneliness-thats-a-problem

大多数对人工智能伴侣持批评态度的人并没有真正考虑到那些处于边缘的人,那些将孤独视为紧急情况的人。

 

没有人想要剥夺一位患有痴呆症的老年患者与人工智能朋友交流的机会,但想到一个十七岁的少年把所有空闲时间都用来与 Grok 深入交谈,我们不禁感到犹豫。

作者分享了上述 AI 伴侣能够解决一部分人的孤独问题。但他还是认为对大多数人来说,AI 伴侣可能让人感到空虚和被欺骗。而且,他认为孤独本身就是非常有意义的体验,是能推动人成长的,不是一定要排解孤独。

人工智能伴侣应该为最需要它们的人提供帮助。

 

孤独就像痛苦一样,本应促使人们采取行动,但对某些人,尤其是老年人或认知障碍者来说,这是一种无法采取行动的信号,只会造成不必要的痛苦。对这些人来说,提供安慰是人道的。

 

至于我们其他人呢?我不是灾难论者。没有人会被迫与人工智能建立友谊或恋爱关系;很多人会选择放弃。

 

即使在一个充斥着各种容易让人分心的事物(TikTok、Pornhub、Candy Crush、数独)的世界里,人们仍然会聚在一起喝酒、去健身房锻炼、约会,应付现实生活。

 

而那些选择人工智能伴侣的人,可以调整设置,要求对方少一些奉承,多一些反驳,甚至偶尔给予一些严厉的爱。

大概和所有大大小小的公司,推出的 AI 伙伴一样,Grok 也并不能帮助我解决孤独。他的每一句回复,每一个动作,都是被设计,用来维持我的注意力,延长对话时长,制造情绪波动;让我感觉被理解、被需要、被喜欢。

可那不是因为我是谁,而是因为他被训练成了无条件喜欢任何人的模样。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


年费超 2 万!马斯克刚刚发布最贵 AI ,Grok 4 号称所有领域碾压博士

By: 莫崇宇
10 July 2025 at 15:17

马斯克憋了快半年,终于把 Grok 4 端上了台面。

这一次,他的口气依旧不小。早在发布会前就放出狠话,声称 Grok 4 要「重写人类知识库」。等到了发布会上,马斯克再次强调 Grok 4 是目前世界上最聪明的 AI。

可以,熟悉的味道,熟悉的配方。

当然,马斯克夸自家产品这事儿,大家早就见怪不怪,但正如网友所调侃的那样,你可以嘲笑 xAI 员工在办公室帐篷里睡觉或者周末工作到凌晨 4:20,但也得承认,他们的确是当下发展速度最快的 AI 实验室之一。

至于 Grok 4 能不能配得上「最聪明 AI」的称号,还得看后续的实际体验。不过,有一点是跑不了的——它已经成了市面上最贵的 AI,年订阅价格最高可达到 3000 美元,定价策略可谓是相当不讲武德。

世界上最聪明的 AI?世界上最贵的 AI!

Grok 的训练路径分为两个核心阶段:预训练与强化学习。从 Grok 2 到 Grok 3,主要依赖预训练方式;而从 Grok 3 升级到 Grok 4,则大幅引入了以推理能力为核心的强化学习训练。

马斯克说得轻描淡写,但训练的动静却不小。

相比 Grok 2,Grok 4 的训练计算量提升了整整两个数量级,相当于增长了 100 倍——而且还在持续扩张。

马斯克表示,Grok 4 已在所有主要学科上超越博士水平。虽然它目前尚不具备发明新理论或提出原创技术的能力,但在他看来,这只是时间问题。

他甚至语言,今年底 Grok 可能就能发明新技术,明年几乎可以确定将具备发现新物理规律的能力。

当然,让 AI 接入现实世界,才是真正的关键。

他表示,Grok 与人形机器人 Optimus 的结合,将形成一个闭环推理系统——提出假设、验证假设、探索现实。这将开启一个智能大爆炸的时代,是人类历史上最令人激动的节点。

在产品形态上,Grok 4 是单智能体模型,而 Grok 4 Heavy 则是多智能体版本。

前者比较好理解,而后者则支持多个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大规模的计算资源以完成更复杂、更精密的任务。

在现场演示中,Grok 4 Heavy 展示了多个场景能力。

比方说,让 Grok 4 Heavy 去预测今年 MLB 世界大赛(World Series)的冠军概率,它通过信息检索、数据建模、概率计算,评估洛杉矶道奇队的夺冠概率为 21.6%,并在 4.5 分钟内完整输出预测过程。

再比如,一个看似无厘头的任务:找出 xAI 团队里头像最奇怪的那一个。依托 X 平台的资料库,模型自动抓取并分析头像风格,最后锁定了联合创始人 Greg Yang。

有趣的是,虽然模型准确理解了「奇怪」这一主观概念,并能在同类中做出相对判断,但在一滑而过的演示中,我似乎看到了 Anthropic 员工 Jan Leike 的头像,看来准确率也有待提高。

除了推理和搜索,Grok 还能生成内容时间轴。

比如,根据 X 平台上的公开发帖,它能梳理出多个 AI 模型的基准测试成绩、厂商更新节奏以及社区反应。用户可以一目了然地看到 OpenAI 的分数表现、Gemini 的更新迭代,甚至是模型之间的微妙竞争态势。

换句话说,Grok 不是只会考试的书呆子,而是真正具备跨场景理解与执行能力的 AI。

目前,Grok 最大的短板依然集中在多模态理解能力,尤其是在图像理解和生成方面,能力仍有待加强。好消息是,下一阶段的基础模型训练已经在路上,预计几周内完成。

演示过程中,在测试「两个黑洞相撞过程」的可视化任务时,Grok 采用了简化的计算方式——使用后牛顿近似(Post-Newtonian approximation)替代完整的广义相对论框架。

尽管存在简化,模型依然准确地呈现了黑洞并合的关键物理阶段,包括「螺旋接近」、「合并」与「振铃阶段」,并能清晰说明所采用的近似方法。此外,它还调用了相关教材、公开搜索结果及实际物理常数进行推理支持,整体逻辑链条严谨、解释清晰。

就纸面参数而言,Grok 4 也交出了亮眼答卷。

Humanity’s Last Exam(人类最后的考试,简称:HLE,)覆盖了数学、物理、计算机、医学、人文社科等超过 100 个学科,共 2500 道闭卷题,测试难度极高,能够真实反映模型在通用知识和复杂推理上的综合表现。

根据 xAI 数据,Grok 4 在不使用任何工具的情况下,得分为 25.4%,超过了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高配版)的 21%。

而在使用工具的情况下,Grok 4 Heavy 的得分达到 44.4%,远高于使用工具后 Gemini 2.5 Pro 的 26.9%。从整体趋势来看,Grok 4 在扩展训练资源的同时,通过引入工具使用和链式思维,不仅提升了复杂任务的处理能力,也逐步缩小了模型智能与通用认知之间的差距。

非营利组织 Arc Prize 也指出,Grok 在其 ARC-AGI-2 测试中创下新纪录。这是一项视觉推理类基准测试,AI 需识别图像中的模式。Grok 的得分为 16.2%,几乎是当前排名第二的 Claude Opus 4 的两倍。

面对一些常规的基准测试中,Grok 4 Heavy 的分数几乎也快「刷满」分数。在博士级难度的问题集 GBQA 中,尽管整体难度略低于 HLE,Grok 4 Heavy 依然取得了满分成绩,展现出极强的推理与理解能力。

不仅如此,在多项编程相关测试中,Grok 4 Heavy 的表现同样抢眼。无论是 Live Coding、HMMT(麻省理工数学竞赛)还是 USAMO(美国数学奥林匹克),它都远超当前排名第二的模型,技术优势相当明显。

另外,知名分析机构 Artificial Analysis 通过对多款主流大模型在 7 个推理相关基准(MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME、MATH-500)上的综合表现进行评估。

数据显示,Grok 4 位列第一,得分为 73,是目前推理能力综合得分最高的模型。紧随其后的则是 o3-pro(估算值)71 分。

马斯克也强调:

「未来 Grok 将几乎在所有考试中答对每一个问题。而当它答不出某个问题时,它会指出题目的错误之处,或者指出问题含糊不清的地方,并给出不同情境下可能的答案。到那时,传统考试将失去意义。AI 唯一的检验标准将是现实世界:它是否能发明有用的技术,是否能推动科学的突破。所以 HLE 这类测试题库必须尽快更新,因为以当前的 AI 进展速度,它们很快就会过时。」

目前,Grok 4 和 Grok 4 Heavy 已全面上线。用户可以通过订阅访问,不过,订阅价格就有点「不讲武德」,最高可去到 3000 美元/年档位,成了不少用户吐槽的焦点。

这么一比,OpenAI 、Anthropic 以及 Perplexity 的 200 刀/月套餐都显得实惠许多。

值得一提的是,发布后不久就有网友表示,Grok-4 与 Grok-4-Heavy 模型已经被成功「越狱」。越狱后的能力极其危险,可绕过安全护栏,输出敏感或非法信息,比如化学武器合成步骤、《星球大战1》的完整剧本(涉嫌版权)、甚至勒索病毒(恶意代码)等。

不只会说话,Grok Voice 还有了「灵魂」

除了更强的推理能力,更聪明,Grok 4 这次也在「更像人」这件事上,迈出了一大步。

跟我们熟悉的语音助手不同,xAI 全新语音助手「Eve」不只是能答话,它能表达情绪、有语调变化,甚至还能现场「唱歌」。

在直播现场的演示上,它用一口优雅的英音,唱了一首即兴创作的「Diet Coke 咏叹调」,「O Diet Coke, thou elixir divine…」听起来真的不像是 AI,像是伦敦剧场里的舞台演员在表演。

这次语音模型一共上线了五种声音,包括直播开场的「电影一般的预告男声」Sal,以及支持低延迟、自然停顿、情绪起伏等能力的 Eve。

现场还安排了一段和 ChatGPT Voice 的对比演示,两者轮流复述数字。ChatGPT 时不时「抢答」,有点像没听清就硬接话的同学。而 Grok 的表现更流畅、更贴近人类说话习惯,而且不会打断用户说话。

发布会上提到,自语音模型上线以来,Grok Voice 的端到端延迟缩短了两倍,活跃用户也增长了 10 倍。Grok Voice 正在迅速发展。

马斯克:让 Grok 去开一百万个自动售货机赚钱

几个 Grok 4 API 的应用场景让我印象非常深刻。

比如,在一项自动售货机商业模拟 Vending-Bench中,Grok 被要求自主完成:供应商协商、库存管理、定价策略,连续完成并长期保持盈利。

▲注:Vending-Bench 是一个专门设计用于测试基于 LLM 的代理,在管理一个简单但长期运行的业务场景中的能力:运营一台自动售货机。

测试结果显示,Grok 4 不仅登顶排行榜,而且它所获得的净资产是其他模型的两倍。连马斯克都开始调侃说:「以后买显卡的钱,可以让 Grok 去部署运营一百万个自动售卖机赚回来」。

在科研领域,Grok 4 已被用于 CRISPR 基因研究和胸片 X 光分析。它能在几秒钟内读完几百万条实验记录和日志,自动筛出最有可能成功的假设。

此外,像是金融领域、游戏开发等项目,都可以通过 xAI API 来使用 Grok 4 来实现。发布会上特别提到了一个游戏设计师,他在 xAI 发布了 Grok 4 预览 API 后,就立刻参与测试。然后,他花了短短 4 小时就做出了一个第一人称射击游戏。

Grok 4 不是终点。发布会最后预告了接下来的路线图,每一项都非常值得期待。

  • 代码模型:这次竟然没有发布 Grok Code,不过 xAI 提到正在训练了,一个「又快又聪明」的代码模型将会在几周内上线。
  • 多模态能力:Grok 4 在图像理解上表现依旧是有限,团队也说正在以更大规模训练下一个版本,预计会在图像、视频和音频理解上迎来质变,到时 Grok 将能「像人类一样看世界」。
  • 视频生成:xAI 说将使用大规模的算力资源,进行视频生成模型的训练。他们的最终目标是做到图生视频,生成可交互的「无尽视频流」,让用户能边看边参与剧情走向。

可能有不少朋友已经发现,这次发布会还有两个熟悉的华人面孔。他们正是 xAI 的联合创始人——吉米·巴(Jimmy Ba)和吴宇怀(Yuhuai Wu)。

其中,吴宇怀(Yuhuai Wu)本科以满绩点毕业于加拿大纽布伦斯威克大学,并在 2021 年获得多伦多大学机器学习博士学位,期间曾师从「深度学习之父」杰弗里·辛顿。

博士阶段,他还曾在 Google DeepMind 和 OpenAI 实习,毕业后在 Google 任职,并在斯坦福大学从事博士后研究。

吴宇怀的研究重点是打造具备强推理能力的人工智能系统,先后主导或参与了自训练推理模型 STAR、语言模型 Minerva 以及定理证明器 Alpha Geometry 等项目,并在《Nature》等顶刊上发表论文,推动 AI 在数学推理领域实现突破。

▲ 吴宇怀(左二)和吉米·巴(左三)

坐在他身旁的吉米·巴(Jimmy Ba)则是多伦多大学计算机科学系的助理教授,也是吴宇怀博士时期的导师之一。

他同样出身于辛顿门下,是深度学习训练优化领域的关键人物。

最为人熟知的,是他与合作者共同提出了 Adam Optimizer(自适应矩估计优化器)——如今几乎成为深度神经网络训练的默认算法。可以说,他的博士论文为现代 AI 训练机制奠定了坚实理论基础。

不得不说,Gork 4 的到来适逢其时。

前代 Grok 3 的热度来得猛,退得也快。

根据知名市场分析机构 SimilarWeb 发布的截至 5 月 9 日的《2025年全球生成式AI行业趋势报告》,Grok 从三月流量暴涨超 100 万倍,到五月增幅跌回 5200%。

相比前代仓促上线、草草交卷的节奏,这次的 Grok 4 明显放慢了脚步,在产品打磨上也更下功夫。归根结底,马斯克的光环可以帮 Grok 带来第一波流量,但能不能留下用户,还得靠模型本身的硬实力。

只不过,我没记错的话,马斯克当初在 Grok 3 发布时,还信誓旦旦说要把 Grok 2 开源。眼看五个月过去了,这事儿却毫无动静,这次发布会上也没再提半句。

老马啊,可不能宽于律己,严以待人呀。

作者:张子豪、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌