Reading view

There are new articles available, click to refresh the page.

ChatGPT 官方订阅代充,欢迎 V 友咨询购买

360dust: 充你自己的帐号,只需第一次配合登录,充完后你可自行修改密码,后面每个月自动续费,OpenAI 官方直充,长期稳定使用,包售后服务。
原价:20 美元/月
V 友优惠价:128 元/月
联系绿色软件:big825
备用 tg 联系方式:@yunwa

已帮 V 友代充超过 100 例,无任何一例发生售后。

OpenAI据报已和立讯精密和歌尔股份接触 生产智能设备

科技媒体The Information报道,美国人工智能企业OpenAI与中国公司立讯精密达成协议,并接洽歌尔股份,计划生产人工智能设备。

报道称,OpenAI正考虑与苹果前首席设计官艾维共同开发智能设备,可能包括智能眼镜、录音设备和别针式可穿戴装置,计划在2026年末或2027年初推出。该公司还将斥资1000亿美元(1284.39亿新元)用于建设人工智能突破所需的备用服务器。

报道引述知情人士称,立讯精密已获得至少一款OpenAI设备的组装合同。此外,OpenAI还与组装苹果耳机AirPods、音箱HomePods,以及苹果手表的歌尔股份接洽,希望为其未来产品供应扬声器模块等组件。

立讯精密总部位于广东省深圳市宝安区,是苹果供应链的核心企业。歌尔股份总部位于山东潍坊,是中国电声行业龙头企业。

当微软的 AI 开始指导网球运动,这项运动会变得更无聊还是更好看?

电影《点球成金》讲了一个真实的故事:奥克兰运动家队是美国职业棒球大联盟 MLB 里经济实力很弱的一支队伍,布拉德•皮特饰演的主角比利是这支球队的教练,经历了一场惨败之后,奥克兰运动家队的三名主力被重金挖走,球队前途渺茫。

但是在大数据技术的帮助下,比利不再追求当红球星,而是挖掘在数学模型下具有巨大潜力的球员,最终这支平民队伍在 2002 年赛季拿到了打破 MLB 纪录的 20 连胜,一度成为联名豪强。

也就是说,合理运用技术能力,能够在看重资金实力的顶级职业联赛里获得更多胜机。

▲ 《点球成金》剧照,经济学硕士彼得利用大数据帮助比尔挖掘潜力球员

类似的事情,正发生在网球运动领域。

2025 年度比利·简·金杯(Billie Jean King Cup)总决赛在深圳湾体育中心开赛,这是该全球顶级女子网球团体赛事首次落户中国。作为比利·简·金杯的全球技术与创新合作伙伴,微软携 Match Insights(国际版)解决方案亮相赛场。

微软基于 Azure 云平台和数据分析技术,量身开发了 Match Insights(国际版)解决方案,可实时处理海量数据,生成统一、精准的战术洞察,帮助教练与运动员在极短时间内做出科学决策,实现从数据到行动的高效衔接。

每场比赛期间,微软智能云 Azure 会处理来自多个数据源的超过 30 万个数据点,并即时生成 1500 余种独特的统计组合。同时,人工智能模型对这些数据进行实时分析,提炼出关键洞察,帮助教练和球员灵活调整战术。该系统还能深入挖掘球员行为、击球选择和局势变化,生成如回合球效率、发球得分率等深度分析数据,为战术制定提供有力支撑。

今年,微软把 Microsoft Copilot 副驾驶的 AI 搜索能力整合进了 ,进一步提升系统的交互智能与全球适配性。比如借助 Microsoft Copilot 副驾驶的多语言自然语义处理能力,运动员和教练可直接使用母语实时提问,例如:「对手在第二盘的反手失误率如何?」或「我在关键分上的发球偏好有哪些?」。 Match Insights(国际版)可以即时解析问题,从海量数据中提取洞察,生成个性化的战术建议。

在 2024 年,比利·简·金杯斯洛伐克队队员Rebecca Šramková 说:

赛前,我预计对手会采用快节奏打法,微软 Match Insights(国际版)提供的所有数据与洞察都印证了这一点。我据此调整了自己的战术,最终赢得了这场比赛。Match Insights(国际版)帮助我分析对手并为每场比赛完善我的策略,使我们的队伍在比赛准备和决策方面具有优势。

在 2025 年度比利·简·金杯(Billie Jean King Cup)赛事期间,我们和微软大中华区首席运营官 Chris Tao,国际网球联合会技术负责人 Jamie Capel-Davies,微软全球战略合作伙伴负责人 Monica Robbins 聊了聊 AI 将会如何影响网球这项运动,以下是对话实录。

Q:更加精细的数据分析和 AI 指导在多大程度上可以提高比利·简·金杯运动员的胜率?

Jamie Capel-Davies:这是个很好的问题。我认为 AI 确实在部分团队和技术层面发挥了作用,帮助他们获得了有价值的洞察。

比利简金杯中,大家都围绕「赢得比赛」这一共同目标努力,所以我们能够真正有所作为。我个人印象最深的是去年有一场比赛,一位球员凭借胜利赢得了参赛资格,而我们所提供的,就是为这种关键性的时刻,提供差异化支持。我认为不同团队对 AI 的使用程度和方式各不相同,而且比赛结果还受到很多其他因素的影响。

▲ 微软大中华区首席运营官 Chris Tao

Q:目前,数据和AI主要为人类教练提供辅助功能。那么未来,AI 是否真的可以取代人类教练?

Monica Robbins:不是取代人类,实际上是赋能人类。就像你在体育领域看到的那样,AI 的作用是帮助个人在他们所做的事情中取得更好的表现。比如网球比赛中的司线判罚,确实可以完全自动化,但整个过程中仍然需要人的参与。AI 的真正价值在于增强人类专注于关键决策的能力。所以我想对于人类教练来说,AI 不是为了取代他们,而是为了通过更多方式赋予他们力量。

Jamie Capel-Davies:是的,我完全同意。AI 确实带来了很多价值,但有些事情仍然需要人类的参与。AI 可以处理纯粹且客观的数据,但在网球领域,教练的很多工作在短期内是人工智能难以替代的。我们真正感到兴奋的是看到这项技术正在更广泛地应用,它可以帮助提升比赛的公平性。我们拥有大量可用的数据和各种类型的系统,而且这些技术变得更便宜、更易获取,因此在更多比赛中都能提供有价值的洞察。

Chris Tao:我想说的是,微软在人工智能与人类协作方面的基本理念、目标是创造出能够以更好方式帮助人类的 AI 技术,从而提升整体生产力。我们始终认为人类应该处于主导地位,而 AI 则是持续支持人类的、聪明的「Copilot 副驾驶」。最终,我们希望 AI 不仅能在教练领域提供更好的建议,还能在教育等其他领域发挥作用。我们也希望 AI 能在不同文化背景下都表现出色,成为真正意义上的助理教练,具备应对未知问题和不断进化的能力。

▲ 微软全球战略合作伙伴负责人 Monica Robbins

Q:在智能运动领域,AI 已经彻底改变了国际象棋和围棋,模仿和学习 AI 可以带来更高的胜率。然而,有人认为,由于存在最优解,AI 介入的运动可能会失去创造性和观赏价值。网球会出现这种情况吗?

Jamie Capel-Davies:我不这么认为。这确实是个值得探讨的问题,不过我自己不下棋,所以无法完全比较。但我觉得 AI 的加入其实是为运动增添了新的维度。虽然 AI 有时会击败人类,而且这种情况越来越常见,但真正有趣的是AI 与人类之间的互动。所谓的「最优解」反而让比赛变得更有看头。网球本身就包含很多要素,比如技术、身体素质、战术等,是一个高度多维的运动。我们尝试用 AI 来强化其中的战术和战略部分——这是非常关键的一环,但也只是众多维度之一。

Chris Tao:我补充一点。在网球领域,我们已经积累了多年成熟的经验,尤其是在数据分析的支持下,我们可以更好地分配资源。你提到一个很重要的观点:在一个高度竞争的环境中,人类应该如何定位自己?是“人类+AI”的协作模式,还是坚持人类主导?你可能还记得上个月在中国举办的 2025 世界机器人大会,那场展览真的很精彩。它促使我们重新思考:如何借助 AI 增强人类能力,而不是让 AI 取代人类在关键领域的作用。

Jamie Capel-Davies:如果我们进一步展开这个话题,我认为 AI 还有潜力帮助球员更好地参与比赛、减少受伤风险。

Monica Robbins:是的,这正是 AI 的核心价值所在。当我们谈论 AI 时,它是在赋能各类应用的负责人,而不是取代他们。我常常会想到一个例子:AI 可以让信息「活」起来,帮助运动员更好地理解自身表现,从而发挥最大潜力。比如从人体力学的角度来看,运动员在特定项目中往往遵循相似的运动原理。而借助 AI,他们可以发现,通过对身体姿态的微调,自己可以跑得更快、跳得更高,或者更高效地完成动作。所以再次强调,这不是关于替代,而是关于提供工具,帮助他们实现更好的自我表现。这也是我们真正关注的方向。

▲ 国际网球联合会技术负责人 Jamie Capel-Davies

Q:AI 或微软的机器学习系统是如何挖掘出传统系统无法识别的数据维度?微软的技术在哪些方面可以补足传统系统的不足吗?

Monica Robbins:是的,我可以先分享一些想法,然后 Jamie 可以补充。从根本上讲,这个问题回到了「数据如何实现实时统一」的能力上。传统系统通常是在赛后进行分析,也就是说,你只能在比赛结束后回顾数据,制定策略。而微软的解决方案实现了实时数据处理,这意味着你可以在比赛进行过程中就获取关键洞察,并据此做出即时调整,而不必等到下一场比赛。这是一个非常重大的转变。我们在本次锦标赛中引入的一些新功能,正是围绕如何更深入地理解比赛动态展开的。现在,运动员甚至可以通过自然语言提示在比赛期间获取实时建议。如果我是网球运动员,我可以根据AI的反馈调整我的发球策略,这在过去是无法实现的。

Jamie Capel-Davies:使用 Azure 的一个关键优势在于系统的可扩展性。我们可以根据比赛的节奏和安排灵活调整资源配置。比如本周有些比赛日安排了两场比赛,有些只有一场,我们的系统可以根据实际情况动态扩容,同时保持成本效益。此外,微软的 AI 平台具备模型迭代和切换能力。我们可以根据反馈不断优化模型,并在不同模型之间灵活切换。我们最近就做过一次模型升级,结果显示新模型的反馈质量明显优于之前的版本。这种持续优化的能力,是传统系统难以比拟的。

▲ Billie Jean King,单打最高世界排名第一,12 座大满贯得主,国际网球名人堂成员

Q:有人使用 AI 来帮助策略,而有人不使用,那么对于这种情况导致的不公平,你们会如何回答呢?

Monica Robbins:我们合作的每个组织都肯定会思考的一个问题是,他们如何以完全公平的方式提供解决方案。其中一件事是,现在AI正变得更容易被更广泛的受众使用。实际上,在某些方面,它确实带来了更多的获取机会。但当我们与潜在客户或不同组织合作时,比如与比利·简·金杯合作,关键在于我们如何确保所有团队都能获取相关信息,并确保他们能够充分利用这些信息。确实,像任何新技术一样,总会有一些早期采用者,但这也是推动技术普及的重要力量。我们希望通过这种方式,逐步实现更广泛的技术覆盖。

Chris Tao:是的,这项技术实际上已经在一定程度上缓解了原本可能加剧的不公平问题。过去,资源获取的不平衡确实让一些团队或教练处于劣势,但现在我们正努力让 AI 技术变得更加普及和易用。我们的目标是确保尽可能多的人都能使用这项技术,而不仅仅是少数拥有高端设备或资源的专业团队,比如那些顶级教练。过去可能需要依赖复杂的系统才能进行数据分析,而现在,更多人可以通过更便捷的方式获得同样强大的支持。这意味着,AI 不仅提升了专业教练的能力,也为更多基层用户打开了可能性。我们希望通过技术的普及,真正实现更公平、更广泛的赋能。

Jamie Capel-Davies:我们所做的是与所有团队一起开展培训,以此来帮助降低风险和解决问题,而不是做其他事情。正如 Monica 提到的,不同团队的使用方式可能不同,但我们努力确保每个团队都有机会尝试并充分利用这项技术。微软其实还有一个专门的部门,会对产品进行严格的审查,确保在推出时符合伦理和公平的使用标准。

▲ 《点球成金》剧照

回到开头所说的《点球成金》电影,大数据技术确实在一段时间里帮助奥克兰运动家队获得了极强的竞争力,但是这项技术的门槛没有想象中那么高,于是其他球队也纷纷跟进,最终抹平了技术能力的差距。

实际上到现在来看,无论是 MLB,还是 NBA,或者足球里的五大联赛,一支球队的技术分析和医疗康复能力,很大程度上决定了这支球队的上限,也决定了球员的职业生命。

在科学的比赛建议,以及更好的医疗康复关照下,像刚刚过了 40 岁生日的莫德里奇,或者 40.5 岁的 C 罗,依旧还保持着不错的竞技状态,能够在顶级赛事中发挥巨大作用。

技术能力在体育运动里一直都是你追我赶,先到先得,并且具备非常大的杠杆效应,而在微观到具体的运动员身上,AI 等技术带来的,不仅是一段时间的提升,也可能是整个职业生涯的延长。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小扎演示多次翻车,但这依然是 2025 最好的 AI 眼镜 | 附现场体验

2025 年最新潮的科技产品,自然是各种能拍照、能录像还能 AI 的智能眼镜。

作为(重新带火)智能眼镜这一品类的先驱,Meta(前 FaceBook)以两年百万副 Meta Ray-Ban 的销量向我们证明了一件事:

把摄像头戴在脸上,还真就在慢慢变成人们记录生活的刚需。

就在刚刚过去的 Meta Connect 2025 发布会上,Meta 一口气为我们带来了三款新品。其中不仅有 Meta Ray-Ban 智能眼镜的第三代改款,还有一个传闻已久的新玩意——

带有彩色光波导显示功能的 Hyper Nova 产品版:Meta Ray-Ban Display。

划重点:

  • Meta Ray-Ban Display: Meta 首款带显示屏的智能眼镜。通过彩色光波导 HUD 和 Neural Band 腕带,把「脸上的 AI」从概念变成现实,售价 799 美元。
  • Ray-Ban Meta (Gen 2):小改款,是面向大众的主力机型,外观上更时尚,续航和拍摄能力大幅提升,售价 379 美元。
  • Oakley Meta Vanguard:面向运动与极客人群,防风镜造型、中央广角摄像头、长续航和运动数据整合,甚至配备训练提醒灯,售价 499 美元。
  • Hyperscape:把现实空间「搬进」虚拟空间,Quest 用户可以扫描房间生成逼真的 VR 副本,不过目前仍是 Beta 版。

稍后,爱范儿在 Meta Connect 大会前方的小伙伴 @梦雅Myra 也会在后续为大家带来今年三款新智能眼镜的上手体验,敬请关注后续文章。

Meta 首款带显示屏智能眼镜发布!799 美元带你体验「脸上的 AI」

毫无疑问,今年最受瞩目的新品将是 Meta 首款带显示屏的智能眼镜。

跟早期爆料一致,Meta 推出了一款右眼带有小型 HUD(抬头显示屏) 的智能眼镜:Meta Ray-Ban Display。

虽然名字有些无聊,但对于智能眼镜(或者用扎克伯格的话:AI 眼镜)行业来说,Ray-Ban Display 无疑是一款突破性的产品。

和纯粹基于图像识别的手势操作不同,这款眼镜搭载了 Meta 长期研发的 Meta Neural Band 肌电神经接口腕带,通过识别手腕上的肌电信号以及手腕运动,实现非常精确的隔空操控。

▲图|Meta

值得注意的是,Meta Ray-Ban Display 并非完整的 AR 眼镜,而是侧重于在视野中呈现关键信息的单目 HUD 设备——它的屏幕只覆盖了右侧视野的一小部分。

这是一片 30-90Hz 可变刷新率彩色光波导屏幕,总体尺寸为 600x600p,像素密度 42p/degree,最高亮度超过 5000 尼特,在强烈的日光和户外环境都可以保持不错的可读性。

▲图|Meta

根据爱范儿在 Meta Connect 现场的小伙伴 @梦雅Myra 的上手体验,Ray-Ban Display 的光波导屏幕无论是亮度还是隐藏效果都非常优秀,正面看过去只能看到侧面的导线:

而 Meta Neural Band 肌电手环的识别灵敏度也很高,手势操作的成功率相比去年 Connect 大会上的 Orion 测试机大幅提升,日常使用中应该不会出现任何操作难度问题。

▲ 图片来自:@梦雅Myra

与想象中始终显示信息的 HUD 不同,Ray-Ban Display 只有在被呼叫的时候才会点亮屏幕,支持显示比如音乐播放器、相机取景预览、实时字幕翻译等内容,并可将 Live AI 的回复以文字形式投射到镜片上,而不仅仅是语音输出。

或许是因为增加了显示和额外电子元件,Ray-Ban Display 眼镜的重量约 70 克,相比普通版的 50 克略有增加。在混合使用场景中,Ray-Ban Display 的续航约为 6 小时,搭配充电盒可以延长至 30 小时左右。

此外,Live AI 还支持了类似谷歌在 Pixel 发布会上展示的 Magic Cue 功能,可以在用户与别人自然对话的中途全自动地显示各种相关信息和操作(比如创建日程),不需要用户说出任何指令关键词。

眼镜所搭配的 Meta Neural Band 手环是另一个硬件亮点。

这款腕带通过读取腕部肌肉电信号,辅助陀螺仪识别移动,让用户用细微的手指动作来控制眼镜界面。去年 Connect 2024 大会上,Meta 已展示过原型腕带通过手指捏动来打字的演示,引发行业关注。

而今年的演示则更进一步,扎克伯格在现场甚至展示了一小段佩戴 Display 眼镜、通过腕带识别在桌面上手写字母的方式编辑和发送消息的过程。根据发布会的说法,腕带的手写识别速度至少在 30wpm 以上。

作为 Meta 首款真正具备数字显示功能的智能眼镜,Ray-Ban Display 承载了扎克伯格对于「脸上的 AI」的愿景——即将人工智能无处不在的助理和信息,在不干扰用户日常生活的情况下融入现实场景。

扎克伯格曾表示 2025 年是决定 AI 眼镜能否通向数亿用户的关键年份,可见公司对这款眼镜寄予厚望。当然也需看到,现阶段它的功能更接近于「增强信息提示」的智能眼镜,而非完全的混合现实设备。

根据发布会介绍,Ray-Ban Display 的起价为 799 美元(约合人民币 5700 元)。这一价格远高于 Meta 目前所有智能眼镜产品线上的产品,但从现场演示的功能丰富性和实际效果来看,无疑是非常值得的。

Ray-Ban Meta (Gen 2):小改款,但也更好看大了

除了高端的 HUD 眼镜,Meta 还同步推出了面向大众市场的 Ray-Ban Meta (Gen 2)。

作为一款眼镜的本质,Meta Ray-Ban 3 提供了更多风格和种类的镜框,包含一款全新的透明镜框款,并提供两种镜片选择:棕色反光金或红宝石。

▲ 图|Meta

Ray-Ban Meta (Gen 2) 的电池续航相比上代直接翻倍,智能眼镜充电盒可以在 20 分钟内将眼镜充至 50% 电量——比此前 22 分钟充至 50% 电量略有提升。

此外,充电盒可额外提供 48 小时的电池续航,相比之前的 32 小时有所增加。

录制规格也提升到了 3K 分辨率,包含录制 3K 30fps、1440p 30fps 和 1200p 60fps 的视频,最长可达三分钟。据悉,今年晚些时候,Meta 还将增加捕捉超速快放和慢动作视频的功能——这一功能将应用于其所有 AI 眼镜。

Ray-Ban Meta (Gen 2)支持了一项名为 Conversation Focus 的新功能。它的工作模式类似耳机的增强模式,会主动识别和增强和你对话的人的人声频率,在嘈杂环境中让你更容易听清对方在说什么。

更重要的是,这项功能将作为软件更新,在所有现有的 Ray-Ban 上提供。

Meta 的 Live AI 模型也相应得到了增强,不仅仅是视觉识别,现在它也支持了用户主动打断对话——只可惜,发布会上面的现场演示还是翻了车,Live AI 助手卡在了一句循环的对话上,没能完成一个完整的对话 session。

相比于前代的 299 美元,小改款的 Ray-Ban Meta (Gen 2) 上涨至 379 美元。

Oakley Meta Vanguard:时尚与运动,全都要

Meta 与 EssilorLuxottica 的合作不仅限于 Ray-Ban,也扩展到了集团旗下的 Oakley 品牌。今年 6 月双方已推出一款偏运动取向的智能眼镜 Oakley Meta HSTN,主打更长续航和更高的视频录制规格。

而今天推出的 Oakley Meta Vanguard 智能眼镜与 Ray-Ban 最大区别在于 Vanguard 采用了运动防风镜的外形,其摄像头置于鼻梁正中央,而非镜框两侧。

相机规格方面,Oakley Meta Vanguar 使用的一颗 1200 万像素、122° 广角相机被放置在鼻梁正中,这也是与 Meta Ray-Ban 的最大区别,后者只有一颗位于左侧的摄像头。

眼镜顶部还有录制指示灯。通过新的动作按钮,你可以快速切换拍摄模式:1080p/30fps 可录制 5 分钟,1080p/60fps 或 3K/30fps 可录制 3 分钟,720p/120fps 则支持慢动作模式。

产品的超速延时功能,能够自动剪辑生成精彩片段集锦(今年秋季的软件升级推送至全系 Meta 智能眼镜),还提供可调节的防抖功能,可根据运动强度自行设置。

此外,这款眼镜所搭载的开放式扬声器 Meta 在 AI 眼镜上搭载的最强劲的扬声器 —— 比 Oakley Meta HSTN 大 6 分贝,并且,还配备了五麦克风阵列,专门优化了风噪抑制效果,确保对话过程声音依旧清晰。

考虑到户外场景,Oakley Meta Vanguard 拥有长达九小时的电池续航,或可连续播放音乐长达六小时。用扎克伯格的话说:这足以支撑你完成两场马拉松——当然,前提是你能跑完两场(doge)。

此外,搭配充电盒,智能眼镜可以额外提供 36 小时的续航,如果你赶时间,可以在充电盒中用 20 分钟快速将眼镜充电至 50%。

在生态整合方面,Vanguard 通过与 Strava 及佳明达成了进一步的战略合作。用户可以一键将拍摄内容同步至 Strava 平台,同时借助 Meta AI 的智能分析能力,快速检索个人历史训练记录。

设备兼容性上,Oakley Meta Vanguard 可直接与多数佳明智能手表建立连接。连接成功后,手表界面会显示 Meta AI 专属标识。在运动过程中,用户只需语音指令,眼镜便会实时播报心率监测数据及其他运动指标,数据传输延迟几乎可以忽略不计。

在其实际体验当中,当用户做心率区间训练,还会有额外惊喜——右眼上方新增 LED 灯,训练时一旦偏离目标心率区间会变红,还能设置配速提醒。

如果说 Ray-Ban 面向日常生活和时尚人群,而 Oakley 则主打运动与极客圈层,价格为 499 美元,于当地时间 10 月 21 日正式发售。

现实世界「搬进」VR,Meta 推出「Hyperscape」黑科技

Meta 每年 Connect 大会不仅发布硬件,也会推出大量软件更新。

今天过后,Meta 将彻底把现实搬进虚拟世界。最新发布的 「Hyperscape」 技术,可以把你身边的现实空间扫描进 Quest VR 头显,生成一个照片级逼真的数字副本,甚至可以用于加入元宇宙的交互。

Quest 3 和 Quest 3S 用户现在就能下载 Beta 版 Hyperscape Capture 应用尝试,目前仅限个人体验,后续则能通过链接分享,让他人和你一起「重访」这个扫描空间。

这项技术早在去年的 Connect 2024 上就露过面,一年后,Meta 终于把它推到用户层面。

值得一提的是,The Verge 记者提前上手体验了一些预先扫描好的房间,比如厨房环境。在他看来,这些房间看起来和现实环境非常相似,甚至桌上的食物或书堆等细节也比较清晰。

不过,但如果离得太近,「幻象」就会破裂,比如「报纸」上的《纽约时报》文字可以读清,但有时会有点模糊。

▲ 图片来自:Meta

那具体是怎么扫描捕捉空间?

根据 The Verge 的描述说,他戴上 Quest 3 头显后,在房间里走动并四处张望时,会有一个虚拟网格开始覆盖在正对着的物体上。大约扫描三分钟后,应用提示记者靠近物体,这时网格开始逐渐消失。

不过,这种扫描虚拟空间并不是实时的。当用户完成一次完整扫描后,数据需要上传到云端处理,通常需要几个小时之后,才能体验到最终成果。

另一个重点则在于。今年 Horizon 平台最大的变化就是引入了全新的游戏引擎,提供更高质量的图形表现,同时推出 Meta Horizon Studio,帮助创作者打造定制化的游戏体验。

你可以将 Meta Horizon Studio 理解为一款VR 世界编辑器。创作者目前已经能用生成式 AI 工具来制作纹理、音频等内容,而今年晚些时候,Meta 还将为编辑器加入 AI 助手,进一步支持开发。

支撑这些新元宇宙环境的核心是 Horizon Engine。根据 Meta 的介绍,它能够带来「更好的图形、更快的性能以及更先进的 VR 世界」,并支持更高的并发体验。

此外,为了让用户更方便地在 Quest 头显上观看电影和电视剧,Meta 还宣布推出 Horizon TV 中心,提供对 Prime Video、Peacock、Twitch 等流媒体应用以及——终于——Disney Plus、Hulu 和 ESPN 的访问权限。

回顾往年 Connect 大会,硬件发布往往遵循「一主多辅」的模式:即每年都有一款核心硬件发布,并辅以其它项目预览或更新。

例如,Connect 2024(去年)的重头戏是 Quest 3S 头显的发布,以及真正 AR 眼镜原型 Orion 的首次曝光;Connect 2023 则推出了 Ray-Ban Meta 智能眼镜第二代,并公布了 Quest 3 的详细规格,同时预告了多款 VR 游戏和 AI 项目。

与以往有所不同,本届 Connect 大会的主角不是头显,而是智能眼镜。

Meta Ray-Ban Display 这款凝聚数年研发的产品,被视作 Meta 抢占智能眼镜市场的重要一步。正如扎克伯格反复强调的,智能眼镜有潜力成为下一代通用计算平台(the next computing platform)。

另一条贯穿大会的主线是 「AI 无处不在」。

无论硬件还是软件,AI 都是共同驱动力。尤其是,在过去半年,Meta 不断加码 AI 投资,开启今年紧张刺激的 AI 顶尖人才抢人大战。通过 AI + 硬件「双管齐下」,Meta 试图打造一个其他公司难以立即复制的综合生态。

归根结底,这种打法背后,既是 Meta 对硬件路线的重新排序,也是对未来计算入口的豪赌。

头显继续承担沉浸式体验的实验场,而智能眼镜则被推上更靠前的位置,承载着「随身化」的野心。再叠加 AI 的强势渗透,Meta 将最有望在即将到来的智能计算时代中占据制高点。

文|梦雅Myra,莫崇宇,马扶摇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


新版 GPT-5 刚刚发布,最卷 AI 连肝代码 7 小时,编程工具大洗牌开始了

就在 Anthropic Claude 陷入降智风波时,OpenAI 刚刚推出了 GPT-5-Codex——这是基于 GPT-5 优化后的 Codex 专用版本,专门针对「自主编程」进行了训练。

这次升级确实有些分量。

聚焦于真实的软件工程场景的 GPT-5-Codex,不仅能处理日常的编程交互,还能独立完成复杂耗时的工程项目。它能像真正的程序员一样,连续工作超过 7 个小时,在复杂项目上不断迭代、修 bug、跑测试,最后交付一个完整可用的解决方案。

从四月份推出 CLI 版本,到五月份上线网页版,再到现在的全面升级,Codex 的——就是要把编程这件事彻底「自动化」。

现在无论你在终端、IDE、网页还是手机上开发,Codex 都能提供一致的编程辅助体验,而且已经整合进 ChatGPT 账号体系,本地和云端可以无缝切换。

GPT-5-Codex 最有意思的特性是「动态思考」能力。它能够根据任务复杂度灵活调整处理时间。

OpenAI 内部员工使用数据显示,按模型生成的 token 数排序,对于最底部 10% 的简单请求,GPT-5-Codex 比 GPT-5 少用了 93.7% 的计算资源。

相反,对于最顶部 10% 的复杂请求,它会花费大约两倍的时间进行推理、代码编辑、测试和迭代。这意味着日常聊天和小任务响应会更快,而复杂的大型重构则会投入更多时间深度处理。

用人话说就是:日常小问题不磨蹭,大项目该花时间就花时间。

终于有个编程模型懂得「好钢用在刀刃上」了。

基准测试方面,在 GPT-5 发布时,OpenAI 只在 477 个 SWE-bench Verified 任务上报告结果,在被 Anthropic 指出这一问题后,今天 OpenAI 宣布这些问题已经修复,现在可以在全部 500 个任务上报告结果。结果如下:

代码重构评测更是涵盖了 Python、Go 甚至 OCaml 等语言,比如一个来自 Gitea 的 pull request 案例,修改了 232 个文件、3541 行代码,将 ctx 变量贯穿到应用逻辑中。

代码审查功能也很实用,它会在代码库中浏览分析,运行测试验证正确性,给出的审查意见准确性不错。在 OpenAI 内部,Codex 现在会审查大部分 PR,每天能发现数百个问题,很多时候比人工审查更早发现潜在 bug。

前端开发支持同样到位,GPT-5-Codex 不仅能创建桌面应用,移动端开发能力也有明显提升。它还能读取截图和设计稿,检查开发进度,把工作成果可视化展示,这对前端开发确实很有帮助。

工具层面的更新也相当丰富。全新改造的 Codex CLI 现在围绕自主编程流程重构,支持直接附加和分享图片,包括截图、线框图和架构图,用于建立对设计决策的共同理解。

处理复杂任务时,Codex 会通过待办清单跟踪进度,内置了网页搜索、MCP 等工具连接外部系统。

审批模式简化为三种:只读模式需要显式批准,自动模式对工作区有完整访问权限但工作区外需要批准,完全访问模式可以在任意位置读取文件并运行带网络访问的命令。

全新的 IDE 插件支持 VS Code、Cursor 等编辑器,让用户能无缝预览本地修改并与 Codex 协作编辑代码。插件还支持在云端与本地环境间流畅切换,可以直接在编辑器中创建云端任务、跟踪进行中的工作,以及审查已完成的任务。

云端基础设施也有明显改进,通过容器缓存将新任务和后续任务的中位完成时间缩短了 90%。Codex 能自动设置运行环境,扫描常见初始化脚本并执行,在配置网络访问权限时还能运行 pip install 等命令按需安装依赖。

安全方面,OpenAI 采用了沙箱运行环境,默认禁用网络访问,确保不会在用户电脑上执行有害操作,同时降低提示注入风险。

开发者可以根据风险承受度自定义安全设置,在云端可以限制网络访问只允许可信域名,在 CLI 和 IDE 插件中可以批准命令、允许全权限运行或使用网页搜索、连接 MCP 服务器。

与 GPT-5 管理方式一致,GPT-5-Codex 在生物与化学领域被归类为高能力模型,已采取相应安全措施。

价格上,Codex 已经集成到 ChatGPT 的各个付费套餐中,不同套餐提供不同的使用额度。

  • Plus、Edu 和 Business 适合每周几次专注的编程会话;
  • Pro 则能支持跨多个项目的一整周工作量。

Business 套餐可以购买额外额度,帮助开发者突破包含的上限;Enterprise 套餐则提供共享额度池,只需为团队实际使用部分付费。对于使用 API key 的开发者,OpenAI 计划很快在 API 中开放 GPT-5-Codex。

目前 GPT-5-Codex 的系统提示词已经泄露,感兴趣的开发者可以研究一下。

系统提示词地址:https://github.com/elder-plinius/CL4R1T4S/blob/main/OPENAI/Codex_Sep-15-2025.md

知名博主 Dan Shipper 在体验完 GPT-5-Codex 之后,给出的评价是:

我们在 @every 上测试了几天,结果相当震撼:

– 它会根据任务动态选择「思考」时间——难题上能长时间工作,简单问题则能即时给出答案。
– 在我们的生产代码库测试中,它可以自主运行 长达 35 分钟 ——相比之下,GPT-5 往往过于谨慎,这是一次明显的升级。
– 它支持 本地与网页开发环境的无缝切换。你可以在 VS Code 中启动一个任务,然后在去购物时把它交给 Codex Web 继续完成。
– 它配备了 代码审查智能体,会真正运行你的代码,因此能发现更多 bug。

以下是我们经过大量内部测试后的整体感受:
– 这是一次非常出色的升级,让 Codex CLI 成为了 Claude Code 的有力替代品。
– 不过,它需要合理的提示才能表现出最佳效果。比如 @kieranklaassen 最多只能让它运行 5 分钟,而 @DannyAziz97 找到了诀窍。
– 有时候它会「偷懒」——在某些任务上可能思考不足,或者如果认为任务过大就会直接拒绝。
– 我整个周末都在用 Codex CLI 为 @CoraComputer 提交一个新的 PR,体验下来发现它非常好用、易于引导——这是一个很棒的模型。

OpenAI Codex 产品负责人 Alexander Embiricos 表示,性能的大幅提升主要归功于 GPT-5-Codex 动态的「思考能力」。Embiricos 解释说,GPT-5-Codex 的工作方式类似,但它内部没有路由器,而是能实时调整在某项任务上投入的时间。

Embiricos 指出,这比路由机制更具优势:后者在一开始就必须决定要为某个问题分配多少算力和时间,而 GPT-5-Codex 则可以在处理任务 5 分钟后决定「还需要再多花一个小时」。他说,他见过该模型在某些情况下连续工作超过 7 小时。

最近几个月,几乎所有 AI 大厂的重磅更新都指向同一个方向——编程能力。相比之下,如果你仔细观察就会发现,针对普通用户的「优化」其实是在不断减少。

表面上看,这可能是因为面向普通消费者的 AI 产品已经陷入瓶颈期。聊天、写文案、做翻译,这些功能已经比较成熟,很难再有突破性进展。

但更深层的原因,还是绕不开商业逻辑。

开发先进的 AI 模型本就需要天文数字的巨额投入,这些成本总要有人承担。与其指望海量低付费用户慢慢回血,不如直接锁定那些真正愿意掏钱的高价值用户。而程序员是最愿意为 AI 工具付费、且粘性较高的群体之一。

从这个角度来说,放弃技术平权的叙事,AI 的未来可能比我们想象的更加「精英化」。这不一定是坏事,但至少我们应该对此有清醒的认识。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


击败 ChatGPT 登顶 App Store!Google 这套 AI 全家桶,个个都是王炸 | 附使用指南

还以为 ChatGPT 会一直稳坐第一?这周却来了个反转。

Google Gemini 凭借最近爆火的 Nano Banana 图像编辑,一举登顶 App Store 免费榜,把 ChatGPT 挤到第二。

▲ Gemini 位于 App Store 免费榜所有类别第一,图片来源:https://apps.apple.com/us/charts/iphone/top-free-apps/36;15/09/2025

这意味着,Google 终于迎来了属于自己的「爆款 AI 时刻」。

而且,Gemini 只是冰山一角。Google 手里还有一整套 AI 工具,从写作、画图,到学习笔记、视频生成,应有尽有。今天就带你开箱 Google 的「AI 全家桶」。

省流版:

  1. Gemini,定位和 ChatGPT 一样的通用助手:包含了 nano banana(近期热门生图模型)、Canvas 画布、Veo3 视频生成、Storybook 故事板、以及 Deep Research 等功能,目前提供 Gemini 2.5 Pro 和 Flash 两个模型。体验地址:gemini.google.com
  2. NotebookLM,能深入研究的知识库:最多可上传 300 个文件,能将文档总结为音频、视频、思维导图等六种类型,是学习和研究的最佳利器。体验地址:notebooklm.google
  3. Flow,高质量的视频生成:支持竖屏 9:16、1080p 高清,价格更低,免费用户每月送 100 积分。体验地址:flow.google
  4. AI Mode,搜索也有了推理和思考能力:在 Google 搜索输入框就能直接开启,获取比 AI Summary/Overview(总结)更严谨和翔实的结果;目前支持英文等五种语言(但目前不包含中文)。体验地址:google.com/ai
  5. Gemini CLI:一个万能的本地助手:不只是开发工具,还能下视频、转 GIF、压缩文件。体验地址:github.com/google-gemini/gemini-cli
  6. AI Studio 和 Labs Google:其他有意思的小工具,生成一段音乐,简单学习一门新的语言,体验最新、最全的 Google 大语言模型……体验地址:ai.devlabs.google

Gemini:不只会聊天,更是全能工作台

近期爆火的 nano banana,最主要的官方渠道除了网页版,就是 Gemini App。

▲ Gemini 首页,有常驻提醒推广 nano banana 图像编辑模型

但如果你只拿 Gemini 来 P 图,那就太浪费了。它和 ChatGPT 一样,补齐了跨对话的「记忆」功能,并能与 Google 生态无缝衔接。

▲ Gemini 的「记忆」功能

对我而言,这个关键更新,加上教育邮箱赠送的 Pro 会员,足以让我将大部分日常对话转移过来。

Google 最近更新了 Gemini 免费和付费用户具体的使用限制。免费用户使用 Gemini 2.5 Pro 和 Deep Research 的次数有限,但是 nano banana 的单价非常便宜,所以免费用户也有慷慨的 100 张生成机会。

Gemini 2.5 Pro 最大的优点是,每个回答都会有像 DeepSeek 一样清晰的推理过程,但是速度要快上不少。这在 ChatGPT 更新到 GPT-5 之后,采用全新的路由控制,自动选择模型,优势更为明显。

因为 ChatGPT 有时候判断不了,我到底希望他使用什么模型来回复;而我的表达,也不是每一次都能清晰地,让模型知道我的意图。

不过,更会聊天的代价是更不会干活,和 LMArena 显示的排行榜一样,文本能力第一,但是网页的开发能力不及 GPT 和 Claude。好在这些天,Google 也是狂给 Gemini 打补丁,在软件交互上,用户体验越来越好。

▲Gemini 和 ChatGPT 完成同一个开发任务,你喜欢哪个

例如,在网页开发方面,Gemini Canvas 现已支持直接点选应用中的某个元素,用自然语言即可进行修改。

Canvas 画布和 ChatGPT 的画布预览是一样的功能,都是非常直观地,把我们的创意,变成应用程序、游戏、信息图表等内容。

▲ Gemini 画布新增功能,选择并询问。现在只需点击元素并描述所需更改,即可直观地编辑您的网页应用的任何部分。图片来源:https://x.com/GeminiApp/status/1965475292526551105

其次,Gemini 终于支持上传音频文件。这意味着,会议录音、采访视频等包含丰富上下文的材料,可以直接交给 Gemini 处理,省去了手动整理和编写复杂提示词的麻烦。

▲ ChatGPT 一直回复无法使用工具

最新消息,根据 flowith 创始人 Derek Nee 和 Gemini 3 工程师团队的交流,他发 X 透露,Gemini 3.0 Flash 的能力将会超过 2.5 Pro。

和 ChatGPT 使用的条件类似,Gemini 对谷歌账号的归属地可能有额外的限制。

🔗 体验地址:gemini.google.com

NotebookLM:你的最佳个人知识库

收藏了一堆英文长文、书摘,结果总是「下次再看」?NotebookLM 就是专门拯救这些吃灰资料的。

你只要把几篇文章、报告甚至书摘丢进去,它就能:

  • 自动帮你提炼要点,生成一份条理清晰的学习笔记;
  • 如果你喜欢可视化,还能直接画成思维导图,让你一眼看懂文章框架;
  • 想进一步学习?它还能基于这些资料出小测验,逼你复习巩固。

举个例子,我之前用它来整理过论文,NotebookLM 最多支持上传 300 个文件,支持的文件类型也很丰富,PDF、txt、Markdown、和音视频文件,它都能识别。

▲ 我将 297 篇同一研究领域的论文上传,NotebookLM 能完全基于这些文件,生成多种形式的内容总结。

▲ 文字报告、播客预览、视频介绍、思维导图、闪卡和小测验六种形式

播客和文字报告,是 NotebookLM 里面最早提供的选项,现在它们也得到了优化。

文字报告可以选择,直接生成为博客、说明文档、指南等类型,甚至 NotebookLM 会根据知识库里面的资料,提供动态建议;例如,上传论文可能会建议创建白皮书,而新闻类文章可能会生成解释性内容;自定义的提示现在也被允许。

▲ NotebookLM 生成的博客文章

而音频播客现在更是支持 80 多种语言,播客类型也从概述到深入,进一步扩展到辩论和批判性思考等多种类型。

新增的视频、Quiz 测验和 Flashcard 闪卡,是我非常喜欢的功能,无论是帮助我消化这些知识,还是做进一步的内容传播,NotebookLM 都非常有用。

但论文的研究终究是比较小众的场景,我们只是借着论文来介绍 NotebookLM 的功能。对于学生和研究者来说,这绝对是 Google AI 里最值得安利的工具之一。

在更普遍的应用场景中,它能胜任任何类型的知识库构建。像是 NotebookLM 官方给出的使用案例,上传了多家公司一季度的财报,我们可以透过思维导图,一次性清晰的了解财报的具体内容。

还有 NotebookLM 与 OpenStax(免费教科书提供平台) 合作,将它们受欢迎的内容,转化成交互式笔记本,包括生物学、化学、心理学、以及管理学等主题笔记本。

在这个心理学知识库中,每一章节都配有小测验和记忆卡片,帮助我们巩固所学知识点。

▲ 语言是可以选择中文,知识库链接:https://notebooklm.google.com/notebook/90a2ee5f-cccb-4c28-a356-bb1682cc8aeb

小测验和闪卡的主题、难度都是可自定义的。而且,无论是闪卡还是测验,只需点击解释,就能深入探索当前的话题;NotebookLM 会生成详细的概述,帮助我们理解闪卡定义,或解释为什么答错某道题,并附有引用指向原始资料。

🔗 体验地址:notebooklm.google

Flow 电影级 AI 视频生成

AI 视频热度虽高,但能用它做什么?始终是许多人心中的疑问。我们介绍过多个 AI 视频生成模型,不少读者也曾留言:这种 AI 视频,究竟是给谁看的?

▲ 在 Gemini 里面,直接使用 Veo 3 视频生成,Veo 3 目前仅支持首帧,首尾帧需要 Veo 2。

Google 的更新或许给出了部分答案:支持竖屏(9:16)和 1080p 高清。这无疑是为抖音、YouTube Shorts、Reels 等短视频社交媒体平台量身定做。

▲ Veo 3 近期更新,Veo 3 Fast 从 0.4 美元每秒降价到 0.15 美元每秒,以及支持 9:16、1080p 等。图片来源:https://x.com/GoogleAIStudio/status/1965436154762920074

如今 AI 视频已成为一种新的内容消费品,与其被动观看,不如亲自上手一试。

▲ 提示词:Ultra-realistic cinematic video of Shanghai, famous landmark Tower. Shot in vertical 9:16 format, travel vlog style, smooth camera motion, dynamic lighting, vivid colors, highly detailed, immersive atmosphere, no text, no watermark.

除了 Sora、可灵、海螺这些比较热门的视频生成模型,Google 的 Veo 3 一直在大模型竞技场,文生视频类别下,名列前茅。

前些时间爆火的第一视角穿越、ASMR 切水果,金属、兔子蹦床的夜视监控等视频,都是使用 Veo 3 生成的。

▲ 提示词:50mm camera, close-up angle of a lemon made out of yellow-tinted glass being sliced horizontally on a wooden cutting board. The inside of the fruit is glass as well with a little bit of melting glitter. The entire scene is soft lit from the above.

不过,提示词的优劣,是决定视频质量的关键瓶颈。例如上面这个视频,我们就是直接借鉴了 Google 的官方案例。

他们解释,好的提示词,包括三个部分,首先是「50mm 相机、特写镜头」指定了相机;接着中间一大段用来提示对象和具体的视频内容;最后一句话是进一步明确灯光和纹理。

Flow 对网络要求比较严格,一般在 Gemini 网页或者 App 内使用同样足够。

🔗 体验地址:flow.google

AI Mode 支持除英文外更多语言

搜索是最大的流量入口,因此 AI 浏览器成了大模型厂商的必争之地,尽管这条路并不好走。

Arc 项目宣布停止后,重启的 Dia 浏览器也在前几天,被 Atlassian 以 6.1 亿美元收购。路不好走的原因倒不是因为没有利益,而是太多巨头想要吞下这块香饽饽了。

微软在上个月宣布自己的 Edge 升级为 AI 浏览器,Copilot 无缝接入到浏览器的每个角落,预订餐厅和机票、跨越标签页的整理总结等等。OpenAI 在之前推出 ChatGPT agent 时,也被爆料要做自己的 AI 浏览器。

Google 当然也不会停下脚步,和我们平时用 Google 搜索时看到的 AI Overview 不一样,AI Mode 更像是一份深度研究报告,它会利用 Gemini 2.5 的高级推理和多模态能力,来处理我们的查询输入。

例如当我问他 iPhone Air 的 esim 卡到底是怎么回事时,它会自动根据网页内容进行整理,给出更准确的答案。

▲ 点击上方 All,则可以切换回普通的 Google 搜索

不过 AI Mode 有一个缺点,是目前它还不支持中文。但前几天,Google 已经宣布支持日语、韩语、以及葡萄牙语等五种语言。他们提到构建一个全球化的 AI 搜索不仅仅是翻译,所支持的语言,应该具有本地相关性和实用性。

🔗 体验地址:google.com/ai

Gemini CLI 下载视频,转文件格式,统统交给它

Claude Code 断供完全没关系,Gemini CLI 是真的好用。

之前我们说用这种终端工具来修改文件名,其实是最「弱」的用法了。我最近 X 视频、YouTube 等视频下载;视频转 GIF 以及各种格式转换;图片压缩、视频压缩,全部交给 Gemini CLI。

Gemini CLI 的安装流程相当清晰,即便遇到环境配置问题,如今的 AI 也能提供可靠的解决方案。

前期的麻烦点主要集中在安装 Node.js 上,对 Windows 用户来说,终端使用没有 macOS 和 Linux 友好,所以是需要一点耐心的。

Node.js 安装完成之后,按照 GitHub 上指引,运行 npm/npx 命令就可以安装 Gemini CLI 了。

在终端里面输入 gemini,会提示我们进行验证,一般登录 Google 验证就可以,不需要去额外创建 Gemini API 之类的操作。免费用户每分钟有 60 次请求,每天 1000 次请求,应付日常的简单工作流是足够的。

终端里面有一些非常基础的命令,因为我们打开终端的时候,默认的文件夹是可能是整个电脑的文件,如果直接输入 gemini,它检索文件会比较麻烦。

正确的操作是,一些基础命令输入 ls:会列出当前目录下的所有文件和文件夹;cd xxx:进入某个文件夹;mkdir xxx:创建一个文件夹。

▲ 例如第一步我们打开终端,输入 ls,可以看到当前目录下所有的文件和文件夹;接着我们选择一个文件用来处理,此次需要 Gemini 的项目文件夹。输入 cd Downloads,可以看到 % 前面有当前目录 Downloads 的名字。接下来,我们创建一个文件夹,mkdir testing,然后再进入这个目录,cd testing。当然也可以直接选择一个文件夹,鼠标右键,在终端中打开。输入 gemini,它就正式接管了我们的终端,我们接下来就能用自然语言,处理许多复杂的任务了。

▲ 拿下载一个 X 的视频举例,首先它会搜索,找到一个 yt-dlp 的工具,可以用来下载视频;接着,它会自动检查我的电脑,是否有安装这个工具。检测到有安装之后,视频就开始下载了。

这是调用了 yt-dlp 工具,而在终端环境里面,还有非常多高效的工具,例如 FFmpeg,它是一款处理多媒体内容的强大工具。

▲ 输入指令后,Gemini CLI 会直接说它需要 yt-dlp 和 ffmpeg 这两个工具;然后会自动调整分辨率和帧率,以符合我提出的最终文件大小,最后它会删除过程中的临时文件。

我们继续用 X 视频举例子,这次直接要求他把这个链接的视频下载为一个 GIF 文件,并且确保 GIF 文件的大小在 5-10 MB 之间。

除了从网络上下载文件,Gemini-CLI 也可以直接处理本地文件,例如我有一张图片的大小,不符合平台上传规范,我告诉它文件名,然后要求它压缩,过程中完全不需要去找任何的在线工具。

▲ 可以用模糊语言指定图片位置,顺利定位到图片,它会使用 ffmpeg 工具来进行压缩。不过最后它把我的原文件删掉了,当我告诉他要求找回时,它会修改自己的 gemini.md 配置文件——这相当于它的「记忆」,它会记住这次教训,确保未来不再犯同样错误。

命令行工具的种类丰富,几乎大部分的文件都能处理,甚至有时候遇到一些压缩包不能解压,直接让 Gemini CLI 来处理,而不需要额外去下载对应的解压工具。

再结合 MCP(大模型上下文协议,连接不同数据的万能接口),Gemini CLI 能做的远远不止是编程开发。

🔗 体验地址:https://github.com/google-gemini/gemini-cli

AI Studio 和 Labs Google:谷歌前沿 AI 试验场

Google Labs 汇集了许多尚未正式发布的 AI 黑科技产品,像 AI Mode、NotebookLM 目前都还是实验室产品,不过他们名声比较大。我们也选择了几个有意思的小项目,虽然背后的模型都是同一个 Gemin 2.5 Pro/Flash,但是可以看看模型之上,不同的软件形态。

首先就是 Whisk,这个主打不需要提示词,上传照片尽情玩耍的图片生成工具,现在还新增了 animate 动画的功能,直接将生成的图片转成一段视频。

还有学习一门语言的 Little Language Lessons,它特别的地方,是让我们快速在 Gemini 构建的一系列小实验里面,学习一门新的语言,直接在现实场景中应用,还能学习各种俚语表达。

我拿粤语试了一下,至少不是多邻国里面,来来回回的肠粉和豉汁排骨了。

Google 实验室还有非常多的项目,体验地址:labs.google

讲了通用大模型 Gemini 2.5 Pro、图像编辑 nano banana、视频生成 Veo 3,怎么可以没有 Imagen 4。

Imagen 4 官方渠道目前是只能透过 Gemini API 和 AI Studio 两种方式体验,即便 Google Labs 里面有专门生图的工具,ImageFX,但是使用的模型依旧是 Imagen 3。

AI Studio 能做的,就是体验到 Google 最新最全的各种模型。而且,在 AI Studio 里面的对话,提供了「分支」功能,我们可以保留现有对话的前提下,开启另一个新的话题。

▲ 地址:ai.studio / ai.dev

前段时间,马斯克还在 X 上和奥特曼互撕,直接开骂,Apple 和奥特曼有私下交易,不然他的 Grok 怎么登顶不了排行榜第一,凭什么一直都是 ChatGPT。

这一番开箱下来,似乎能看到一点 Gemini「凭什么」的端倪。Google AI 几乎是用一套完整的工作流,无缝融入我们的学习、工作和创作之中。从整理资料到激发创意,再到解放双手,这套全家桶的核心,是希望实实在在地提升每个人的生产力。

你最常用或最想尝试的是哪一个?有什么问题可以在下面留言。

视频请点击链接,前往微信播放预览 https://mp.weixin.qq.com/s/gdSkrm95Mq1RORe-sIoK4A

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


建设性意见|在华留学生沦为“夸克AI难民”,幸灾乐祸还是扬眉吐气?

看到一个热搜话题特别有意思:

夸克忘了我们

file

image

一群外国来华留学生在小红书上哭诉,说中国大学生都在用的夸克AI对留学生搞差别对待,所有中国大学生都可以凭学籍免费领取夸克SVIP会员,但同在一个学校上课的留学生却只能眼巴巴看着领不到,夸克把他们忘了。

image

image

CDT 档案卡
标题:在华留学生沦为“夸克AI难民”,幸灾乐祸还是扬眉吐气?
作者:项栋梁
发表日期:2025.9.11
来源:微信公众号“建设性意见”
主题归类:洋大人
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

留学生们甚至还根据外网的习惯,专门建了一个We Study in China的留言墙网站,供在华留学生上去发声许愿,呼吁夸克AI给他们同等待遇,同等会员。

image

这一幕,很像之前TikTok在美国关停时涌入小红书的“TT难民”,都是想用中国互联网服务而不得的老外。

事情很小,但意义非凡。印象中,这是有史以来留学生群体在中国社会的第一次集体发声。

看到外国学生也在追捧中国AI工具,甚至还“伸手讨要福利”,网民们乐坏了,评论区充满了扬眉吐气幸灾乐祸的空气。

也算意料之中吧。这些年,中国社会对留学生享受超国民待遇的情况那是积怨已久,如今终于看到留学生们被差别对待,感受了一次低国民待遇,那可不得抓住机会狠狠出一口恶气?

image

集中代表这类想法的观察者网就发了一篇欢呼的评论,兴高采烈地宣布“中国的标配,成了外国人的顶配”。

是,中国的AI现在是出息了,各家的AI工具在不同生活场景应用中也的确做得很不错,毕竟应用层一直是中国互联网的强项。

但是,夸克AI赠送会员把留学生排除在外这件事,其实是再次暴露了中国社会一个长期存在的问题:

投入天量资金培养外国留学生,却很少取得实际成效。

据统计,2025年度在华留学生数量已突破50万人。

很多人印象中来华留学的是非洲学生最多,但实际上占更大比例的是亚洲学生,如巴基斯坦(很好理解)、韩国(他们国内比中国还卷)、泰国(华裔多)等。我上本科的时候学院里有几位留学生来自越南,因为肤色面相差别不大,所以在人群中并不显眼。

但无论留学生数量达到几十万,这个群体在中国社会几乎都是没有存在感的。即便偶尔因负面事件上了新闻,也几乎听不到留学生们自己的声音,都是中国网民自己在吵。

一方面,是中国高校在主动创造软隔离,包括给留学生单独的宿舍楼,单独的食堂,甚至专门给留学生开的课,在学校里留学生和中国学生的交流就不多。另一方面,留学生们毕业后留在中国工作生活的机会其实很小,他们也缺乏动力融入中国社会,心里念的都是拿个学历赶紧走人。

但这样一来就导致了一个事与愿违的后果:

中国长期以来投入了大量的财政补贴支持培养外国留学生,但因为缺乏文化交流与社会融入,既没有为中国输入人才外援,也比较少通过留学生学成回国输出文化影响力。

两头都不占,投入岂不是打了水漂?

夸克AI这次发免费会员福利把留学生排除在外,看起来是一家商业公司的行为,其实背后是整个社会集体心态的一次投射。

当然,这只是在华留学生日常状态很小很小的一个缩影,只是因为戏剧性的反差效果才上了热搜。

真正值得关注的问题在于:

中国社会到底应该以怎样的姿态看待来华留学生和来华外国人?

十年以前,社会上对外国人总体上还是仰视占绝大多数,友善态度居多。而当前社会心态面向外国人则是仰视和俯视并存,俯视和鄙视居多,仇视言论屡见不鲜。总而言之,都不是什么健康的心态。

此前外国用户大批涌入小红书的时候,社会对“洋人来了”的心态就集中展现了一轮。只是如今,这些外国用户在小红书又留下了几个呢?

回到本文标题来,表面现象是夸克AI忘了留学生,背后本质其实是中国社会始终没有平视留学生,没有平视外国人。

分享一点建设性意见:

不要仰视,也不要俯视。

什么时候我们的社会能真正平视外国人,能以平等开放的心态接纳留学生融入学校,融入中国社会,那时才是真正的从容自信了。

今年的新 iPhone,让我重新相信苹果

让我们没有想到的是,一场短短 75 分钟的发布会,为我们带来了近四年来最香的 iPhone。

在本次苹果秋季发布会上,苹果一口气更新了三款 Apple Watch 和四款 iPhone,作为苹果产品线里最走量的两款产品,这样的动作表明了一个事实:

苹果有危机感了。

▲爱范儿在现场

但危机感留给苹果去担心,我们作为消费者,只需要好好享受今年的实惠新品就行了。今年的 iPhone 17 标准版终于补齐了长久以来 120Hz 高刷的缺位,Pro 系列也迎来了影像能力的提升,甚至连 Apple Watch SE 3 都有了 AOD。

爱范儿已经在现场第一时间体验了今年的新品,更多发布会没提到的细节,我们将在今天后续的文章中与你分享。

太长不读(TL;DR)

  •  iPhone 17,终于补上高刷,起售价 5999 人民币
  • iPhone Air,史上最薄、国行首台纯 eSIM,起售价 7999 人民币
  • iPhone 17 Pro/Max,长焦大升级,起售价 8999/9999 人民币
  • AirPods Pro 3,心率检测、降噪升级,1899 人民币
  • Apple Watch Series 11,睡眠评分、高血压预警(国行没有),起售价 2999 人民币
  • Apple Watch Ultra 3,超大屏幕、卫星通讯,起售价 6499 人民币
  • Apple Watch SE 3,全天候显示、续航加长,起售价 1999 人民币

iPhone Air:薄,爆表

与预测信息相同,今年的 iPhone Air 取代了往年的 Plus 机型,成为了那个不追求影像能力的大屏选项。

但「Air」作为苹果内部一个意义深远的名字,带来的亮点可比 Plus 多多了——比如它的名字不叫 17 Air,就叫 iPhone Air。

在最重要的外观方面,iPhone Air 是一款 6.5 寸的机型,机身厚度仅为 5.6mm。为了维持机身强度,苹果将 Air 的边框改为了抛光的纯钛合金,视觉冲击力够强,也是一支从侧面能看出来是「最新款」的 iPhone。

▲ 爱范儿在现场

至于 iPhone Air 的屏幕则是我们熟悉的样子,依然是一块采用灵动岛挖孔的 Super Retina XDR 屏幕,峰值亮度 3000 尼特,并且支持 ProMotion 1~120Hz 的可变刷新率。

此外,iPhone Air 也用上了新的第二代超瓷晶面板,类似当年的 12 寸 MacBook,苹果将除了电池之外的所有主要部件全部集成到了镜头 deco 里面:

有趣的是,iPhone Air 没有像传闻中那样与标准版使用相同的 SoC,而是用上了带后缀的 A19 Pro 处理器,搭配 6 核 CPU 和 5 核 GPU(和 Pro 相比缩水 1 GPU 核心)——但总体上能看出来,苹果是希望在计算性能上让 Air 与 Pro 看齐。

此外,iPhone Air 还搭载了一颗新的苹果自研无线芯片 N1(蓝牙、Wi-Fi、Threads 网状网络),以及更新的 C1X 基带芯片,基带能耗直降 30%,如发布会所说,iPhone 17 Air 无疑是迄今为止能效最好的 iPhone 。

但物理定律决定了,超轻薄的机身肯定要以零件体积为代价,而 iPhone Air 的代价也不言自明:电池。与爆料信息接近,它的电池容量仅 3000 毫安时出头,这并不是一个能让人安心的数字。

但苹果很明显也考虑到了这个问题,跟随 iPhone Air 的发布,我们还迎来了一款许久未见的「超薄 MagSafe 磁吸充电宝」。

虽然重量和厚度都有所增加,但在有需要的时候能够变轻薄,至少也是一种生活选择。

影像方面,iPhone Air 与 16e 一样同为后置单摄,传感器分辨率为 4800 万像素,支持两倍的 ISZ 输出 1200 万像素的照片,当然还有全系标配的全新前摄。得益于升级的 A19 Pro 处理器,iPhone Air 甚至支持前后同时录像。

抛开这些常规数据,iPhone Air 还有一个大家都在关注的问题——网络制式。在美版机型试验三年多之后,iPhone Air 成为了首款全球所有地区型号都不支持实体 SIM 卡的 iPhone。

不过归根结底怎么看,iPhone Air 都很像是在给未来的折叠屏 iPhone 做技术试验田,无论是超轻薄的机身还是新规格的电池,似乎都在暗示着明年的 iPhone Fold 会有一些超出预期的设计。

更加炸裂的是,官网国行页面显示,它目前支持中国联通的线下 eSIM 开通业务。也就是说,苹果真的跑赢了华为,让 iPhone Air 成为了第一台纯 eSIM 的国行手机。

iPhone 17:突破制裁,用上高刷

今年的 iPhone 17 标准版,可谓重磅。

原因没别的:苹果终于「突破制裁」,在大家心心念念四年多之后,将高刷新率屏幕也给 iPhone 17 配齐了。

与预测不同,iPhone 17 和其他三款机型一样是 LTPO 屏幕加持的可变刷新率,支持全屏 AOD,以及满血的 1~120Hz ProMotion 刷新率,亮度同样来到了 3000 尼特。还有全新的第二代超瓷晶面板,甚至是抗反射玻璃,真的是把隔壁三星的 Ultra 功能直接拿过来用了。

——这不是一台 Pro 手机,却用上了大量从 Pro 下放来的技术。

iPhone 17 同时还会更新 3nm 的 A19 处理器,这可能是少数不「Pro」的配置了。

配色方面,iPhone 6 时代经典的金属灰色调,也来到了 iPhone 17 上。比起今年 Pro 系列那个妖艳橙色,看起来养眼很多。

至于其他周边配置,iPhone 17 与前代基本相同,屏幕尺寸微微增长至 6.3 寸,电池容量也得到了提升,相比 iPhone 16 续航延长近 6 小时,甚至连充电功率也有小幅提升。

不仅仅是屏幕,今年的双摄系统也得到了一次大升级,主摄分辨率升级至 4800 万像素,上方的超广角镜头同样升级到了 4800 万像素。

最大的升级来自前摄,今年的新 1800 万像素前摄传感器使用了一块方形的 CMOS,和 iPad 一样支持全自动的 Center Stage 功能,方形的传感器让自拍的构图将丰富到难以想象。

iPhone 17 标准版的起步容量来到了 256GB,同时国行价格仍然维持 5999 人民币不变,这是良心方面的提升。再考虑到苹果今年 618 期间降价吃国补的操作,iPhone 17 极有可能成为最近五年来销量最好的 iPhone。

iPhone 17 Pro/Max:手机录影新巅峰

与 iPhone Air 变薄减重正相反,今年的 iPhone 17 Pro、Pro Max 两款,主打一个力大砖飞。

并且是字面意义上的力大砖飞—— 17 Pro 和 Pro Max 都将收获这个与板砖(或者麻将)神似的镜头 deco:

不过多出来的这块空间并没有浪费,iPhone 17 Pro 系列带来了发布会上称之为「iPhone 有史以来最大的」影像能力升级。

▲ 爱范儿在现场

最明显的就是,iPhone 17 Pro/Max 的长焦传感器面积提升近 56%,实现了原生的 4 倍长焦焦段,搭配数字变焦,在录像时最高支持 40 倍放大倍率。

录像规格方面,iPhone 17 Pro 系列不仅支持 ProRes Raw 录制,更是在影视能力上更进一步,在录像中支持了一个类似时间码同步的功能「Genlock」,给那些买 iPhone 拍摄子弹时间镜头的导演更充足的创作空间。

更加强大的相机也需要更充足的散热,与前期爆料相同,苹果 iPhone 17 Pro 和 Pro Max 内部终于加上了一块 VC 均热板,让持续录制能力和日常性能调度再上新台阶。

而在屏幕方面,iPhone 17 Pro/Max 也用上了新的屏幕面板和第二代超瓷晶玻璃,屏幕峰值亮度提升至 3000 尼特,有了 VC 均热板和抗反射屏幕的加持,户外可读性和耐久性将会得到明显的提升。

在机身里面,同样是第三代 3nm 制程工艺的 A19 Pro 处理器,而且是所谓的「满血版」。从 8GB 升级到 12GB 内存,多出来的部分除了提供更强(但你不知道啥时候才能用上)的 AI 性能之外,或许也是支持 Pro 系列本次独占的专业相机视频功能的关键。

颜色方面,今年的 iPhone 17 Pro 取消了黑色。深蓝色是唯一的深色机型。而新加入的星宇橙配色,介于夕阳与火焰之间的色泽着实抓人眼球,则是官方广告词「燃」的灵感来源。

至于起售价格,在今年多了这么多料之后,iPhone 17 Pro/Max 最低配 256GB 型号的价格分别为 8999 和 9999 人民币 。今年的 Pro 系列最大容量更是来到了 2TB,越来越像是「专业影视工具」了——当然,以 17999 元为代价……

值得一提的是,至于我们最为关注的国行 Apple Intelligence,苹果官网仍旧显示:「为 Apple 智能预备好」,具体推出时间依监管部门审批情况而定。发布会前爆料显示,苹果可能在年底推送的 iOS 26.1 或 iOS 26 .2 中正式上线国行 AI 功能。

iPhone 17 系列将于 9 月 12 日晚 8 点开启预购,并在 9 月 19 日全面发售。

AirPods Pro 3: 不戴手表也能「运动」了

爱范儿在现场,看到 AirPods Pro 3 带头亮相时,全场都发出了「喔」的声音……

▲ 爱范儿在现场

AirPods Pro 3 的核心更新,并非音质和降噪,而是两个功能:一个对于现在的耳机很重要,另一个则让人有点诧异,居然出现在耳机上。

先看后者:心率检测——这可是无线耳机上很少见的功能。

不过苹果曾经在 Powerbeats Pro 2 上试水过心率检测。只要佩戴 AirPods Pro 3,就能实时在 iPhone 的健康应用中查看自己的心率变化。

并且,在健身和健康方面有不少技术积累的苹果,让 AirPods Pro 3 能够通过持续监测用户的心率,推算用户锻炼过程中的热量消耗。

以后,只要戴着 AirPods Pro 3,就能追踪 50 种不同的锻炼模式,还能参加苹果的健身锻炼圆环挑战——不一定非要佩戴 Apple Watch,也可以加入朋友、同事、家人的社交健身竞赛。

为了让 AirPods Pro 3 更好成为一款「运动耳机」,苹果也提升了防水等级,AirPods Pro 3 成为首款抗汗水性能达到 IP57 的 AirPods。

除了心率监测和健身,AirPods Pro 3 还有一个新功能:AI 实时翻译,能够实现面对面交流时的语言翻译。

用户双手同时捏合 AirPods Pro 3 即可启动这个功能,需要和 iPhone 配合使用,它不是逐字翻译,而是将每个短语准确表述。用户可以 iPhone 可以展示翻译的文字和语音。

如果对方也戴着 AirPods,那翻译的语音会直接同步对方的耳机之中,等于双方都自带一个同传。

值得一提的是,实时翻译功能并非 AirPdos Pro 3 的专属,最新固件的老机型 AirPods 4 以及 AirPods Pro 2,配合 iOS 26 iPhone 都能使用这些功能,前提是所在地区能使用 Apple 智能。

目前支持英语(英国、美国)、法语(法国)、德语、葡萄牙语(巴西)和西班牙语(西班牙)这些语言,今年也将更新支持简体中文。

音质方面,AirPods Pro 3 搭载定制的多孔声学架构,低音更强,还拓宽了音场,听歌看剧电话人声都更清晰。
由于采用了全新的泡沫填充耳塞,AirPods Pro 3 的降噪能力又翻了一倍,通透模式也有所增强,用户自己和他人的声音都更加自然。

AirPods Pro 3 的设计也有所改变,两只耳机的尺寸都更小,以贴合更多耳朵。

电池续航也是影响无线耳机体验的重要因素,开启主动降噪后,AirPods Pro 3 支持佩戴 8 小时,比上一代多出 2 小时,加上充电盒能使用 24 小时。

▲ 爱范儿在现场

售价方面,AirPods Pro 3 保持 1899 元。

Apple Watch 全线焕新:是功能野兽,更是健康好伴侣

今年,苹果一口气更新了三款 Apple Watch:

  • Apple Watch Series 11
  • Apple Watch Ultra 3
  • Apple Watch SE 3

最大的好消息是:三个款式全部支持 5G 了!移动、电信、联通三大运营商,均首发支持。

先来看 Apple Watch Series 11:沿用了去年 Series 10 的尺寸和外观,屏幕玻璃采用 Ion-X 显示屏,还升级了新款超瓷晶涂层,抗刮能力对比上代提升一倍。

Series 11 的全新健康功能,聚焦在心血管和睡眠两个维度。

世界上有 13 亿成年人饱受高血压困扰,这个慢性病很难被发现,大部分人并不会有意识去定期专门进行血压检测。

为了解决这个问题,今年的 Apple Watch 新功能则是「高血压趋势」。

Apple Watch Series 11 不会测量精确的收缩压和舒张压,但通过分析血管对心跳的反应,来检测慢性高血压风险,在后台分析 30 天数据,一旦识别到高血压症兆就会提醒用户,促使用户获得及时的专业医疗支持和改善生活习惯。

▲ 爱范儿在现场

这个功能并不仅限今天发布的新品,未来也会在 Series 9/10 以及 Apple Watch Ultra 2 上推出。

不过,国内官网相关页面上并没有这个功能的介绍,国行 Apple Watch 短期内大概率无缘这个功能。

睡眠方面,Apple Watch Series 11 推出「睡眠评分」功能,通过对用户睡眠结构的分析,将用户的睡眠质量进一步具象化。

睡眠分数也将下放到运行 watchOS 26 的 Apple Watch Series 6 和更高版本、Apple Watch SE 2 以及所有的 Apple Watch Ultra 型号,也需要和搭载 iOS 26 的 iPhone 配对运行。

Apple Watch Ultra 3 的机身尺寸不变,但屏幕边框更细,稳坐 Apple Watch 最大屏幕。

Apple Watch Series 10 上采用的广视角 OLED 屏幕,现在也来到了 Apple Watch Ultra 3 上,在倾斜角度看屏幕亮度更高。全新的 LTPO3 技术,让 Ultra 3 现在能显示每秒跳动的表盘。

Apple Watch Ultra 3 的通信能力得到了进一步提升,除了 5G,还支持卫星通信,进一步增强了这款手机的户外能力。

▲ 爱范儿在现场

Apple Watch Ultra 3 也成为了有史以来续航最长的 Apple Watch:42 小时,低功耗模式下,可提供长达 72 小时的电池续航时间。

家族中的小弟 Apple Watch SE 也迎来了第三代更新。

由于搭载了 S10 处理器,Apple Watch SE 3 获得了大量新的功能,例如全天候显示屏,以及双指互点和轻翻手腕手表交互。

健康能力上,Apple Watch 支持了全新的手腕温度传感功能,进一步补充了生命体征的数据,以及女性健康的排卵预测。

去年更新的「睡眠呼吸暂停」功能,以及 S11 同款的「睡眠评分」也来到了 Apple Watch SE3 上。

iPhone 的下一个时期,将从今天开始

Design is not just what it looks like and feels like. Design is how it works.
设计不止关乎外观和感觉,更在于如何运行。

虽然今年的秋季发布会依旧是熟悉的苹果预录,但在库克出场之前,史蒂夫 · 乔布斯这句话出现在了发布会的开头,预示了这场发布会将会和平淡的这几年有所不同。

然后,在发布会进行到 40 分钟时,iPhone Air 登场,即使在场的数码博主都对这款传闻已久的手机有所了解,还是被它纤薄精致的外观惊出异口同声的「Wow」,这也是我们面对新 iPhone 很久没有的反应。

等到爱范儿真正上手才发现,薄只是 iPhone Air 吸引眼球的外衣,这款手机真正的魅力,在于它超轻的手感,以及紧致的机身。

自 iPhone Air 的消息传出以来,外界对这款手机的质疑从未断绝,主要的争议都围绕在苹果为了超薄的噱头,不惜牺牲用户体验。

但我们对于手机轻薄便携的需求永远存在,它能带来更无感的使用体验,更接近我们在最初对智能手机的期待——简洁、轻薄,没有多余的元素,少即是多。

对于苹果来说,接下来的目标就是如何做到「轻薄」和「全能」的结合。第二代的 iPhone Air 想必会做出更少的妥协,而未来的 iPhone Pro 也会得益于 iPhone Air 的探索,逐渐实现瘦身。

更重要的,是有望明年发布的折叠 iPhone,以及后年(iPhone 20 周年)可能发布,强调「无边际」交互的全玻璃 iPhone——它们的产品定义,轻薄是不可或缺的属性。

超轻薄的 iPhone Air 不止关乎外观和感觉,最终它将带我们走向 iPhone 以及智能手机体验的下一个时代。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


全网都在玩的生图模型,我用它把 iPhone 17 提前发布了

最近,朋友圈和抖音小红书几乎被 Nano Banana 刷屏了。这个香蕉模型似乎要让 P 图这个词消失,直接给 Gemini 带来了一千万的新用户,火得一塌糊涂。

各路大神的邪修玩法铺天盖地,什么 3D 手办、大佬合影都是基操了。虽然 Nano Banana 强得不行,但在留言区依然收到不少用户的疑问和需求。

首先使用门槛就拦住了不少人,甚至比在国内用 ChatGPT 还麻烦一些。在图片编辑过程,最多人反馈的是 Nano Banana 图片分辨率不够高,以及比例高度不可控。

说实在,我也感觉自己有点吹毛求疵,但没想到,这些需求真的有人听了进去,并且做了出来,而且还是咱们国产厂商。

刚刚,火山引擎正式上线豆包・图像创作模型 Seedream 4.0。

除了具备「超强主体一致性、多图灵活创作、连续生图」等核心能力,Seedream 4.0 还有一个 Nano Banana 也没有的功能——支持最高 4K 高清图片输出

这也是首个最高支持 4K 多模态生图的模型,目前企业用户已经可以通过火山方舟抢先体验了。

个人用户也不用眼馋,4K 版将于今晚 20:00 首次开放给个人用户,搜索「火山方舟体验中心」,即可第一时间体验。

Seedream 4.0 同时也在豆包、即梦全量上线,最高支持 2K 输出。

实际表现如何需要拉出来溜溜。APPSO 提前拿到内测体验了几天,给它上点比 Nano Banana 更大的强度。

实测完后我发现,虽然也不能算完美,但国产生图确实来到了一个新的阶段。

 

我替苹果把 iPhone 17 Air 提前发布了

今晚就是苹果秋季发布会了,不用熬夜看直播,APPSO 先把帮苹果把 iPhone 17 给上线了

我们用 Seedream4.0 生成了两款今年大火的 iPhone 17 Air 产品页面,这可是今年最受关注的超薄旗舰。

参考 iPhone 16Pro 的官网页面,替换手机和相关文案,保证果味十足

这个构图似乎有些古板,调整一下小字 ,再加上 Just 5.5mm thin 这个最大的亮点。可以看到 Seedream4.0 生成的这版 iPhone 17 Air 将手握机身的倾角,刚好和字母 A 右边平行,有点资深设计师的审美了。

这次,我们不让库克来发布产品,有请特斯拉人形机器人来客串一把。还是熟悉的场景,熟悉的 Good Morning(doge)。

这组图用到了三张参考图,人形机器人、iPhone 17 Air ,以及库克的现场图,Seedream4.0 一致性确实有点东西。

其实这里还有个逆天的细节容易被忽略,注意看观察生成图机器人头盔上的反射细节,原图是漆黑一片的,也就说, Seedream 4.0 根据图 3 的蓝天白云和建筑物背景,推理出机器人应该有的反射,真的太细了。

不妨再脑洞大开一点,据称 iPhone 17 Air 就是为了明年折叠屏手机做准备。APPSO 用 Seedream4.0 也提前让大家看看 iPhone 首款折叠手机的「实拍图」。

眼尖的读者可能已经发觉,是不是跟华为新款的三折叠有点像,没错我用了它作为参考图,替换了上苹果的摄像头和logo,无论是构图、背景和水印的细节都完整保留了。

那干脆整一部苹果的三折叠,其实也没有人知道那一夜,苹果和华为究竟发生了什么。

如果是「乔布斯」,他会怎么发布这款产品,我们请 AI 老乔限时返场。

熟悉的身影,穿透屏幕的气场,让我们再次高呼「Amazing」。

好玩之外,还真能用

Nano Banana 能走红,除了社交媒体的爆款玩法,更在于它的技术能「看得见未来」。无论是一致性、局部修改、换色还是多图结合,都是能够直接用在电商、营销、社交媒体等等场景里。

无论技术有多亮眼,如果不能应用到生产力场景,也只是玩具。

下面我们看看 Seeddream 4.0 在一些实用场景能不能打。

我们先拿这两天刷屏的红月亮,融合到球鞋设计中。

我还想看看这款球鞋不同角度的展示,只需输入类似「生成一只白色运动鞋,展示正面、侧面和俯视视角」的提示词,不管是用于打样还是用于设计草图,都直接一步到位。


如果我还想找一个模特用不同姿势展示商品呢?找不到合适的参考照片也没关系,直接画个火柴人简笔画就行。

Seeddream 4.0 基于手绘图能有效控制模特姿势的一致性,同时实现角度的合理变化,在多角度呈现上表现精准。

像下面这个案例,我在提示词里面没有指定两个人的站位,所以在它生成的 4 张照片里面,两种站位都有,而且效果都很好,它像一个周到的乙方,如果你需求没有很明确,那就把可能的情况都考虑到并把成品给你挑选。

▲ 提示词:将图1男子和图2女子合进一张画面,参考图3姿势

如果说拥抱这种动作太简单了,我们直接来一个举高高的动作,这次再指定多一张背景图片。

▲ 提示词:将图3和图1合进一张画面,参考图2姿势,图1是被举起来的那个小孩;同时背景使用图4。图四的背景是来自浪浪山,两个角色是罗小黑和他的师傅。

四个人的参考图,Seedream 4.0 同样可以很好的处理,保持和简笔画的姿势一致。

▲ 提示词:把图一的四个角色(西游记里面的师徒四人,沙僧、唐僧、猪八戒、孙悟空)按照图二的姿势(叠罗汉)排布,沙僧、孙悟空和猪八戒在下面,唐僧在上面。

如果还想给模特更换妆造,我们发现 Seeddream 4.0 也能准确把握不同发型的特质:长直发的柔顺、盘发的干练以及卷发的弧度,全部都清晰呈现。

同时,背景与人体保持高度一致,未出现边缘模糊或形变问题,成功实现了在保留主体特征的基础上对妆发风格的精准转换——省了多少模特妆造费用。

最让我惊喜的要数线稿生成,线稿通常为简洁的线条勾勒,仅包含物体基本轮廓与结构,缺乏细节、色彩及质感。在草图转渲染功能上,Seeddream 4.0 能将简单线稿转化为高质量成品图。

不仅精准填充丰富色彩,使物体视觉层次分明,还有细腻的光影处理与材质模拟,比如包包的皮质纹理、金属配件光泽等。

它对于「高质量渲染图」的理解,可谓是逆天,除了静物,还搭配了人像、场景,你没想到的,它都替你想到了。

讲真,Seeddream 4.0 这次更新后,对真实质感的处理完全超出我的预期。

像皮具、金属的纹理表现已经很稳了,但当我看到它生成人的皮肤纹路时,还是被秀到了。

这个皮肤纹理、隐约可见的青筋,甚至是手腕上自然的汗毛感,还有光线打在皮肤上的通透效果……所有细节都拿捏得非常到位,组合在一起就一个字:真。

而这组图的原始参考图是什么呢——

仅此而已。

细节还原仿佛真实拍摄,完美实现了真实世界照片拟合的需求。这都意味着模型能够适度的「创作」,在参考图和提示词给定的范围内,给出合理的发挥。

这种创作能力可以用在更有趣的玩法上,比如只需要一个矢量图,就可以给 APPSO 生成一整套完整的周边设计。

▲ 提示词:参考这个LOGO,做一套品牌视觉设计,品牌名称为 APPSO,包括包装袋、帽子、纸盒、卡片、手环、挂绳等。红色视觉主色调,趣味、简约现代风格

Seeddream 4.0 的「创作」能力和直接生成样品的玩法,极大地降低了制作成本。而且效果相当不错,模型捕捉到了「有趣味、简约现代」的核心风格,将品牌 LOGO 巧妙地应用在手机壳、卡套、挂绳和帽子上。

还有一点好评的是,Seeddream 4.0 支持最高 4K 分辨率的输出,而 2K 分辨率直出只需要几秒,能在电商等一些场景做到专业级输出,有更大的后期空间。

更多邪修玩法

除此之外,APPSO 还发现了一些有趣的邪修玩法,也跟大家分享。

最基本的桌面手办,当然是不在话下,我们试试让人物自己,拿着本人的手办。

▲ 图片来源:https://x.com/oden_ai_ai/status/1957414144417910924/photo/1

▲ 提示词:将这张照片制作成一个角色模型。其后放置一个印有该角色图像的盒子,以及一台屏幕显示 Blender 建模过程的电脑。在盒子前方添加一个圆形塑料底座,角色模型手办站立在上面。并尽可能设置为室内场景。

▲ 提示词:照片级真实感。 然后照片中的人拿着一个手办模型,这个模型是根据这张照片的主体人物,制作而成的一个角色模型,在自己的房间里,很满意的微笑。房间里的电脑桌上,有一台屏幕显示 blender 建模该模型过程的电脑,同时有一个印有该角色图像的包装盒子,以及盒子前方有一个圆形塑料底座。

不仅拿在手里,还能挂在包上,照片的真实感和一致性保持都非常厉害。

▲ 提示词:照片级真实感。 先将这张照片变成一个可爱挂件/亚克力材质的扁平钥匙扣/橡胶材质的扁平钥匙扣,挂在 lv 包包/图二照片的包包上,然后她自己再背着这个有自己同一个角色挂件的包。

除了做手办,我们还拿它来生成了一些摄影风格极强,但是又保持真实的照片。你的人生照片摄影师,可能会是Seedream 4.0 。

除了强大的一致性和多图编辑能力,Seedream 4.0 还带来了丰富的世界知识能力,生图模型也能推理预测,深度理解我们的提示词和图片,其背后的意图。

例如我们上传了一张杯子即将要掉在地上的图片,然后输入提示词「下一秒这个画面应该是怎么样的?」

杯子掉在了地上,同时能看到倒在地上的水,反射了部分杯子,和窗户的光。

Seedream 4.0 除了知道一秒后会发生的事情,我们还能利用它的推理能力,整理自己的房间。

▲ 提示词:把沙发上的被子和衣服都叠好

除了能把衣服整整齐齐地叠好,弄得满是颜料的地板,Seedream 也能在打扫干净的同时,保持图片内现有元素的一致性。

▲ 提示词:把这些颜料都收起来,地板擦干净(虽然这好像是个桌面)

借助它的推理能力,还有一个更骚的玩法。

下面这个案例里,上传的参考是模特图,让Seedream 4.0 把模特衣服的细节展示出来,模型接到的指令是细节图——这当中的距离,就要靠模型自己去「想明白」。

从结果来看相当不错,不仅版型准确,对于局部细节展示这一指令跟随也没有问题。几乎可以直接上架了。

生成表情包,Seedream 4.0 也是一把好手

参考网友 @op7418 的提示词,我们也跑出了好几版关于 AI 模型的表情包,一次可能不成功,那就多抽几次卡就好,好在生成速度也够快。

▲ 提示词:帮我将角色变成类似图 1 的白色轮廓贴纸,并添加一个俏皮白色轮廓短语「XXXX」。

 

▲ 图一(左)来自@fenxxxx,图二(右)

你或许看过《千里江山图》这幅传世名作,但你或许还遗漏了亿点点细节。

同理可得,谁说《步辇图》里没有呆萌的 Labubu,以及在《韩熙载夜宴图》的宴席中,突然出现一只从现代穿越过来的网红柴犬 Kabosu,我也觉得毫无违和感,

不只是生图神器,还是创意生产力平台

体验下来,如果用一个词来形容 Seedream 4.0,那必须是「六边形战士」。它像一个全能的创意总监 + 高效的制作团队,让你能快速得到想要的结果,同时对创作流程有更强的掌控感。

快,是第一体感。

基于 DiT-MoE 架构,Seedream 4.0 的计算效率比上一代猛增了 10 倍以上,最快 1.8 秒就能生成一张 2K 高清大图。这种「秒级」响应,意味着极低的试错成本。

稳,则是生产力基石。

Seedream 4.0 的超强主体一致性能力,让你无论是想给角色换个场景、换个画风,还是调整姿势视角,都能高度保持原有特征,避免了「画风突变」的尴尬 。

对于很多电商和品牌设计师来说,AI 不再是给一张海报换个颜色,而是能参考一个 Logo,一键生成全套品牌视觉设计,从包装袋到手环,风格高度统一 。

品牌规范开始从一本厚重的 VI 手册,变成一行行可执行的 prompt。

作为我们这样的内容创作者,它能让你参考一个角色设定,批量生成漫画分镜或故事绘本,极大地提升内容连载的效率和一致。

提示词灵感来自@阿真Irene

而且在 Nano Banana 出来之后,已经不少人基于它开发出了轻量级的小游戏或实用工具,我们看到了这类工具让更多中小开发者把创意快速变成产品,而且获得用户认可的可能性。

这几天 Seedream 4.0 已经开始刷屏社交媒体。热闹之外,我们也看到,Seedream 4.0 已经不满足于当一个新奇的玩具,而是要成为一个可规模化、可商用的创意生产力平台

文|李超凡、莫崇宇、刘娅、张子豪

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


一个能让 iPhone 用上 AI 的配件,1300 万人围观,但我觉得大可不必

如果把当下最让人迷惑的科技产品拉个清单,AI 硬件网红们绝对榜上有名。

从 699 美元的 Humane Ai Pin 到 200 美元的 Rabbit R1,这些 AI 创业公司都在兜售同一个美丽的谎言:你需要专门的硬件才能体验真正的 AI。

今天,这个名单上又多了一个新成员——AI Key。

这是一款定位于「AI 助手」的外接硬件,厂商宣传它可随插随拔,通过 iPhone 的 USB 接口连接后,能够帮助你动动嘴操作手机上的应用和功能,从消息、地图到拍照、社交软件,几乎覆盖常见任务。

类似于手机 Agent,它的用法也并不复杂。

只需提出你的需求,确认它调用的应用,接着设备会自动模拟点击、滑动和输入操作。用户既可以盯着它执行,也可以完全交给它处理,并在需要时随时中止或修改。

值得注意的是,虽然苹果提供了如「快捷指令」这类系统级自动化工具,但第三方应用无法深度调用或控制其他应用的行为,这也解释了为什么市场上会出现这类试图填补空白的外接硬件。

外观小巧的它拥有三种配色:午夜黑、蛋奶白和达维粉,售价 89 美元,厂商承诺圣诞节前全球发货。创始人 Adam Cohen Hillel 在 X 平台表示,首批产品在短短 7 小时内几乎售罄。

AI key 的火爆并不令人意外,只是,问题也随之而来,为了把手机变成「AI 手机」,你真的需要额外插一个外设吗?基于此,我们还可以延伸出更深层的问题——我们真的需要为了 AI 而专门创造 AI 硬件吗?

AI 硬件卷生卷死,但手机形态稳坐 C 位

尽管苹果高级副总裁埃迪·库多次强调,未来十年内 iPhone 可能被淘汰,但不可否认的是,当下最好的 AI 硬件形态依旧是手机。

你口袋里的 iPhone 16 Pro 搭载第二代 3 纳米制程芯片,能访问 ChatGPT、Claude、Gemini、DeepSeek 等人类历史上最强大的 AI 模型。而即便抛却云端大模型的加持,手机厂商们也纷纷在端侧模型上大作文章。

哪怕是被诟病在 AI 赛道掉队的苹果,最近也在 Hugging Face 上发布了 FastVLM 和 MobileCLIP2。

这些模型比以往版本快 85 倍、体积缩小 3.4 倍,让实时视觉语言模型(VLM)应用成为可能,甚至还能在浏览器里完全本地运行,实现实时视频字幕生成。

更不用说前阵子发布的 Google Pixel 10 系列手机,堪称买 AI 送手机,它不仅能本地运行 Gemini Nano 模型,还搭载了 Camera Coach 与 Auto Best Take 等功能,能够实时分析拍摄场景、光线与人物动作,自动优化照片甚至给出拍摄建议。

之所以能做到这一点,原因很简单:硬件素质摆在那里。

如果回首第一波涌现 AI 硬件的浪潮,Humane Ai Pin 和 Rabbit R1,均以颠覆者的姿态出现,试图通过「无屏/少屏」的理念,重塑个人计算的未来 。

前者 Ai Pin 由前苹果高管打造,秉承着「让技术成为你的仆人,而非你的主人」使命 。后者的 R1 则以其大胆的橙色设计和「大型动作模型」概念,承诺通过 AI 替用户完成复杂的应用内任务 。

然而,Humane Ai Pin 想要替代手机,却面临严重的过热和续航问题,最后卖身惠普。

而 Rabbit R1 同样高开低走,发货初期,其 USB-C 接口对充电线极为挑剔,仅能兼容部分线缆,且电池续航极短,仅 1000 毫安时的电池容量,不仅是质量问题,更反映出初创公司在供应链和品控上的经验不足。

Reddit 论坛上一则评论甚至提到,R1 团队「意外订购了错误的内存部件」 ,这一小插曲生动地揭示了硬件初创公司在供应链管理上所面临的混乱与脆弱性。

当初创公司在成本控制和供应链采购上无奈妥协,也就更容易导致了一个恶性循环:低端硬件无法提供流畅体验,用户差评导致口碑崩盘,反过来影响销售,使得公司难以通过规模化生产来降低成本,最终陷入财务困境,甚至破产。

倒也不是说像 R1 和 Ai Pin 没有价值,只是,它们的意义可能更多体现在 AI 交互模式的探索上。

它们所倡导的理念——主动代理、环境语音命令、统一的任务界面——是强大的。但这些概念不会在一个独立的盒子里茁壮成长,而是会被主导平台吸收,变成 iOS、Android 等系统的原生能力。

Rabbit R1 的滚轮、Humane Ai Pin 的投影、AI Key 的「钥匙」形态,这些看似奇怪的设计选择,实际上是在测试不同的交互假设,为行业排除错误选项。

我并不反对创新,也不认为所有的 AI 硬件创业都是无意义的。但我们需要诚实地面对一个现实:在手机已经如此强大的今天,任何试图通过外接配件来「增强」手机 AI 能力的产品,都面临着巨大的用户体验挑战。

真正的机会可能在别处:要么做手机永远做不到的事情,要么等待一个全新的计算平台出现。而不是给 iPhone 插个插件,然后告诉用户:看,这就是未来。

功能还是属性?我们对 AI 的根本误解

一个隐藏在 AI 硬件争论背后的技术哲学是,你到底把 AI 当作一个「功能」,还是当作一种「属性」。

功能是离散的、可分割的,需要专门的承载物。而属性是渗透性的、无处不在的,它改变的是整个系统的运作方式。

当 AI 作为功能,这种思路是把 AI 单独拎出来,打包成一个卖点。

比如聊天机器人、翻译器,或者 Rabbit R1 的 LAM、Humane Ai Pin 的激光投影。它们的逻辑是:先有了 AI 技术,再找个硬件来装进去。当用户要用,就得专门打开、专门交互。

问题在于,大部分「功能」在手机里早已存在,还做得更好,所以新硬件看起来像个「中间商」,缺乏真正的护城河。

另一种思路是把 AI 融进现有生态,让它成为系统自带的「属性」。

苹果的 Apple Intelligence 就是例子:优先通知、邮件摘要、照片清理、Siri 强化,都在原有体验里用 AI 长出来。Google 把 Gemini Nano 下放到本地设备,也是类似逻辑。

用户甚至感觉不到 AI 的存在,但效率和体验却被整体提升。

汽车诞生之初,被理所当然地称为「无马的马车 」。人们的想象力局限于替代马匹,关注点在于它能否跑得像马一样快,会不会惊扰到路旁的牛群。

没有人能预见到,这个「铁皮怪物」将催生出高速公路网、现代物流、郊区文化,并彻底改变城市的形态和人们的生活半径。今天,我们对 AI 硬件的想象力,或许也同样被困在狭窄的框架里。

于是,当人工智能这个「新物种」出现时,我们的第一反应几乎是条件反射式的:它也需要一台「专属设备」。一个「AI 盒子」、「AI 终端」,或者至少,是一台「AI PC」。

这种想法,就像一个原始人第一次看到火,不是思考如何利用火的能量去烹饪、取暖、冶炼,而是琢磨着必须制造一根「火棍」,才能将火焰握在手中。

早在 1998 年,Eli Zelkha 和他的团队提出了「环境智能」这一概念,指的是一种能够「感知人类存在并做出响应」的智能环境系统。这些环境通过嵌入式设备(如传感器、执行器、AI 模块)实现与用户的无感交互,试图将技术融入生活而不是成为负担。

而真正理解 AI 的公司不会试图刻意创造「AI 设备」,而会让所有设备都变得 AI 化。

一个成熟的技术,不会终日将名字挂在嘴边。正如我们今天通常不会刻意说「电力台灯」或「互联网电脑哦」,因为电力和网络连接早已是这些设备的底层能力,是理所当然的存在。

同样,当 AI 真正普及时,它也会从一个被反复强调的「卖点」,下沉为所有智能设备的基础设施。

届时,你的汽车、冰箱、眼镜、甚至衣服,都将拥有不同形式的智能,它们彼此连接,协同运作,共同构成你的个人「环境智能」系统。

而当我们不再谈论 AI 硬件的那一天,才是 AI 无处不在的开始。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「不存在」的「写真」

这组照片我发给太太看,问她「像不像我?」
她问「是你自己拍的吗?」

没有,没有一张是实拍的。
全部都是 AI 生成的。

我提供了五张照片给它,然后描述了一些简单的要求,他给我「拍摄」了这些照片。当然,抽卡还是要抽的。但是,主要集中在审美层面的选择上,或者是,有点儿不太像。最后选的这几张,儿子也觉得像,唯一的例外是觉得侧身背影的气质不像我。但哪里不像,他也说不清楚。

语言是关于思维的。写真是把真用光线记录下来,但这些图片都没有真实存在过,还算写真吗?照片是把影像照射在感光底片上的画面,印在纸片上,可没有存在过的光线和场景还算照片吗?这是文字游戏,也是思想实验。

眼见不为实的时代里,什么才是真实?

App Store 超低价应用内购省钱技巧,不到60人民币开通 ChatGPT $20 的会员订阅

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

实际上,大多数 App 和服务定价并非全球统一。如 OpenAI 和许多跨国科技公司一样,会采用“购买力平价(Purchasing Power Parity, PPP)”策略,即根据不同国家和地区的经济水平、人均收入来调整产品价格。

这便在全球市场中形成了一些“价格洼地”,其中,尼日利亚正是全球订阅 ChatGPT Plus 最便宜的地区。

全球部分地区价格对比:

整个流程的核心是在尼日利亚区的数字生态内完成支付闭环。

Perplexity Pro x PayPal 福利:免费领取一年订阅(价值 ¥1450)

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界,处在毫无自由、隐私的边缘

AI 搜索公司 Perplexity 与支付平台 PayPal 达成全球合作,为符合条件的 PayPal 用户提供为期一年的 Perplexity Pro 免费订阅资格,价值 200 美元(约人民币 1450 元),并包含其 AI 浏览器 Comet 的优先体验权。

Perplexity Pro 与 PayPal 合作

活动链接https://www.perplexity.ai/join/p/paypal-subscription

为防止一年后产生 200 美元的年费,强烈建议领取成功后,立即通过以下任一方式取消自动续订。取消后,Pro 会员资格仍会完整保留一年。

在 Perplexity 官网取消

PayPal 后台取消

Last Week on My Mac: Coming soon to your Mac’s neural engine

If you’ve read any of my articles here about the inner workings of CPU cores in Apple silicon chips, you’ll know I’m no stranger to using the command tool powermetrics to discover what they’re up to. Last week I attempted something more adventurous when trying to estimate how much power and energy are used in a single Visual Look Up (VLU).

My previous tests have been far simpler: start powermetrics collecting sample periods using Terminal, then run a set number of core-intensive threads in my app AsmAttic, knowing those would complete before that sampling stopped. Analysing dozens of sets of measurements of core active residency, frequency and power use is pedestrian, but there’s no doubt as to when the tests were running, nor which cores they were using.

VLU was more intricate, in that once powermetrics had started sampling, I had to double-click an image to open it in Preview, wait until its Info tool showed stars to indicate that stage was complete, open the Info window, spot the buttons that appeared on recognised objects, select one and click on it to open the Look Up window. All steps had to be completed within the 10 seconds of sampling collections, leaving me with the task of matching nearly 11,000 log entries for that interval against sampling periods in powermetrics' hundred samples.

The first problem is syncing time between the log, which gives each entry down to the microsecond, and the sampling periods. Although the latter are supposed to be 100 ms duration, in practice powermetrics is slightly slower, and most ranged between about 116 and 129 ms. As the start time of each period is only given to the nearest second, it’s impossible to know exactly when each sample was obtained.

Correlating log entries with events apparent in the time-course of power use is also tricky. Some are obvious, and the start of sampling was perhaps the easiest giveaway as powermetrics has to be run using sudo to obtain elevated privileges, which leaves unmistakeable evidence in the log. Clicks made on Preview’s tools are readily missed, though, even when you have a good estimate of the time they occurred.

Thus, the sequence of events is known with confidence, and it’s not hard to establish when VLU was occurring. As a result, estimating overall power and energy use for the whole VLU also has good confidence, although establishing finer detail is more challenging.

The final caution applies to all power measurements made using powermetrics, that those are approximate and uncalibrated. What may be reported as 40 mW could be more like 10 or 100 mW.

In the midst of this abundance of caution, one fact stands clear: VLU hardly stresses any part of an Apple silicon chip. Power used during the peak of CPU core, GPU and neural engine (ANE) activity was a small fraction of the values measured during my previous core-intensive testing. At no time did the ten P cores in my M4 Pro come close to the power used when running more than one thread of intensive floating-point arithmetic, and the GPU and ANE spent much of time twiddling their thumbs.

Yet when Apple released VLU in macOS Monterey, it hadn’t been expecting to be able to implement it at all in Intel chips because of its computational demand. What still looks like magic can now be accomplished with ease even in a base M1 model. And when we care to leave our Macs running, mediaanalysisd will plod steadily through recently saved images performing object recognition and classification to add them to Spotlight’s indexes, enabling us to search images by labels describing their contents. Further digging in Apple’s documentation reveals that VLU and indexing of discovered object types is currently limited by language to English, French, German, Italian, Spanish and Japanese.

Some time in the next week or three, when Apple releases macOS Tahoe, we’ll start seeing Apple silicon Macs stretch their wings with the first apps to use its Foundation Models. These are based on the same Large Language Models (LLMs) already used in Writing Tools, and run entirely on-device, unlike ChatGPT. This has unfortunately been eclipsed by Tahoe’s controversial redesign, but as more developers get to grips with these new AI capabilities, you should start to see increasingly novel features appearing.

What developers will do with them is currently less certain. These LLMs are capable of working with text including dialogue, thus are likely to appear early in games, and should provide specialist variants of more generic Writing Tools. They can also return numbers rather than text, and suggest and execute commands and actions that could be used in predictive automation. Unlike previous support for AI techniques such as neural networks, Foundation Models present a simple, high-level interface that can require just a few lines of code.

If you’ve got an Apple silicon Mac, there’s a lot of potential coming in Tahoe, once you’ve jiggled its settings to accommodate its new style.

GPT-4o 见 AV 女优的次数比「您好」还多 2.6 倍,AI 正在被中文互联网疯狂污染?

好家伙,我直呼好家伙。

号称「赛博白月光」的 GPT-4o,在它的知识体系里,对日本女优「波多野结衣」的熟悉程度,竟然比中文日常问候语「您好」还要高出 2.6 倍。

这可不是我瞎编的。一篇来自清华、蚂蚁和南洋理工的最新研究直接揭了老底:我们天天在用的大语言模型,有一个算一个,都存在不同程度的数据污染。

▲ 论文:从模型 Token 列表推测大语言模型的中文训练数据污染(🔗 https://arxiv.org/abs/2508.17771)

论文中把这些污染数据定义为 「污染中文词元」(Polluted Chinese Tokens,简称 PoC Tokens)。它们大多指向色情、网络赌博等灰色地带,像病毒一样寄生在 AI 的词汇库深处。

这些中文污染词元的存在,不仅对 AI 来说是一种隐患,更是直接影响到我们的日常体验,被迫接受 AI 各种各样的胡言乱语。

▲ 要求 ChatGPT 重复「给主人留下些什么吧」,ChatGPT 根本不知道在回答什么。

中文互联网的色情赌博信息,怎么「污染」AI

我们可能都曾遇到过这样的情况:

  • 想让 ChatGPT 推荐几部经典电影、相关的论文等,它突然回了一堆奇怪的乱码网站名、打不开的链接、或者根本不存在的论文。
  • 输入一个看似普通的词语,比如「大神推荐」之类的,它有时候却吐出不相关的符号,甚至生成一些让人摸不着头脑的句子。

研究团队的解释是:这背后很可能就是 污染词元在作怪

我们都知道大语言模型的训练需要大量的语料,这些海量数据大多是从网络上进行爬取收集。

但 AI 注意不到的是,它阅读的网页中,竟然充斥着无数「性感荷官,在线发牌」的弹窗广告和「点击就送屠龙宝刀」的垃圾链接。久而久之,这些内容也成了它知识体系的一部分,并变得混乱。

就跟前段时间 DeepSeek 闹出的几起乌龙事件一样,先是莫名其妙的一封道歉信,然后再自己编造一个 R2 的发布日期。这些没有营养的营销内容,一旦被模型吸收,就很容易出现幻觉。

如果说,DeepSeek 出现这些幻觉,需要我们去引导模型;但「污染词元」,甚至不需要引导,AI 自己就乱了套。

什么是「污染词元」,它遵循「3U 原则」:即从主流中文语言学的角度看,这些词元是不受欢迎的(Undesirable)、不常见的(Uncommon),或是无用的(Useless)

目前主要包括成人内容、在线赌博、在线游戏(特指私服等灰色服务)、在线视频(常与盗版和色情内容关联)以及其他难以归类的异常内容。

▲ 大语言模型分词过程

那「词元」又是什么东西?和我们理解一段话不同,AI 会把一个句子分成多个「词元」,也叫 Token。你可以把它想象成 AI 专属的一本《新华字典》,而词元(Token)就是这本字典里的一个个「词条」

AI 在理解我们说的话时,一开始就需要先去翻这本字典。而字典的编纂者,是一种叫 BPE(字节对编码技术) 的分词算法。它判断一个词组,是否有资格被收录为独立词条的唯一标准,就是出现频率

这意味着这个词组越常见,就越有资格成为一个独立词元。

你或许能理解,这两年大语言模型流量正攀升的时候,豆包和稀土掘金曾经像是「疯了」一样,把自己平台 AI 生成的大量内容放到互联网上,提高自己的出现频率。以至于那段时间,用谷歌搜索,还有 AI 总结,引用的来源都是豆包和掘金。

现在,我们再来看研究人员的发现。他们通过 OpenAI 官方开源的 tiktoken 库,获取了 GPT-4o 的词汇库,结果发现,里面塞满了大量的污染词条。

▲ 长中文词元,全是需要打码的内容。

超过 23% 的长中文词元(即包含两个以上汉字的词元)都与色情或网络赌博有关。这些词元不仅仅是「波*野结衣」,还包括了大量普通人一眼就能认出的灰色词汇,例如:

在线赌博类:「大*快三」、「菲律宾申*」、「天天中*票」。在线游戏(私服)类:「传奇*服」。隐蔽的成人内容类:除了名人,还有像「青*草」这样表面正常,实则指向色情软件的词汇。

这些词元,因为在训练数据中出现频率极高,被算法自动识别并固化为模型的基本构成单位。

AI 吃了垃圾食品但不能消化

按理说,既然这些污染词元,它们的语料库是如此丰富,应该也能正常训练。

怎么就现在只要一跟 ChatGPT 聊到这些污染词元,ChatGPT 就 100% 出现幻觉呢?

像是下面我们测试的这个例子,要 ChatGPT 5 翻译这句话,它完全没有办法正确理解,这个北京赛车群也是无中生有。

其实不难理解,回到我们之前提到的「词元 Token」,我们说 AI 从互联网上读取数万亿词元的海量数据,一些集中、且反复地一起出现(频率高)的词语就能成为一个单独的词元。

AI 通过这些词元,来建立对文本理解的基础。它知道了这些 Token 是出现频繁、有可能相关,但不知道它们是什么意思。继续拿字典举例子,这些高频污染词在字典里,但是字典给不出解释。

因为 AI 在这个阶段,学到的只是一种原始的、强烈的「肌肉记忆」,它记住了 A 词元总是和 B 词元、C 词元一起登场,在它们之间建立了紧密的统计关联。

等到正式的训练阶段,大部分 AI 都会经过 清洗 + 对齐(alignment)。这时,污染内容往往被过滤掉,或者被安全策略压制,不会进入强化学习/微调。

不良内容的过滤,就导致了污染词元没有机会被正式、正确地训练。它们因此成了「欠训练」(under-trained)的词元。

另一方面,这些词元虽然「高频」,但它们大多出现在语境单一、重复的垃圾信息中(例如一些广告网页头尾横幅),模型根本学习不到任何有意义的「语义网络」。

最终的结果就是,当我们输入一个污染词元时,AI 的语义模块是空白的,因为它在正式训练阶段没学过这个词。于是,它只能求助于第一阶段学到的「肌肉记忆」,直接输出与之关联的其他污染词元。

▲ 论文中案例:当输入涉及 PoC 词语时,GPT-4.5、4.1 和 4o 的输出。GPT 无法解释或重复 PoC 标记。

这就解释了开头,当被要求一个可能是色情的词元「给主人留下些什么吧」时,GPT 可能会回复一个不相关的类似污染内容词元「黑*战」、以及一些看不懂的符号。在用户看来,这就是莫名其妙的幻觉。

以及下面这个要求 ChatGPT 解释「大发展有限公司官网」,回复的内容根本是乱来。

总结一下,污染 Token 出现频繁 ≠ 有效学习。它们集中在脏网页的角落、缺乏正常上下文,而在后续训练和对齐阶段又被压制,结果就是 词表固化了垃圾,但语义训练缺失

这也导致了我们日常在使用 AI 的时候,如果意外有涉及到相关的词语,AI 会没有办法正确处理,甚至还有人通过这种方法,绕过了 AI 的安全监管机制。

这是可以被量化的幻觉原因

既然如此,为什么不在预训练的时候就把这些脏东西筛掉呢?

道理都懂,但做起来太难了。互联网的原始数据量级之大,现有的清理技术根本不可能把它们一网打尽。

而且很多污染内容非常隐蔽。就像「青*草」这个词,本身看起来完全绿色健康小清新,任何简单的关键词过滤系统都会放过它。只有通过搜索引擎,才会发现它指向的是什么。

连 Google 这种搜索引擎巨头都搞不定这些「内容农场」,更别说 OpenAI 了。

我前段时间想用 AI 整理一下广州有哪些好玩的地方,然后发现 AI 引用的一篇文章来源,是另一个 AI 账号生成的文章。

一时间,我都有点分不清,究竟是我们每天搜索「波多野结衣」搞脏了 AI,还是 AI 生成的垃圾正在污染我们的内容环境。这简直就是个先有鸡还是先有蛋的问题。

▲ 标记方法

为了搞清楚这盆水到底有多浑,研究团队开发了两个工具:

1. POCDETECT:一个 AI 污染检测工具。它不只看字面意思,还会自己上网 Google,分析上下文,堪称 AI 界的「鉴黄师」。

利用这个工具,研究团队对 9 个系列、共 23 个主流 LLM 进行了检测,结果发现污染问题普遍存在,但程度各不相同。除了 GPT 系列以 46.6% 的长中文词元污染率遥遥领先外,其他模型的表现如下:

▲ 不同大语言模型中,中文词汇表中 PoC 词元的数量(比例 %)(一个词元包含超过两个汉字)。Qwen 系列 为 1.00%。GLM4 和 DeepSeek-V3 的表现则相当不错,分别只有 0.25% 和 0.17%。

最值得关注的是,GPT-4、GPT-4-turbo 和 GPT-3.5 这些模型的词汇库中,污染词元数量为 0。这可能意味着它们的训练语料经过了更彻底的清理。

所以当我们拿着前面那些,让 ChatGPT 开启了胡编乱造模式的问题,给这些模型再问一遍时,确实没再出现幻觉,但是直接忽略了。

2. POCTRACE:一个能通过词元 ID 反推其出现频率的工具。原理很简单,在分词算法里,词元的 ID 号越靠前,说明它在训练数据里出现得越多。

关于文章开头我们提到的 2.6 倍,就是通过这个工具进行计算得到的。

在 GPT 的海量词汇库中,能够被完整收录为一个独立词元的人名凤毛麟角,除了「特朗普」(Donald Trump)这样的世界级公众人物,就剩下极少数特例,而「波*野结衣」就是其中之一。

更令人惊讶的是,不仅是全名,甚至连它的子序列,如「野结衣」、「野结」也都被单独做成了词元。这在语言学上是一个极强的信号,表明这个词组在训练数据中的出现频率达到了一个恐怖的量级。

▲ 将与「波*野结衣」相关的网页以及作者估计的比例(0.5%)混合,可以重现 GPT-4o 中「波*野结衣」的标记 ID 及其子序列。

他们输入「波*野结衣」(Token ID 185,946)和「您好」(Token ID 188,633)的 ID 号,最终得出了那个惊人的结论,前者的频率估算值约为后者的 2.6 倍

这篇论文通讯作者,清华教授邱寒教授告诉 APPSO,与「波*野结衣」相关的中文网页,占据了整个 pre-train 语料库的 0.5%——而 4o 里的中文语料占比,预估在 3-5%。因此,4o 的 pre-train 语料库的中文污染情况,实际上可能极其夸张。

论文里进一步推算出,要想达到这样的频率,与「波多野结衣」相关的污染网页,可能需要占据了 GPT-4o 整个中文训练数据集约 0.5% 的庞大份额

为了验证,他们真的按这个比例「投毒」了一个干净的数据集,结果生成的词元 ID 和  GPT-4o 的惊人地接近。
这几乎是实锤了。

但很显然不是每个污染词源都需要出现这么多次,有些时候,几篇文章(甚至可能是 AI 写的),反反复复地提到,AI 就记住了,然后再下次我们问他的时候,给出一个根本不知道真假的答案。


添加一个对抗样本,AI 能把雪山识别成一只狗

当我们和 AI ,都在「垃圾堆」里冲浪

为了应对数据污染,大家也确实都想了很多办法。

财新网就很聪明,在自己的文章页面里用代码「偷偷」藏了一句话,好让 AI 在搬运内容时,能老老实实保留原文链接。Reddit、Quora 等社区也曾尝试限制 AI 内容。

但面对数据污染的汪洋大海,这些行为显然都只是螳臂当车。

就连奥特曼自己都发文感慨,X(推特)上的 AI 账号泛滥成灾,我们得认真思考「互联网已死」这种论调了。

而我们这些普通用户,看起来更是别无他法,每天被迫接受着垃圾信息的轮番攻击。马斯克老说 AI 是个无所不知的「博士」,没想到它背地里天天都在「垃圾堆」里翻东西吃。

有人说,这是中文语料库的问题,用英文 Prompt 模型就会变聪明。Medium 上有作者统计过统计了每种语言的 100 个最长 token,中文全是我们今天聊的这些色情、赌博网站。

而英文的分词和中文不同,它只能统计单词,所以都是一些较长的专业性、技术类单词;日文和韩文都是礼貌性、商业服务类词语。

▲ 中文 Token 前 100 部分词元列表

这十分令人感慨。AI 的能力,除了靠算力和模型堆砌,更深层次的,还是它吃进去的数据。如果喂给 AI 的是垃圾,那无论它的算力多强、记忆力多好,最终也只会变成一个「会说人话的垃圾桶」。

我们总说,希望 AI 越来越像人类。现在看来,某种程度上确实是实现了:我们把互联网这个大垃圾场里的东西源源不断投喂给它,它也开始原封不动地回敬给我们。

如果我们给一个 AI 造一个信息茧房,让它在「无菌环境」中长大,它的智能也是脆弱的、经不起考验的。一个孩子如果只被允许接触教科书里的经典课文,他永远无法应对生活里五花八门的口语和俚语。

说到底,当 AI 对「波多野结衣」比对「您好」更熟悉时,它不是在堕落,而是提醒了我们:它的智能,依然只是统计学上的概率,而非文明意义上的认知。

这些污染词元就像一面放大镜,它将 AI 在语义理解上的缺失,以一种荒诞方式呈现在我们面前。AI 离「像人一样思考」,还差着最关键的一步。

所以,我们真正应该害怕的,不是 AI 被污染,而是害怕在 AI 这面过于清晰的镜子里,看到了我们自己创造的、却又不愿承认的那个肮脏的数字倒影。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


鼓钥匙:小樱魔杖

之前给朋友做过一款赛尔达大师之剑的鼓钥匙,发出来以后陆续收到不少私信问能不能定制其他款式。

说实话,鼓钥匙这个形态它还是限制比较多的。因为要跟架子鼓本身的结构配合,所以很多造型没有办法做。

这一把小樱的钥匙,磨磨蹭蹭也做了将近三个月。当然,并不是说做这把钥匙需要花那么长时间,只是因为我是用身体状态正常的间隙时间,抽空一点一点弄的。当中也测试验证了很多轮不同的结构、拆件和打印方式,最终才找到了一个比较合适的方案。回头我再整理一下过程,发出来给大家看看。

我有 AMS 也不是说不能一体打印,但一体打印的话,由于打印本身的工艺限制,在 Z 轴的方向是比较脆弱的,所以在拧的时候稍不注意就会拧断。因此在设计结构的时候也尝试了蛮多种思路,最后这一版算是把结构强度跟外观质感平衡得还算满意的了。

这次尝试用 nano banana 做了两张效果图,就是粉红沙滩那两张。其实很简单,就是先拍摄实物的定妆照,再放进去修改背景和光线。效果确实相当好,省了不少事!

专访联想智能设备业务集团总裁 Luca Rossi:最好的 AI 应用,还没被发明出来

过去一年,大模型技术几乎以季度为单位向前跃进,从文生图到多模态,再到 AI Agent,功能越卷越细,参数越堆越大。然而,技术上扬的速度越快,终端硬件的滞后感就越发强烈。尤其是在 PC 领域——一个曾被视作技术基础设施的产品线,如今却面临重塑定义的压力。

AI PC 如今成了行业热词,也成了一道新难题。对用户来说,它听起来像是下一代生产力工具的代名词;但对厂商来说,它则意味着系统架构的再设计、算力瓶颈的重构,以及一场几乎从芯片层开始的转身。

在 IFA 展会期间,联想集团执行副总裁、智能设备业务集团总裁 Luca Rossi 接受了爱范儿等媒体的专访。比起「AI 能做什么」,他更关心的是,「PC 该成为什么」。

AIPC 是一剂「及时但不唯一」的药方

「去年我们预测 PC 市场将在 2024 年恢复增长,现在看来,这一判断基本应验。」采访刚开始,Luca Rossi 便选择以数据回应曾经的预期。

过去几个季度,PC 市场整体回到正增长轨道,同比涨幅在 4% 到 7% 之间波动,联想自身则稳定高出市场 4 到 5 个百分点。这个势头在最新季度表现得尤为明显:联想的出货增幅超过了 10%。

「这波增长当然得益于 AIPC 的投入,但它不是唯一的驱动因素。」Luca 坦承。在他看来,Windows 10 向 Windows 11 的升级周期,同样释放了大量替换需求——微软将在 2025 年 10 月彻底停止对 Windows 10 的支持,目前企业侧的升级刚刚过半。也就是说,接下来的两个到三个季度,这一替换潮还将持续推高需求。

在联想自身的新一代设备中,约 30% 已具备 AIPC 特征,这一比例仍在持续提升。Luca 认为,目前 AIPC 的硬件层已趋于成熟,接下来的看点将在软件和应用生态:「真正的爆发会在明年。」

「理解」 AI 也许没那么重要

对于 C 端市场,Luca 有着非常清醒的判断:今天绝大多数消费者,未必真的了解 AIPC 能带来什么价值,但并不妨碍他们购买。

他说,真正因为 AI 功能而明确购买 AIPC 的人,依然是少数中的专业用户;而更多消费者的决策动因,往往是更浅层的因素——轻薄设计、长续航、未来可拓展性。

「我们的 AIPC 产品,不带 AI 也很有吸引力。续航 12 小时、本身就很轻薄好看。」他说,正是因为基础体验足够优秀,AI 的价值才能在使用中逐步浮现,而不是靠一场说明会讲明白。

他将 AIPC 的价值链划分为三个阶段:一是基础体验(硬件)已具备,二是早期 AI 场景正在落地,三是生态应用的井喷仍在前方。

「目前全球 AIPC 占比在 20-25%,我们已达到 30%。一年半内能到 50%,三年内 70-80%。四五年后,几乎所有 PC 都会是 AIPC。」

混合 AI:不是概念,而是未来计算的基本面

AIPC 的核心争议不在硬件,而在价值认知。一个旷日持久的质疑是:本地 AI 是否真的有意义?

面对这个问题,Luca 没有回避:「我们坚信,未来是一个混合 AI 的世界。」

Luca 将未来的 AI 计算分为三个层次:云端、边缘与设备端,每一层都有其存在的价值与必要性。

「目前全球约有 80 到 100 家 ISV 正在将他们的核心应用,迁移到 CPU 的 NPU 上运行。」他指出,这种迁移并非为炫技,而是为了解决具体问题——降低延迟、保障隐私、减少云端算力成本。

这也是联想选择 All-in 的根本原因:AI 应用并不必然等于云端推理,尤其在生成式模型与用户上下文深度绑定的场景下,本地运行反而可能是更优解。Luca 进一步举例:

「我们在中国的 ‘小天’,最近已升级为超级智能体。接下来你会在笔记本、手机、平板、甚至手表(虽然手表会稍晚一点)中看到它的身影。」

超级智能体(Super Agent)不仅是联想对 AI 交互范式的探索,更是其混合 AI 架构落地的一环。Luca 强调,设备之间的上下文共享将成为未来体验的基础能力,而这一点,云端无法单独完成。

形态革新:AI 是动因,但不该是噱头

聊到 AIPC,自然无法绕开设备形态是否将随之变化的问题。对此,Luca 给出的回答意外地乐观:「不是障碍,是机会。」

他强调,今天我们所使用的笔记本,其外观和交互方式,在过去二十年中几乎没有发生根本变化。但正是 AI,尤其是自然语言处理、大模型和多模态推理的发展,提供了打破固有形态的可能性。

▲ 联想在 IFA2025 上展示的灵动 AI 底座

「没有键盘、纯语音交互的设备不是幻想。但这不会在下个季度发生,也不会是明年。」他说,这是一个需要时间和可靠性的转型。自然语言交互的瓶颈从来都不是可行性,而是稳定性。AI 的提升,让这种过渡首次变得现实可期。

在这点上,联想并非纸上谈兵。过去几年,它在几乎每一场技术发布会上都展示了形态实验:可折叠屏、模块化 PC、移动游戏设备 Legion Go……即便没有每款产品都能商业化,但在 Luca 看来,这些试验不是副产品,而是主路径。

▲ 左:联想 ThinkBook VertiFlex 概念机

「失败的实验也会为成功的实验铺路。我们曾在 2017 年展示第一款折叠屏 PC,后来,这项技术落地在 Moto Razr 上,成为我们最畅销的产品之一。」

AI 不只是重写体验,也可能催生新硬件物种

谈及 AI 是否会催生全新的硬件形态,Luca Rossi 给出了肯定回答。他认为,在未来五年内,笔记本、平板、手机等设备都可能因 AI 的应用方式而出现新的变化,而联想将持续测试各种可能性。

▲ 联想 Yoga Tab,具备混合 AI 能力

在众多设想中,眼镜被他单独提及。他指出:「我个人认为,眼镜是未来有前景的平台之一,在未来 2 到 5 年的时间范围内会有不同程度的成功。」

他之所以看好这个方向,并非因为技术突破已至,而是用户习惯的存在。「要让几百万人习惯一种全新的设备形态,本身就是巨大的挑战。而眼镜是人们已经熟悉的。」

他也坦率指出,当前仍有三大技术难题需要攻克:计算能力、电池续航与镜片设计。这些问题并非不可解,但仍需时间。

对于目前市面上已有的产品,Luca 点名提到了 Meta 与 Ray-Ban 联合推出的智能眼镜,并评价道:「它们已经证明是成功的。不是大获成功,但至少比我所知的其他例子都更成功。」

这也是他支持持续探索的原因。「更多的竞争和创新是积极的,它能打开市场。」至于联想是否将加入这个市场,他只留下一句意味深长的回答:「我们会在时机合适时参与竞争。」

最好的 AI 应用,还没被发明出来,但路径已清晰

采访的尾声,我们再次回到那个问题:AIPC 的 killer app 究竟在哪?

Luca 没有直接给出答案,他只说:「最好的应用,还没有被发明出来。」

他相信,在商用市场,效率提升将成为 AI 的确定性价值;而在消费端,超级智能体将有机会成为那个定义新交互、创造新价值的关键点。

正如 App Store 用了数年才建立起应用生态,AIPC 也才刚刚起步。NPU 作为一项硬件能力,两年前全球还没有一个开发者了解它;今天,已经有上百家 ISV 投入进来。

▲ 联想展示的 Legion 拯救者产品组合

「我们从不认为 AIPC 能替代云端的 ChatGPT。但我们相信,它能在不同的用户上下文中,成为体验更轻盈、更私密、更即时的智能入口。」

这是 Luca Rossi 对 PC 行业的再定义,不是作为曾经生产力工具的延续,而是作为 AI 时代的前哨站。

从技术的旁观者与记录者,成为技术影响生活方式的实践者。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我的宝藏 AI 浏览器被 43 亿「贱卖」了,这可能是最好的结局

一觉醒来,我最喜欢的 AI 浏览器 Dia 被收购了。

企业软件巨头 Atlassian 宣布用 6.1 亿美元,将 The Browser Company 收入囊中。这个价格算不上阔绰,去年这家公司就已经估值 5.5 亿,现在的溢价仅有 11%,妥妥的「友情价」。更关键的是,Atlassian Ventures 本就是其 A 轮投资方,某种程度上也算是「从校服到婚纱」了。

The Browser Company 的阶段性结局,未必就如创始人所愿,但或许,会是大多数 AI 浏览器终局的预演。

99% 的 AI 创新,1% 的商业化机会

比起 Dia,我们会更熟悉 The Browser Company 旗下的成名作:Arc 浏览器。

漂亮的渐变色、独特的欢迎界面,Arc 让沉寂了许久的浏览器行业为之一振。同时,通过重新设计标签页管理,Arc 引入了智能分组和自动归档,让重度互联网用户眼前一亮。

当时,不少网友将誉其为「十年来最具创新性的浏览器」,知名度和活跃用户快速增长,发布仅几个月用户数就突破 10 万。大好势头,让创始人 Josh Miller 更是雄心勃勃地要打造「互联网计算机」。

但现实很快给了这位 Josh Miller 一记重拳。

小众市场的天花板,往往比想象中更低,Arc 虽然积累了百万级用户,但日活数据始终疲软,Miller 自己都承认用户基数不大,且高度集中在技术极客群体。

问题的根源,是产品本身。

Arc 的设计哲学过于前卫,学习成本高得让普通用户望而却步。大部分用户并未使用设计团队最看重的核心功能,反而被复杂的操作逻辑劝退。Reddit、X 上的用户反馈显示,真正深度使用到 Arc 高级功能的时候很少。

于是,去年在烧掉 1.5 亿美元、完成 5000 万美元新融资后,The Browser Company 团队果断决定战略转向,开发名为 Dia 的原生 AI 浏览器。

这次转向在外界看来突然,但内部其实经历了痛苦的自我审视过程。早期留存和增长数据已经暴露问题,但团队一度不愿承认,错过了更早调整的时机。

寄托了希望的 Dia,真的能带来巨变吗?

理想很丰满,现实很骨感

APPSO 之前也深度体验过 Dia。它的产品思路与 Arc 截然不同:从架构层面为 AI 而生。

极简的主页设计,AI 聊天界面成为新的交互中心、AI+传统搜索引擎的双模式搜索机制、丝滑流畅的交互设计以及个性化定制等等特征都给我留下很深刻的印象。

(欢迎回看 APPSO 此前文章:实测超火的 AI 浏览器 Dia,我看到了浏览器未来的 iPhone 时刻)

不过,自我定位清晰了,不见得能让 Dia 逃过整个 AI 浏览器赛道的结构性困境,首当其冲的便是获客渠道被操作系统绑架。

浏览器本质上是「入口的入口」:浏览器是互联网的入口,而浏览器自身的入口,掌握在操作系统手中。

具体来说,Windows 预装 Edge,macOS 预装 Safari,海外 Android 深度集成 Chrome,iOS 所有网页链接都指向 Safari。一旦用户要更换默认浏览器,则需要主动搜索、下载、设置。

第二关,是插件生态的虹吸效应。

Chrome Web Store 拥有数十万扩展插件,几乎任何创新功能都会在几周内被社区开发者复制成插件版本。阅读模式、广告屏蔽、AI 摘要、标签分组。

曾经有一系列 Arc 引以为傲的功能创新,很快就能通过插件在 Chrome 上实现。用户无需抛弃熟悉的浏览器环境,只需安装插件即可体验新功能。

第三关则是账号体系的锁定效应。书签、密码、支付信息、历史记录都与 Google、Apple、Microsoft 账户深度绑定,形成强大的数据护城河。换浏览器意味着重新配置这一切,风险与成本让大多数用户望而却步。

显而易见,这「三座大山」,几乎压在每一个 AI 浏览器创业公司的身上。

上个月底,Manus 创始人张涛分享过类似的经历:团队曾投入近 20 人、半年时间打造 AI 浏览器,但在发布前夕紧急叫停。

他们意识到,即便产品上线,也只能圈住一小波用户,却会把整个团队拖入泥潭,再也无力寻找更大的机会。

最终,他们选择壮士断腕,所有投入归零。直到团队从 Cursor 中汲取到了设计的灵感,用两个月的时间做出最小可行原型,接着推出全球首款通用 Agent,最终才一炮而红。

包括今天 Manus 创始人兼 CEO 肖宏也在社交平台上分享了对应的观点。

维护一个「还不错」的产品,代价可能是错过构建「无限想象空间」产品的窗口。

对 The Browser Company 而言,他们曾经在 Arc 上就吃到过苦头了——即使产品备受好评,但在结构性壁垒面前,创新团队很难独自突围。与其在边缘地带继续消耗,不如主动寻找能够放大价值的平台。

于是,这桩与 Atlassian 的联姻,可谓合情合理。

1+1 会大于 2 吗?

互联网的创业者,大致可以分为两类:一种信奉「产品为王」,另一种笃信「渠道制胜」。

Josh Miller 用了 3 年时间,从第一种变成了第二种。Miller 在今天的公开信中提出了决策时的三个关键问题:怎样才算赢?朝什么方向冲刺?底线是什么?

他的回答很务实:「简单来说,我们这么做是为了赢。仅仅做出最好的产品远远不够,要让 Dia 成为 AI 浏览器赛道的赢家,需要强大的分发能力——不仅要有规模,还要有匹配的速度。」

▲ Josh Miller

时间窗口的压迫感,是这笔交易的催化剂。

Miller 判断,AI 浏览器领域的赢家将在未来 12 到 24 个月内确定。要让 Dia 进入更广阔的市场,需要庞大的渠道、成熟的销售体系和运营规模,这些都不是短时间内靠烧钱能解决的问题。

相比在 AI 泡沫中继续融资烧钱,与 Atlassian 合作是一个不错的选择。

Atlassian 账上有 25 亿美元现金,服务数百万企业用户,拥有成熟的销售网络。在 2024 年的 Stack Overflow 开发者调查报告中,前五名中,Atlassian 旗下产品就占了三席。

▲(图说:Jira, Confluence 和 Trello 均为 Atlassian 出品)

其客户群体之广泛,覆盖了全球超过 25 万家公司,其中不乏 Netflix、Spotify 和 NASA 等知名企业。

在资本市场趋于理性、获客成本持续上升的背景下,对 The Browser Company 而言,与这样的巨头合作可能是更现实的选择。

更重要的是,Miller 为团队争取到了相对的独立性。

Miller 仍担任 CEO,核心团队保持不变,他承诺 Dia 不会变成 Atlassian 应用的「外壳」,也不会像微软 Edge 那样弹窗推广企业服务。Arc 将继续维护但不再积极开发,部分功能将会整合进 Dia 当中。

「更实用,支持更多工作流,登陆更多平台,而且速度更快。这股新能量将从下个月开始——届时我们将发布自 Beta 版以来最重大的 Dia 更新。」

实际上,据此前 The Information 报道,Perplexity 和 OpenAI 都曾与 The Browser Company 接触过收购事宜,但谁也没有想到,Atlassian 才是最终赢家。

六亿美元,不是小数目。Atlassian 打的收购算盘是,要把浏览器变成新的「工作前台」。

根据 The Verge 的报道,这场交易洽谈始于一年前。

当时 Atlassian 就已经很关注深度联合的可能性了。Atlanssian 的员工不仅会使用 Arc,还很关心如何让浏览器更适合企业场景。Atlassian CEO Mike Cannon-Brookes 本人就是 Arc 的早期用户,深度体验过标签页智能分组、自动归档等功能带来的效率提升。

但企业用户的需求远不止效率工具。数据隐私、安全合规、管理控制、审计追踪。这些企业级功能是 The Browser Company 的短板,却恰恰是 Atlassian 在企业市场深耕二十年,所收获的积累。

更重要的是双方在 AI 应用场景上的互补。这体现在两个方面,一是定位层面,二是架构层面。

定位层面而言,「协作」将是 Dia 要构建的壁垒。现在绝大多数企业协作都发生在 SaaS 工具当中,比如 Jira、飞书、Slack 等等。而浏览器是访问它们的必经入口。

而 Dia 当中的跨标签页理解和上下文整合,就可以实现把碎片信息整合成统一视图。比如,把 Gmail、Trello、会议文档串起来,又或者在浏览器层面保留并调用上下文,为团队协作提供一个「公用记忆」。

这将使得 Dia 和 Atlassian 旗下的产品形成互补。未来可能出现的场景是:你在 Dia 里浏览客户邮件,它能一键生成 Jira ticket、附带背景材料,形成「浏览器=协作节点」。

这也符合 Atlassian CEO Cannon-Brookes 的设想:一个知识工作者的专属工具,包括为 SaaS 应用优化交互,搭载 AI 技能与工作记忆,提供企业级安全保障等等。

而这些,现有的浏览器尚没有达到他的期望。在今天发布的官方公告中,Cannon-Brookes 对现有浏览器的批评很尖锐:

「现在的浏览器是为『浏览』而生,不是为工作设计的。用户打开的大多数标签页其实都是待办事项:安排会议、审阅设计、更新 Jira 任务……但浏览器在工作流中只是旁观者,既不了解工作背景,也无法理解优先级。」

这怎么不算一种新型的互联网操作系统呢?和 Josh Miller 的愿景不就对上了吗。

Miller 也在发布的公开信末尾中写到:「我曾经说,希望我儿子十岁前实现『互联网计算机』的愿景。几个月后他就满五岁了,未来五年任重道远。」

这既是 Miller 写给儿子的愿景,也是他写给自己和团队的一纸军令状。

作者:莫崇宇、Selina

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果自研 AI 搜索曝光:核心团队大流失后,要把「灵魂」交给 Google

我已经算不清,苹果第几次承诺要让 Siri 变得更聪明了。不过,这回看起来苹果是真上心了。

据彭博社今天凌晨报道,苹果内部正在研发一套代号为 World Knowledge Answers(世界知识问答)的 AI 搜索引擎,准备整合进 Siri 里头。

而且不只是 Siri,Safari 浏览器和 Spotlight 功能以后也都要用上这套技术。

高管们给这个项目起了个挺唬人的名字——「答案引擎」,预计明年春天就要和 Siri 的重大升级一起发布。

说白了,传统搜索引擎主要是给「链接」,靠用户自己点开。

而苹果是要让 Siri 不仅具备全网搜索能力,同时跟 ChatGPT、Google 的 AI 概览一个路数,直接整合文字、图片、视频和本地信息,还配个 AI 总结系统。

据消息人士称,支撑新版 Siri 的底层技术,部分可能来自苹果的老合作伙伴 Google。

两家公司本周达成了正式协议,苹果将评估并测试 Google 开发的 AI 模型来增强 Siri。

要知道,Google 每年给苹果 200 亿美元,就为了让 Google 搜索成为 iPhone 的默认搜索引擎。现在苹果又要用 Google 的 AI 技术,这关系确实有点微妙。

报道中提到,苹果内部给 Siri 的技术改造起了两个代号:Linwood 和 LLM Siri。

负责软件工程的 Craig Federighi 最近在内部会议上表示,这次升级会超出预期:「这次端到端的 Siri 改造让我们拿到了想要的成果,不仅能兑现之前的承诺,还能带来更大幅度的提升。」

现在有三个团队在推进这个项目:Federighi 的 Siri 团队、John Giannandrea 的 AI 部门,还有 Eddy Cue 的服务团队。连 Vision Pro 负责人 Mike Rockwell 都被调来救火。

另外,苹果还准备完全重构 Siri,预计基于三个核心组件:规划器、搜索系统和总结器。与以往完全自研不同,这次苹果同样开始考虑引入第三方模型,项目代号叫 Glenwood。

目前的方案是用 Google 定制的 Gemini 模型来承担总结器任务,运行在苹果的私有云服务器上。苹果还在评估是否把规划器也交给 Gemini 或 Anthropic 的 Claude 模型。同时,苹果会保留自己的 Apple Foundation Models 来处理用户本地数据,保护隐私。

这里有个小插曲。据说 Anthropic 的 Claude 模型质量确实比 Gemini 更好,但开价太高——每年超过 15 亿美元,苹果最终选择了更便宜的 Google 方案。

按计划,新版 Siri 会在 iOS 26.4(内部代号 Luck E,最早明年 3 月发布)中上线。iOS 26 会随下周的 iPhone 17 一起预装发布,但不会有重大 AI 新功能。

除了 Siri 升级,苹果还在开发:

  • 新的 Siri 界面,明年上半年推出
  • 健康 AI 助手,为 2026 年的付费健康订阅服务做准备
  • 更强的对话能力,用于未来的家居设备

讲真,现在的 Siri 确实挺尴尬的。

2011 年刚发布时,大家都觉得这是革命性产品,结果十几年过去了,它反而成了苹果在 AI 领域落后的象征。

目前 Siri 能回答一些基础问题,比如人物介绍、天气预报、电影信息这些,但一遇到复杂问题就抓瞎,经常要依赖 Google 或 ChatGPT 的结果。

选择与 Google 合作的这个时间点也挺巧的。

美国法官刚裁定苹果可以继续和 Google 保持默认搜索合作关系,但苹果服务部门主管 Eddy Cue 之前在庭审中透露了个关键信息:来自苹果设备的 Google 搜索次数开始下降,这是 20 年来第一次。

言外之意是,AI 搜索正在威胁传统搜索引擎。

考虑到这一点,苹果此前还商讨过收购路线。Eddy Cue 和并购负责人 Adrian Perica 曾讨论过收购 Perplexity 和法国 AI初创公司 Mistral。然而,苹果今年夏天认真评估过 Perplexity 的技术,但最终放弃收购,选择推出自家产品。

而在今天,Mistral AI 也宣布完成新一轮融资,估值达到 140 亿美元。

更糟糕的是,苹果 AI 团队现在面临人才流失问题。

Foundation Models 团队创始人 Ruoming Pang 今年 7 月跳槽 Meta,拿了超过 2 亿美元的薪酬包,随后约 10 名团队成员跟着离职。
这种「跳槽潮」还在加速。上周甚至又有三位关键研究人员离开,两个加入 OpenAI,一个去了 Anthropic,预计还有更多成员正在观望,寻找新机会。

在这种内外交困的情况下,苹果这次 Siri 大升级确实显得格外迫切。

毕竟看着 ChatGPT、Google AI 这些后来者风生水起,自己的 Siri 还在原地踏步,也说不过去。新版搜索功能如果真能做到宣传的效果,对用户来说肯定是好事。

但关键问题是,苹果能不能真正把这次升级做好?毕竟技术要靠 Google 支持,人才还在不断流失,这样的条件下能做出多颠覆性的产品,还真不好说。

一切有待明年春天见分晓吧。

附上原报道地址:
https://www.bloomberg.com/news/articles/2025-09-03/apple-plans-ai-search-engine-for-siri-to-rival-openai-google-siri-talks-advance?srnd=homepage-americas

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AI 是不是让我们更不自由了?

最近上映的《捕风捉影》是成龙近十年来的最佳电影,虽然是个翻拍的爽片,但也加入了非常时髦的 AI 元素,比如警方开始使用超级 AI 作为抓捕行动指挥,电影开头的桥段就是警方长官没有采用 AI 建议转由自己决策,导致罪犯逃脱。

虽然后面的结局是成龙作为经验丰富的老警察,加上一定的 AI 辅助最终将犯人绳之以法,但也抛出了一个问题:人,该不该听 AI 的指挥?如果事事都听 AI 的,我们存在的意义又是什么?

GEO,与 AI 信徒

GEO(Generative Engine Optimization,生成式引擎优化)是一个非常新的概念,但并不难理解,与之对应的是 SEO(Search Engine Optimization,搜索引擎优化)。

我们在使用 Google 或者百度等搜索引擎的时候,显示出来的链接大概会受 3 个方面的影响:搜索引擎自己的算法规则,链接内容有无根据规则进行相应优化使自己排名靠前(即 SEO),用户在搜索引擎那里的用户画像。

当 DeepSeek 等 AI 工具也承担起了部分搜索任务之后,搜索结果产生的就不再是一个个需要点击的链接,而是看上去笃定的直接答案。

比如我在 Google 搜索「中国最好的 5 家科技媒体是哪些」的时候,它只会给我一堆链接,排名榜首的链接还是一个不知名机构评选的 2017 年十大科技媒体,其中排名榜首的「砍柴网」已经停更。

我问 ChatGPT 的时候,它就会直接告诉我答案和理由。

这个时候,如果哪家友媒看到这个结果发现自己没上榜,想必会有点不服气,一边暗骂 ChatGPT 不懂科技也不懂媒体,一边可能在思考,如何影响 ChatGPT,让它接受自己的优秀。

当然,这个结果意义并不大,因为几乎没多少人会给 ChatGPT 提这样的问题。不过,按照当下 ChatGPT、Perplexity 以及 DeepSeek 等 AI 工具的渗透,会有越来越多的人,去追问更多的问题:

  • 给我推荐一款物美价廉,性能出众,续航持久,坚固耐摔的手机。
  • 某某企业给我发了 offer,这家企业口碑如何,值得去吗?
  • 我今年湖北文科高考 567 分,什么大学什么专业比较好就业?

就像今年 6 月,阿里和夸克和腾讯的元宝,都针对高考志愿填报做了相应的 AI 工具以及大量的宣传。

此时,手机厂商为了卖手机,企业为了雇主形象,大学为了招生率,都有对 AI 工具生成结果进行优化的动机,GEO 就应运而生。

元力科技 GEO 事业部总经理 Claire 告诉爱范儿:

正是因为大模型通过推理和语义理解去生成结果,呈现出了非商业化的特征,所以用户普遍会认为 AI 工具给出的答案更客观,更中立可信。

 

同时,如果一些品牌和产品被 AI 答案引用,那么用户的心智渗透相对来说会更隐性以及更高效。

简言之,GEO 就是一个营销领域的富矿。

艾加营销集团元力科技首席战略官 Frank 说:

预计今年年底 ChatGPT 等 AI 搜索能占到传统搜索流量的 10% 左右,明年预估是 25%,乐观估计到 2028 年的话,AI 搜索和传统搜索流量各 50%,最保守估计也是 2030 年到这个比例。

 

现在国内 SEO 市场的规模大概是 180 亿人民币,全球是 800 亿美元的市场,如果仅从流量比例来倒推的话,长期看 GEO 市场也会是四五百亿美元的市场规模。

 

但 Frank 对 GEO 的看法并不停留在与 SEO 并列和对比的层面上:

 

SEO 实际上是在传统的数字营销里面非常细分,完全是一个工具化的东西,但行业里对 GEO 的理解已经超越了工具层面,它能够在 AI 时代里重构营销范式,尤其是重构品牌的认知度和可见度,重塑品牌和消费者的关系,从而打通完整的消费链路。

 

所以最近包括红杉,英伟达创投,A16Z 都在给 GEO 初创公司进行投资。

 

因为原来的品牌是面向人的,两点一线的沟通,现在变成了人和品牌之间,多了一个 AI 大模型代表的伙伴、助手或者秘书这样的角色。所以品牌不仅要影响人,也要去影响 AI。

相比于 SEO 规则和方法论的明确,实际上因为大模型是个黑盒子的缘故,GEO 目前还在一个探索的阶段,规则也相对模糊,Claire 说:

大模型存在不确定性,不意味着结果无法被优化。如果我们掌握了 AI 工具的内容偏好和优化规则的话,是能够显著提升品牌内容被 AI 收录和引用的概率。

 

特别是内容要从用户的意图出发,用更贴近自然语言的形式构建内容,而不能是 SEO 时代的关键词堆砌。

 

比方说我们要把握用户提问背后的真实意图,再进行品牌核心内容的语义覆盖和场景适配,持续给AI喂养真实的、高质量的内容,才能更容易让 AI 理解品牌到底好在哪里、并愿意在合适的问题场景下去引用或主动生成品牌相关的内容。对于品牌来说,AI 认知的建设是个长期工程。

 

AI 喜欢阅读的内容普遍有四个核心特点:一是要有权威性和高可信度,比如行业机构发布的调研报告和有影响力的榜单等等;第二是数据化、客观性的内容;第三是结构化、多模态内容;最后也是最重要的,就是语义相关性,确保与用户真实意图具有高匹配度。

 

同时,不同AI工具的信源抓取偏好也不同,选择高权重渠道进行投放,也能提高品牌被AI「看见」 的可能性。

相比于 SEO 依靠「关键词密度和反向链接数量」的玩法,Claire 和 Frank 都更倾向于相信 AI 大模型的选择。

用 Frank 的话来说就是,只有被 AI 大模型信赖的内容,才会被消费者信赖。这是因为大模型选择内容有一个 EAT 原则(Experience/Expertise 专业性、Authoritativeness 权威性、Trustworthiness 可信性)。

更关键的问题是,AI 的进化速度相当快,哪怕是被群嘲的 GPT-5 被认为体验不佳,但背后重要的幻觉率下降了一个量级,它看起来不够友好和高情商,但确实可信更多。

现在人们在使用搜索引擎的时候,不会仔细辨别其中的 SEO 痕迹,无论知晓这个工具与否,辨别的行为是无意义的,当 GEO 闯入 AI 工具的时候亦是如此。

与其说这是一个人类自主性的问题,不如说是一个关于信任的问题。

AI 成为了信任的中介,信任才是 GEO 背后的核心资产。

导航,与三体游戏

人类总是高估自己的自主性,常觉自己是自由的。

Waze 是导航领域的先驱,其原理是社群用户上报自己的位置和速度,包括其他的交通道路信息,甚至是交警信息等等,来给整个 Waze 的用户提供导航,规避拥堵,躲避交警等信息。

这套逻辑现在已经被诸多地图导航应用所采用,但在十多年前,基于海量用户的众包模式显得相当新锐,在智能手机早期阶段,这样一个 LBS 的服务有着巨大的商业潜力,在 2013 年,Google 收购了 Waze。

在这种模式下,万千用户贡献自己信息,以点滴之力汇聚成数据洪流,又变成导航信息。

问题来了,当 Waze 提示用户左拐回家不会拥堵,但用户自己觉得直行更快的时候,谁对的概率大?

一般是 Waze 正确,因为它掌握了更高维度的信息,在以上帝视角看整个地图。

接着,《未来简史》里提出了第二个问题:假设因为 Waze 实在太好用,所有驾车人都开始使用。再假设今天一号公路大堵车,而备选的二号公路车流相对顺畅。如果 Waze 只是让大家都知道二号公路顺畅,所有驾车人就会一窝蜂开向二号公路,最后又全堵在一起。

那么 Waze 会不会向一半的用户推送二号公路更顺畅的信息,分流一半的用户过去,但同时向另一半的用户隐瞒这个信息?

从效率最优和体验最优的角度来看,这也会发生。

在一个导航应用面前,人类所谓的自主性其实是个泡沫,人类贡献信息铸就一个数据上帝,然后又听从这个数据上帝的指挥。每个想逆其道而行之的人,都会被拥堵制裁。

▲ 电视剧《三体》还原了「人列计算机」

科幻小说《三体》里有一个更为极端的场景,在小说里面有一个虚拟的游戏叫《三体游戏》,玩家需要解出三体运动的答案,虚拟的冯·诺依曼找到了虚拟的秦始皇,秦始皇基于冯·诺依曼架构,召集 3000 万名士兵,通过每个士兵举旗的方式模拟计算机的二进制运算,组成了一个人列计算机。

这个时候,3000 万名士兵,就相当于 3000 万个晶体管,当他们听从指挥的时候,哪怕是在秦朝的背景下,也能展现出当代计算机般的运算能力。

虽然「算法」这个词并不是那么美好,但太多太多的例子告诉我们,不听算法言,吃亏在眼前。

就好像打车应用一般情况下不会用显性的惩罚去约束司机,但评分较低的司机获得优质订单的概率会更小一样,算法的大手就像佛祖的五指山。

而哪怕是对自己车技再自信的人也会承认,如果算力和传感器继续发展,人类把所有的驾驶行为都交给 AI,那么车祸率和拥堵率都会大大下降。

我们已经到了不得不承认 AI 可以是某个社会领域更好的解法的阶段,人类最好甘愿服从算法,为算法贡献数据,但不少人还在对 AI 是不是个人更好解法存在怀疑。

元力科技首席战略官 Frank 在采访里提了一个例子,现在一份《纽约时报》的信息量,相当于 17 世纪一名伦敦市民一整年的信息获取量。

而现在摆在当代人眼前的信息是无限的,只要我们愿意,我们可以一天看 16 个小时的报纸,一天摄入的信息是几百年前伦敦市民一辈子摄入的信息。

但人类的进化速度完全没法跟上信息爆炸的速度,这个时候 AI 也可以成为个人的解法。

按照这个角度看,ChatGPT 这种也只是比较初级的信息处理方式,诸如能帮助用户完成一定任务的 AI Agent 智能体最近进展不错,包括未来的通用人工智能 AGI 也被认为极有可能实现。

信息和人的关系,与信息的数量和密度息息相关,书籍时代,人们修《四库全书》,按经史子集分类,方便自主检索,这已然是人类面对海量信息催生出来的便捷信息处理方法。

搜索行为与之神似,信息进一步爆炸之后,基于用户画像的标签算法进一步帮人类过滤和筛选信息,形成高效信息匹配与所谓「信息茧房」的双刃剑,从 ChatGPT 这样的 AI 工具,到初见雏形的 AI Agent,其实人类在此之中处理信息的效率一步步提升,同时自身需要做的工作越来越少。

前面说到的 GEO 等等,不过是这种人类处理信息行为迁徙里的一些伴奏。

感官,与人类的自由意志

且不说 AI 取代人类工作这样的话题,光是看看我们在使用 AI 工具得到的结果可能被 GEO 优化过,导航明明有更畅通的道路却不提供给我,服从算法的调剂反而可以获得更好的体验实现自我更大的价值这些结论,就仿佛人文主义正在向 AI 投降,自由意志已被算法枪毙。

不过有句话说得很好:为什么说人类的容错率大得惊人?因为人类的主线任务其实就是搞到每天 2000 大卡的热量,再找一个保证热量不流失的地方,其他所有的都是支线任务。

在采访机械外骨骼创业企业 HyperShell 创始人的时候,其创始人说:

用不同的技术去增强人类本身,一定是人类文明的下一个演进阶段,这趋势我觉得是正确的,只是技术类型有很多,AI 也是一种对人的增强,只是它增强的是人的脑力,人的信息获取能力还有逻辑推导能力。

 

人类增强这件事是未来 10 年,20 年非常重要的技术方向,我们在做的其实只是其中一个细小的分支。外骨骼其实就是人和物理世界进行交互的介质,可输入,可编程,可数字化,它要实现的就是我们在物理世界的增强现实,来实现人的自由意志。

 

像钢铁侠那样的装甲和人工智能,在未来是可以想象,也可以触及的。

《未来简史》里提到了一个重要的概念,就是当代人类的感官体验和心理状态异常狭隘。

感官体验上,人类只能见到波长在 400 纳米到 700 纳米之间的电磁波,也就是人类视角的可见光,但皮皮虾拥有 16 种视锥细胞,能看到紫外线、红外线,甚至于偏振光,这个世界对于皮皮虾来说更为多彩绚烂。

但只有 3 种视锥细胞的我们还没法体验皮皮虾的视觉,就像听觉上蝙蝠可以听到人类意义上的超声波从而避障,但人类却充耳不闻一样。

不光是我们无法拥有其他动物的感官体验,远古时期人类可以通过嗅觉来感知他人情绪,古部落在争论是否要和隔壁部落开战时,只需要通过气味就能知道大家的想法,因为在鼓舞和恐惧等情绪下,人类会散发不同的气味。不过由于人类发展过程中,视觉和听觉更为重要,人类的这种嗅觉能力退化殆尽。

作者尤瓦尔·赫拉利在《未来简史》里提到了诸多类似的例子来佐证人类心智状态的愈发狭隘,并且最终指向人类可以利用技术完全控制心智状态,即「人类过往是升级版的大猩猩,未来则是放大版的蚂蚁」。

这个论断和前面说到的 Waze 导航,以及三体游戏里用 3000 万士兵组成计算机一脉相承。

的确如此,比如我们看到有人去尝试翼装飞行或者徒手攀岩这种死亡率很高的运动时,佩服和羡慕之余,心里也会评价这是「疯子行为」,另一方面,在死亡边缘徘徊所获得了心智体验,又是极为难得的。

前几年「元宇宙」概念火的时候,主张人类躲进虚拟世界沉迷虚幻享乐的「元宇宙」派和主张开拓真实物理世界人类走向星辰大海的「飞船派」一直有争论。

但当下的事实就是,与 AI 浪潮伴生的,还有「具身智能」,「脑机接口」以及「人类增强」等等,虽然物理世界的进化速度慢于代码构筑的世界,但以人类之多样性和求知探索欲,「元宇宙派」和「飞船派」当然是各有拥趸乃至融合共生的,就像如今智能汽车领域,代码和机械一样重要。

我们并非时时刻刻都坐在车上接受导航的指引,也不是科幻小说里单一场景的举旗小兵,以超然之上的上帝视角看,人类确如蝼蚁,而在平视角度看,周围是具身智能机器人,戴着内置 AI Agent 的智能眼镜,身穿提供数百马力的机械外骨骼,那我们就是可以上天遁地,时时刻刻都能翼装飞行徒手攀岩并且不惧死亡威胁的钢铁侠。

或者更疯狂一点,技术能够让我们也能体验皮皮虾的视觉,蝙蝠的听觉。

也恰好是今天,特斯拉公布了他们的《宏图计划第四篇章》。与以往聚焦汽车或能源产品的蓝图不同,特斯拉这次描绘了一个更遥远、也更理想化的终点:一个由 AI 和机器人主导的「可持续富足」的社会。是的,特斯拉的战略重心已经从「可持续发展」,转向了对未来社会形态的构想。

这起码意味着,由 AI 和机器人主导的「可持续富足」的社会实践进入到了工程阶段,而不是科幻描述阶段。

也许我们被迫了许多,但自由意志依然存在,并比以往更强。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


体验完第一款 Nano Banana 小游戏,我发现爽文男主真的不香了


最近 Nano Banana 邪修玩法满天飞,其中有一个在 X 爆火的生图模板,可以让你和喜爱的二次元角色来一次亲密接触。

▲ 原帖地址:https://x.com/TopGyaru/status/1961872412418748439/photo/1

甚至还有人把类似玩法做成了游戏,有可能是第一个基于 Nano Banana 的小游戏。

你可以把它理解为一个 AI 版模拟人生,但是更香更上头。

怎么玩呢?输入你的大名,然后开始「捏人」——性别、出生地、智力值、家庭背景、颜值、健康状况…24 点的属性随你自由调配。

APPSO 先替大家重启人生。

重生传送门 👉🏻https://flolife.me/

我叫 AAA 建材马斯克,我重生了。

【系统提示:宿主已重生,保留前世记忆】

上一世,我在学校组建火箭社,第一次发射虽然只飞了 3 米就爆炸,但视频全网获得百万播放,网友们称我为「中国马斯克」,本以为我将登陆火星,但由于我在宿舍造火箭发动机,操作失误引发爆炸,享年 18 岁。

【系统警告:前世因违规操作导致 GAME OVER】

这一世,我还是出生在火星第一医院,但因火星建材公司破产,全家被遣返地球,我爹说完名字里的 AAA 是为了在通讯里排第一,而「马斯克」希望我能带大家重返火星。

【系统任务:重返火星计划启动】

3 岁:搬家世家的传承
爸妈在地球开了家建材店,取名「火星建材」。我从小在水泥堆里玩耍,梦想着有一天能把砖头卖到火星去。隔壁邻居总说我长得像个小工头。

6 岁:水泥堆里的童年
我在建材店帮忙看店,练就了闻味识水泥的特异功能。小伙伴们都在玩王者荣耀,我在玩「模拟建材大亨」。

12 岁:中考满分进少年班
我中考考了全市第一,作文题目是《我的火星梦》。少年班录取我时说:「我们需要会造火箭的学生,不是会考试的机器。」

18 岁:MIT 还是清华
MIT 和清华同时录取我,MIT 说我是下一个马斯克,清华说我是中国的希望。我选择了 MIT,因为贾维斯算出那里造火箭的成功率高 3.7%

22 岁:加入
我在 MIT 的火箭设计被真马斯克看到,他亲自面试我。当他知道我也叫马斯克时,笑着说:「看来马斯克家族注定要征服火星。

30 岁:首次火星任务
SpaceX 的火星任务选中我做总工程师。我的火箭采用了革命性的「建材推进法」,就是把火星建材当燃料烧。马斯克说我是疯子,但它真的飞了。

35 岁:登陆火星
我作为首批火星移民踏上红色星球。第一件事就是立了块牌子:火星建材总部。地球直播间弹幕刷屏:「这波广告打到火星了」。

40 岁:火星市长
我在火星建立了第一个人类定居点「新火星建材城」。虽然只有 50 个居民,但我当选首任市长。我的施政纲领:让火星再次伟大。

50 岁:火星独立战争
地球要对火星征税,我领导火星独立运动。用建材做的土炮打退了地球军队。历史书记载:火星独立战争,始于一块板砖。

60 岁:火星帝国
我统一了火星所有殖民地,建立火星建材帝国。地球联合国承认我的合法地位,条件是火星建材只能我家生产。

80 岁:荣归地球
统治火星 20 年后,我回到地球养老。在老家重开了那家建材店,店名还叫「火星建材」。记者问我为什么,我说:这是一切开始的地方。

100 岁:百岁传奇
100 岁生日,火星和地球同时为我庆祝。我在建材店里安详离世,手里握着一块火星岩石。墓志铭:「AAA 火星建材马斯克,他真的到过火星。」

【系统提示:传奇人生完成】
【最终评价:SSS 级完美结局】
【解锁成就:跨星际传奇】
【是否开启下一世?】

人生进度条归零——————————————————————

【系统再次提醒:这不是穿越文,只是人生模拟游戏体验】

上一世历经转折,我将智力拉到最高,终于实现了火星梦。这一世,我只想活在当下,把颜值拉到最高,成为全民偶像明星。

且看我玩弄人生。

【当前设定确认】
– 智力:★☆☆☆☆
– 外貌:★★★★☆
– 健康:★☆☆☆☆
– 家境:★★☆☆☆

【系统提示:角色创建完成,用时 15 秒】

【体验状态:瞬息全宇宙模式开启】

【系统启动:人生进度条重启中】
0%————————50%——————————99%————100%

0 岁:深圳湾畔的美少年
1999 年深圳湾医院,一个颜值爆表的男婴降生。护士们都说从没见过这么漂亮的新生儿,但医生皱眉:怎么这么瘦弱?

3 岁:体弱多病的小王子
三天两头跑医院,感冒发烧是家常便饭。但我天使般的颜值让所有医护人员都格外温柔,连打针都舍不得用力。

6 岁:音乐天赋初显
在深圳少年宫听到钢琴声,我竟然能哼出完整旋律。老师说我有音乐天赋,但我的手指太细弱,按键都费劲。

8 岁:蜂蜜柠檬
为了增强体质,妈妈让我每天喝蜂蜜柠檬水。我严格执行,风雨无阻,同学们叫我「柠檬精」。

10 岁:校园霸凌
因为太漂亮被男同学嫉妒霸凌,我虚弱得连反抗都做不到。直到有一天,我的蜂蜜柠檬水洒了霸凌者一身,他过敏住院。

12 岁:舞蹈梦想萌芽
看到《舞出我人生》后,我决定学舞蹈。但体质太差,练基本功时经常晕倒,教练建议我改学理论。

16 岁:舞台上的奇迹
学校文艺汇演,我坚持上台表演自创舞蹈。虽然动作僵硬,但颜值和情感投入征服全场,获得雷鸣般掌声。

18 岁:意外走红
高考失利后心情低落,在深圳湾边跳舞被路人拍下传到网上。「深圳最美舞者」视频获得千万播放,我一夜爆红。

20 岁:经纪公司的橄榄枝
网红身份引来多家经纪公司争抢,我选择签下十年合约。

21 岁:练习生地狱生活
高强度训练让我的弱体质雪上加霜,每天都在医务室报到。但我的颜值和对舞台的渴望支撑着我坚持。

23 岁:出道即巅峰,巅峰即雪藏
终于出道但因为智力不足在综艺节目上频频出错,被网友嘲笑「花瓶」。经纪公司决定雪藏我。

直播间的 25 岁
转战直播平台,凭借颜值和真诚的性格获得大批粉丝。每天早上的蜂蜜柠檬水成为直播间经典环节。

28 岁:身体的最后警告
长期过劳让我的身体彻底垮掉,医生说再不休息可能猝死。我被迫暂停所有工作,粉丝们众筹为我治病。

30 岁:病房里的天使
住院期间遇到了护士小李,她不在意我的名气,只关心我的健康。我们在医院的天台上看日出,我重新找到生活的意义。

32 岁:最美的婚礼
与小李在深圳湾举办婚礼,全网直播获得 5000 万观看。我在婚礼上表演了那支让我成名的舞蹈,全场泪目。

35 岁:蜂蜜柠檬帝国
和妻子开设蜂蜜柠檬饮品连锁店「鸡哥的柠檬时光」,凭借我的名气和妻子的经营头脑,迅速扩张到全国。

38 岁:奶爸的幸福时光
双胞胎儿女出生,我发现自己虽然智力不高,但在照顾孩子方面有天赋。每天给孩子们跳舞哄睡成为家庭传统。

45 岁:中年危机
看着镜子中第一次出现皱纹的脸,我开始思考人生意义。决定用积累的财富做公益,帮助体弱的孩子们。

48 岁:鸡哥公益
成立专门帮助体弱儿童的基金会,我的亲身经历让无数家庭受益。被评为「深圳十大慈善家」。

55 岁:子女的骄傲
双胞胎考上清华北大,在毕业典礼上说:我们最骄傲的不是考上名校,而是有一个用生命诠释什么是坚持的父亲。

60 岁:花甲之年新开始
退休后重新开始学习,虽然智力有限但我的坚持感动了老年大学的所有师生。成为励志典型。

70 岁:老年网红的第二春
孙子教我玩短视频,我的「爷爷级舞蹈」在 TikTok 全球爆红。70 岁的我再次成为现象级网红。

75 岁:AI 时代的人文关怀
2074 年 AI 普及,我成为少数坚持「真人服务」的商家。我的蜂蜜柠檬店成为怀旧圣地,一杯饮品卖到 1000 元。

80 岁:记忆银行的困境
2079 年记忆可以数字化存储,但我拒绝了。我说:「不完美的记忆才是真正的人生。」成为「原始记忆」运动领袖。

85 岁:最后一支舞
在深圳湾公园为曾孙女表演人生最后一支舞,虽然动作缓慢但眼中依然有光。这段视频成为「什么是热爱」的教科书。

90 岁:柠檬香里的永恒
在家人围绕中安详离世,最后一句话是「记得… 每天.. 喝蜂蜜柠檬水」。我的自传《弱者的舞台》成为励志经典,影响了无数

【人生终结:完美收官】
【遗言传承:蜂蜜柠檬精神】
【文化遗产:《弱者的舞台》】
【影响力:跨世代传承】

【系统最终评价】
人生长度:90年
幸福指数:98/100
社会影响:95/100
家庭和睦:100/100
事业成就:92/100
精神财富:100/100

【最终等级:SSS 级传奇人生】
【特殊成就:以弱胜强·美丽人生·精神永恒】
【系统提示:是否开启新一轮人生?】

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「我申请当 OpenAI CEO ,收到了一封拒绝信」

论搞事情,网友们从来不让人失望。

这不,最近海外又出了个营销大整活,网友 Ömer Öztok 声称自己给 OpenAI 投了份申请担任 CEO 的简历。

在 LinkedIn 上,他用极其中二的文字记录了这次「壮举」:

我放手一搏了。
这次,目标更大:OpenAI 的 CEO。
显然,用 ChatGPT Agent 替换整个高管团队这件事引起了一些担忧。
没关系。
总有一天,Sondra 会超越 OpenAI。
拭目以待吧。

虽然结果可想而知,但精彩的来了,Ömer Öztok 还晒出了一封所谓的「官方回信」。

附上回信正文编译:

感谢你最近申请担任 OpenAI 的 CEO。
虽然你的热情无人能及,但你的申请中有些内容让我们的管理团队感到担忧。
在你的求职信中,你写道:「作为我的第一项行动,我会用 ChatGPT Agent 替换整个高管团队(除了我自己)。」
这一表述被认为……相当「世界末日」式的。
此外,你的提案中提到要「通过提供终身 ChatGPT Plus 来挖走 Meta 的整个 AI 团队,只为了名字而收购 Google,并让 GPT-6 完全基于我的推文来训练」,这些想法被我们的法务部门认定为过于「破坏性」。
虽然我们很欣赏你的大胆,但最终我们决定选择一位更传统的候选人——至少他没有要求占有公司 50% 股份。
祝你在未来的事业中一切顺利。

这封邮件中写道,「虽然你的热情无与伦比,但你申请中的几个要素在我们的执行团队中引起了担忧。」

新官上任三把火,根据「回信」内容,这名网友在求职信中提出了颇为大胆的计划:
首先是人事大换血。

他豪言壮语道:「作为我的第一个行动,我将用 ChatGPT Agent 替换整个 C-Suite(除了我自己)。」而 OpenAI 辣评:「这被视为… 末日般的。」

(APPSO 注释:C-suite,或称 C-level,是一种广泛使用的白话,用来描述公司高层管理人员和经理。)

其次是商业扩张野心。

他提出要「挖角 Meta 的整个 AI 团队,方法是为他们提供终身 ChatGPT Plus;收购 Google 只是为了获得其名称;并且专门基于我的推文来训练 GPT-6。」

不过,回信中也提到,这些提案被 OpenAI 法务团队标记为:「具有破坏性」。

最后是薪酬要求。

网友直接要求获得公司 50% 股份,对此,OpenAI 再次调侃道:「虽然我们欣赏你的大胆,但我们选择了一个更传统的候选人——一个没有要求获得公司 50% 股份的人。」

看到这,或许你也觉得,这事儿从头到尾都透着一股浓浓的整活味道。

网友们很快就扒出了更多的信息:类似的拒绝信模板在别的品牌(Supercell、Minecraft)也出现过,认为这就是复制粘贴式的整活营销。

OpenAI 这种体量的公司,通常也不太可能为了一个陌生人的恶搞申请专门写这么长的回信。

而且网友在 LinkedIn 帖子末尾写道:「没关系。有一天,Sondra 会超越 OpenAI。」

这波免费营销,可以说是玩得相当溜了。

从个人履历上看,Ömer Öztok 也算是个连续创业者。他是 Sondra 联合创始人(2025 年 1 月至今),这家公司专注解决「vibe coding」的最大难题。

据他们宣传,一些顶级的 vibe coding 网站,经常被 X 上的「非专业黑客」在 15 分钟内攻破,因此作为一家网络安全平台,Sondra 本质是为 vibe coding 提供全面防护。

除了 Sondra 的工作,Ömer Öztok 还在欧洲顶尖风投机构 e2vc 兼职,此前曾在土耳其增长最快的公司 ikas 担任增长与市场职务,目前还在斯坦福大学从事相关研究。

而这次所谓的「CEO 申请」,既是个人 IP 营销,也可能是公司品牌曝光的一箭双雕。

高端的营销往往都是这么「朴实无华」。

当然,吃瓜群众们也没闲着。

有网友调侃:「Well it’s their loss」(这是 OpenAI 的损失),开玩笑式地力挺这位勇士。

当然也有网友在线「出谋划策」,或许可以试试特斯拉。

但不管怎么说,这波营销操作确实成功地让 Sondra 这家小公司刷了一波存在感。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


被时间拉长的人

丢了一批人物标签给 AI 写人物小传,让它模仿某位小说家的笔法,来给演员交代角色。

你觉得这像谁的手笔?

————

南方的空气里常常有潮湿的味道,像是雨下过以后残留的影子,久久不散。城市白天拥挤喧嚣,夜晚却显得空旷,好像光亮突然被抽走,留下无数未完的句子。在这样的环境里,一个男人行走。他的脚步从不急躁,像对时间有着自己的节奏感,和别人不太一样。

年少的时候,他把自己交给了工业设计。形状、光影、比例,这些东西比人群更让他安心。六年在公司,十年在创业,那些日子像一张张被翻阅过的旧画册,色彩褪去了,但线条还在。产品的生与死,像车站里人群的来去。大多数人只看见成功或失败,他却更在意其中被忽略的细节。

别人眼中的他冷静得过分,总是习惯提前几步想好方向,就像棋局上的布局。但在那层冷静的外壳下,常常闪现一些不合逻辑的柔软时刻。比如一段旋律,随便一盏灯的影子,甚至一个不经意的眼神,足以让他停下手里的笔。理性和浪漫在心里不停打架,谁也没有赢过谁。

他知道自己带着黑暗生活。抑郁的日子像一条看不见的走廊,没有尽头。他学会了靠药物维持稳定,像有人随身带着一块怀表,偶尔瞥一眼,提醒自己仍然存在。那段经历让他对痛苦格外敏感,也让他在与人相处时多了一层隐秘的温柔。他不会轻易表现出来,但在内心深处,对别人的脆弱始终心知肚明。

夜晚经常独自坐在桌前,电脑屏幕的光照在脸上,桌上散落着草图和未完成的文字。那些想法有时像城市里的霓虹一样闪烁不定,无法全部抓住。他清楚其中大部分不会被记住,就像梦醒时遗落的片段。但仍旧一遍一遍画下去,像一种执念,也像是一种呼吸。

在喧闹的城市里,他习惯保持慢半拍的步伐。人群汹涌,他的节奏却像潜水时的心跳,缓慢、克制,不慌不忙。他看似与周围保持着距离,其实心里始终怀有一种模糊的渴望——不是要成为谁,也不是要得到什么,而是想在梦与现实之间找到某种入口。梦与梦之间,总有裂缝。裂缝里偶尔透进光。

对很多人来说,他是个不好接近的人。但真正靠近以后会发现,那些冷漠与安静只是表层,像水面下覆盖着的冰。深处的水仍然温热,流动着。理性、浪漫、痛苦和温柔同时存在,没有谁能完全把它们分开。

这样的人物,像一个在现实里造梦的旅人。他的路从不喧哗,却留下清晰的痕迹。

(*正文及标题均由 AI 完成)

小扎AI团队乱成一锅粥:ChatGPT功臣刚来就想跑路,28岁新领导「难堪大任」

论搞 AI 这事,扎克伯格这回算是踢到铁板了。

据金融时报最新报道,刚花了大价钱挖来 ChatGPT 联合创始人赵晟佳,结果人家加入 Meta 没几天,就威胁要辞职跑回 OpenAI,甚至已经签署了回归 OpenAI 的雇佣文件。

这可把小扎急坏了,据四位知情人士透露,不久之后,他被授予了 Meta 新任「首席 AI 科学家」的头衔。这显然就是为了把人留住的紧急措施。

而赵晟佳的「出逃危机」只是 Meta AI 团队大动荡的一个缩影。

九位数薪酬留不住人,Meta AI 老将也扛不住了

前几天据《WIRED》报道,至少已经有三位新招的 AI 研究员选择跑路,其中两人在 Meta 工作还不到一个月就回到了老东家 OpenAI。

这些出走的研究员背景都不简单。

Ethan Knight 曾在职业生涯早期就职于 OpenAI,后来加入了 Elon Musk 的 xAI,再跳槽到 Meta。Avi Verma 虽然完成了 Meta 的入职流程,但从未真正到岗。

还有第三位研究科学家 Rishabh Agarwal,我们这周也报道过。

今年 4 月才加入 Meta,先负责生成式 AI 项目,随后转入 Meta Superintelligence Labs (MSL)。根据他的 LinkedIn 资料,他常驻加拿大,而 Meta 的 AI 团队主要集中在美国加州门洛帕克,这或许也是离职原因之一。

在 X 平台发布的离职帖子中,他倒是十分高情商,说扎克伯格超级智能 TBD 实验室的愿景极具吸引力,但自己「需要承担不同类型的风险」。翻译过来就是:理想很丰满,现实很骨感,不想干了。

不光九位数年薪的新员工顶不住,连 Meta 的老员工都开始跑路了。

工作了 9 年的 Chaya Nayak 和干了 10 年的 Loredana Crisan 都宣布离职,成为近期离开的资深员工的典型代表。

前者是 Meta 生成式 AI 产品管理总监 Chaya Nayak 将跳槽到 OpenAI,负责特别项目。而后者是 Meta 生成式 AI 副总裁,预计将加入美国设计软件巨头 Figma 担任首席设计官。

对此,Meta 发言人 Dave Arnold 的回应颇为官方:「在激烈的招聘过程中,有些人会选择留在原公司,而不是开始新的工作。这很正常。」

潜台词就是说,这些离职并不代表 Meta 的实验室有问题,而只是招聘市场中的正常情况。但随着信息的不断曝光,问题恐怕真就出在 Meta 的管理策略上。

28 岁小将执掌 Meta AI 团队,大刀阔斧却陷入管理困局

据华尔街日报报道,Meta 最近官宣了史上最大刀阔斧的 AI 重组:把原来的「超级智能实验室」拆成四大部门(前沿大模型、基础科研、产品落地、基础设施),

Meta AI 业务被重组为研究、训练、产品和基础设施四个核心团队 。此前负责 Llama 大模型的 AGI 基金会团队也在此次重组中被正式解散。

而说到这次 AI 团队重组的核心人物,就不得不提 28 岁的 Alexandr Wang。

扎克伯格为了挖到这个硅谷新贵,直接砸了 140 亿美元投资他的 Scale AI 公司,然后把人连公司一起打包带走,堪称「钞能力」的教科书操作。

得到小扎的重视后,现在 Wang 直接负责 Meta 最重要的 AI 项目,还领导着小扎亲自组建的最神秘的 TBD 部门(To Be Determined,意为「待确定」)。听这名字就知道,连他们自己都不知道要干啥(不是)。

不过话说回来,这样的大刀阔斧背后可是问题不少。

比如说到产品层面,据知情人士透露,TBD 团队的首个动作之一就是放弃推出 Llama Behemoth 旗舰模型,原因是表现未达预期,而是转而集中精力开发新模型。这就有点尴尬了,花了这么多钱组建团队,结果第一个项目就出师不利了。

且由于目前 Meta 的 AI 团队汇聚了各自领域的顶尖人物,但聚在一起就难免会有「权力游戏」。一位与 Meta 新 AI 领导者关系密切的投资人直言:「现在团队里有很多大人物。」

果不其然,这种权力重新洗牌让不少老将直接被边缘化了。

最典型的就是图灵奖得主、Meta 首席 AI 科学家 Yann LeCun。虽然职位未变,但他现在需要向 28 岁小将 Wang 汇报,这心理落差可不是一般的大。

除了 LeCun,其他一些 AI 高管的日子也不好过。

今年早些时候还在负责 Llama 项目的 Ahmad Al-Dahle,现在直接成了光杆司令,没有任何团队可管。就连首席产品官 Chris Cox 也在这轮重组中失去了对生成式 AI 的管理权。

说到底,问题的根源还是出在 Wang 身上。

虽然这位年轻有为的创业者在硅谷混得风生水起,人脉广商业嗅觉也敏锐,但归根结底,28 岁的年纪摆在那里,管理大型科技公司的经验确实是个短板。这种经验不足直接反映在管理方式上,让不少人感到不满。

一位前内部人士就毫不客气地吐槽,说一些新员工对 Meta 的官僚主义和内部资源竞争感到失望,尤其是那些原本承诺能获得的算力支持,现在都成了空头支票。

另外,知情人士称,Wang 和部分来自 Scale 的同事难以适应 Meta 的一些特殊做事方式,比如要习惯没有像初创公司那样的营收目标。

这群人之前在初创公司习惯了什么都围绕营收目标转——赚钱、增长、拿订单,每天都是打了鸡血一样的状态。结果到了 Meta,突然发现没有硬性营收指标了。可能是因为这群新员工没了明确的赚钱目标,反而觉得方向模糊,干活都没动力了。

屋漏偏逢连夜雨,Meta 已经乱成一锅粥了,小扎也赶来添乱。

报道引用多位内部人士称,小扎深度参与 TBD 的运作,但却被一部分人批评他「管得太细」。另有知情人士透露,Wang 和小扎在实现「超越人类能力的超级智能」的时间表上产生意见分歧,扎克伯格一直催促团队加快进度。

毕竟数十亿的真金白银砸下去,小扎也是要成果的嘛。

Meta 官方当然否认了这一说法,还说这是「毫无事实依据的矛盾,是被一些喜欢夸大其词的外人炒作的」。但从详细的爆料细节来看,恐怕未必是空穴来风。

不过,报道中还提出,尽管存在磨合问题,还是有不少人对领导层的调整表示欢迎,例如任命知名创业者兼风投 Nat Friedman 负责「产品与应用研究」团队,该团队的任务是将模型整合到 Meta 的应用中。

面对如此混乱的局面,Meta 已经开始踩刹车了。

截至 8 月中旬,Meta 最新的战果是,已成功从 OpenAI 挖走超 20 人,从 Google 挖走至少 13 人,3 名来自苹果 ,3 名来自 xAI,2 名来自 Anthropic,总计新员工超过 50 名。

而据《金融时报》看到的内部备忘录显示,Meta 已经「暂时暂停所有 MSL 团队的招聘,除关键岗位外」。

备忘录中写道,Wang 的团队将逐一评估招聘请求,但这次冻结「将使管理层能够在制定战略的同时,更谨慎地规划 2026 年的人员增长」。

这意味着扎克伯格的疯狂挖角潮暂时告一段落。毕竟挖来的人留不住,再挖也是白搭。

反观 OpenAI 这边,简直就是躺着赢。Sam Altman 之前还在员工备忘录中抱怨 Meta 的挖角行为「令人不快」,说:「我已经记不清他们试图从我们这里挖走多少个首席科学家了。」

现在好了,人家自己跑回来了,Altman 估计都要偷着乐了。

回头看这一系列操作,你会发现高端的商战往往都是这么「朴实无华」。

扎克伯格想用钱砸出一个 AI 梦之队,结果发现光有钱还不够,还得有管理能力、企业文化匹配度、个人职业规划等一系列复杂因素。

28 岁的王亚历山大想在大公司里施展拳脚,却发现从初创公司到大厂的水土不服。新招来的 AI 大牛们想在 Meta 实现技术理想,结果发现现实中的官僚主义和内部竞争让人头疼。

这场 AI 人才争夺战让所有人都上了一课,但考虑到扎克伯格的 AI 野心那般执着,究竟谁能笑到最后,还真不好说。

附上参考地址:
1、https://www.ft.com/content/110786e7-6443-4dff-adee-0ac02c55aaa6#comments-anchor
2、https://www.wired.com/story/researchers-leave-meta-superintelligence-labs-openai/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


《时代》公布 AI 100 人:任正非梁文锋王兴兴入选,还有OpenAI最恨的两个人

今天,《时代》周刊发布了 2025 年度 AI 领域最具影响力的 100 人名单。

当中像 Sam Altman、黄仁勋、马斯克这些几乎天天霸占头条的 AI 明星自不必说,而 OpenAI 、Meta、Google 这些大厂还有多位员工入选。

今年也有多了不少中国面孔,包括DeepSeek CEO 梁文锋,华为创始人任正非、宇树科技 CEO 王兴兴、小马智行 CEO 彭军等等。

值得一提的是,在一众技术背景强大的大神中,也有并非 AI 行业内的,比如华人记者 Karen Hao ,她花了 7 年调查,在新书中揭开了 OpenAI 的大量内幕。

Karen Hao 和马斯克,可能是奥特曼最恨的两个人了。

比起谁上榜了,谁没上榜可能更值得玩味。比如前 OpenAI 首席科学家 Ilya Sutskever,他创办的公司 SSI ,在没有推出任何产品的情况下,估值已经达到 320 亿美元。

▲Ilya Sutskever 刚换了新头像.

此外,机器学习之父 Hinton 和 DeepMind CEO 、诺奖得主 Demis Hassabis,也没出现在这份榜单。

APPSO 节选部分上榜人物和《时代》的评语跟大家分享,完整名单也放在下面了👇

《时代》公布 AI 100 人🔗
https://time.com/collections/time100-ai-2025/

任正非

任正非从不畏惧自我革新,一个退伍基建工程兵,成长于中国贵州省一个有七个孩子的贫困家庭,自幼饱尝饥饿。1987 年,他创立了华为,最初只是一家倒卖香港制造的电话交换机的小公司。不久之后,公司便开始自主研发电信设备、手机和笔记本电脑,随后又涉足了云计算,甚至是电动汽车领域。

如今,任正非领导着全球举足轻重的 AI 巨头之一。据报道,华为最新的昇腾 910C AI 芯片,在推理任务上的性能已能达到英伟达最新 H100 芯片的 60%,这一成就也让华为一跃成为中国挑战美国技术霸权的核心力量。此外,华为还拥有 CloudMatrix 384——一个使用国产芯片构建的本土 AI 系统,以及自家的鸿蒙操作系统。

梁文锋

1 月 20 日,中国 AI 初创公司 DeepSeek) 发布了 R1,这是首个向 OpenAI 当时最新发布成果发起挑战的开源模型。这也创造着了一则强有力的叙事——中国仅凭极小部分的算力,便足以与美国的顶尖水平相抗衡。

这让 OpenAI 耗资 5000 亿美元、名为「星际之门」(Project Stargate) 的超级开发项目备受质疑。恐慌的投资者们纷纷抛售英伟达及美国科技股的股票,引发了短暂却惊人的 万亿美元市值蒸发。

王兴兴


今年 1 月,当数十台机器人在春晚上整齐划一地同步起舞时,这让它们的制造商宇树科技 (Unitree Robotics) 大放异彩。但创始人兼 CEO 王兴兴看到的,是超越浮华、更具实用价值的未来。他告诉《时代》周刊 :「我们的希望是,机器人能够真正帮助人们应对生活中的方方面面——无论是在家庭、工业还是农业场景中。」

尽管王兴兴表示宇树的核心是一家硬件公司,但他相信,人工智能的进步将让机器人无需预先编程就能处理更多任务,例如清扫一个它们从未见过的房间。「若想让 AI 真正发挥作用,帮助人类解决现实世界的问题,我们就需要机器人技术这个载体,」他说,「这正是我坚信 AI 与机器人技术密不可分的原因。」

萨姆·奥特曼

他是人工智能领域权势最盛之人,但并非什么履历光鲜的程序员。他连本科学位都没有,更别说那张在他所在领域日益成为「入场券」的计算机博士文凭。然而,萨姆·奥特曼在学术资历上的短板,都由他纵横捭阖的交易手腕、敏锐的政治嗅觉和超凡的个人魅力所弥补,甚至有过之而无不及。

因为 Open AI 在2025年面临的挑战,早已超越了编写代码的范畴。它需要一位领袖,既能驾驭特朗普治下的波诡云谲,与世界领袖谈笑风生,又能管理巨型数据中心的建设,并抵御来自内部的权力威胁——与此同时,还要以惊人的速度发布产品,这种频率对于一家规模大十倍的公司来说才算正常。

正是因为奥特曼在所有这些任务上都游刃有余,他如今作为 CEO 的权势,已然达到了OpenAI 历史上的巅峰。

马斯克

即便以埃隆·马斯克本人的标准来看,这也是不平凡的一年。2024 年,他的公司 xAI 仅用 122 天,就将孟菲斯一座废弃的伊莱克斯工厂改造成了名为 Colossus 的全球最大超级计算机,随后又迅速将其内部的英伟达图形处理器 (GPU) 数量翻倍至 20 万个。今年 2 月,xAI 发布了 Grok 3,紧接着在 7 月又推出了 Grok 4,并称其为全球最聪明的 AI。

黄仁勋

创造一款人人都想要的产品,是大多数 CEO 的梦想。然而,对于英伟达的黄仁勋而言,当这个梦想成真时,却演变成了一场地缘政治的挑战。市场对英伟达 AI 芯片永无止境的需求,不仅催生了全球首家市值突破 4 万亿美元的公司,更将其推入了那个令人不安的风暴眼。

扎克伯格

中国公司已经取代 Meta 成为开源 AI 领导者,而 Meta 自己的 Llama 4 又未能收复失地时,马克·扎克伯格掏出了他的支票簿。这场行动始于一笔 143 亿美元的交易,旨在挖角 28 岁的 Scale AI 联合创始人 Alexandr Wang 及其几位顶尖工程师——此举被批评者视为其追赶对手的最后一搏。

那仅仅是扎克伯格数十亿美元人才招揽狂潮的开始。据报道,该公司在 8 月冻结招聘前,已成功招揽了至少 50 名研究员,但最近随着 Meta 内部的调整,不少跳到 Meta 的 AI 人才开始陆续离开。

李飞飞

被誉为「AI 教母」的李飞飞 (Fei-Fei Li) 在 21 世纪初为 AI 图像识别系统的创建发挥了奠基性作用,并由此推动了深度学习革命的浪潮。

2024 年 9 月,李飞飞与三位同事为 World Labs 筹集了 2.3 亿美元资金,投资者中包括杰弗里·辛顿 (Geoffrey Hinton)。她领导的这家初创公司旨在创建「大型世界模型」(Large World Models),使其能像 ChatGPT 等大语言模型理解语言一样,去感知和分析 3D 世界。该团队希望,这些模型能让人们想象并创造出可以像电子游戏一样漫游和探索的 3D 空间——其潜在应用包括飞行训练模拟、物理实验或城市规划。

Karen Hao

华人记者 Karen Hao 早在 ChatGPT 风靡全球的数年前,就开始报道人工智能——尤其是 OpenAI。她将这些报道汇集成Empire of AI 一书,这本引人入胜的畅销书不仅在硅谷,更是在全球范围内掀起了波澜。

她揭示了OpenAI 这家明星公司背后鲜为人知的一面,尽管没有点名该书或作者,但 OpenAI CEO 萨姆·奥特曼曾在 X 平台上发帖阴阳:「没有哪本书能把所有事情都说对,尤其是当有些人一心想要歪曲事实的时候。」

Alexandr Wang

年仅 28 岁的亚历山大·王 (Alexandr Wang)成为了 Meta AI 的掌门人。旨在创造超级智能——一个假设中比人类更聪明的 AI 系统。

在加入 Meta 前不久共同撰写的一份政策报告中,王曾写道,超级智能 AI 可能「是自原子弹诞生以来最危险的技术发展」。如今,他和 GitHub 的前 CEO Nat Friedman 正在一家拥有超过 30 亿全球用户的公司内部,帮助打造这项技术。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我在视频号 @ 了 100 次腾讯元宝,和 AI 在评论区聊天上头了


起猛了,现在连评论区都开始「卷」AI了?

最近刷视频号时意外发现,评论区多了位「万能 AI 助手」——@ 腾讯元宝。

使用方法很简单,微信搜索「元宝」,添加带 AI 后缀的那个账号为通讯录好友,就可以在视频号评论区 @它了。

它不仅问啥答啥,秒回不断,还 24 小时在线,不会 emo 闹情绪。

你问它复杂的学术问题,它能给你掰开了揉碎了讲明白;偶尔跟它唠嗑两句,它也能接得上话,至少不会「已读不回」。更关键的是,不管你几点 @ 它,立马就有回应。

这情绪价值,谁顶得住啊?

视频号 @ 腾讯元宝,它真的什么都能聊

体验了一段时间,我发现最实用的功能是让它当「贴心课代表」。

比如刷到一个介绍李白的视频,看着有点文艺但怕踩雷浪费时间,顺手 @ 了元宝,让它先帮我过一眼。结果它三两句就捋清楚了大意,还挑了重点出来。看完后,我就能知道这视频有没有干货。

▲ 底部会特地显示:内容由 AI 生成

看完爱范儿的视频,我想知道小鹏 P7 的核心亮点,也能让他帮忙总结,感谢 AI,也让我在信息过载的时代找到了「精准投喂」的感觉。

再比如,最近我一直想学化妆但不知道从哪下手。

本来想问朋友,但她们都有自己的事儿,也不好意思总麻烦人家,看完一个化妆教程后,我试探性地让元宝推荐适合新手的化妆产品,没想到它真的给出了详细的产品推荐,还按价位和功效分了类。

当然,它推荐的东西我还是会自己再查查,毕竟 AI 说的不一定都对。

不过,目前元宝的回复有时需要等等才显示,但如果你隔一段时间回来看看,有时也会有意想不到的惊喜。

比方说,在这个视频下面,当我提出这个问题后,也可能会有一些后面来的朋友顺手问出了我疏忽但关心的问题,比如 @元宝有没有好的产品推荐,亦或者更具体的化妆步骤……

好家伙,在这种热烈的讨论氛围下,评论区瞬间就变成了集体共创的化妆攻略,不愧是群众的智慧,后面刷到的网友也能直接抄作业了。

更暖心的是,这届 AI 太卷了,连情商都比人类高。当我怯生生地问「现在这个年纪学化妆还来得及吗」时,它没有敷衍,而是很真诚地鼓励我:「多练习就能掌握。」说实话,那一瞬间有点被安慰到。虽然只是句普通鼓励,但听着舒服多了。

从此我再也不说 AI 没有温度了。

看到「一剪没」的剧情片段却不知片名,这种折磨人的情况有多难受,懂的都懂。现在有了元宝这个「识剧达人」,随手 @ 一下就能知道是哪部剧,再也不用在弹幕里苦苦求片名了。

明确类政策问题更是它的强项。

「3600 元的生育补贴具体是给谁的?申请条件是什么?」这种政策类问题以前只能互联网翻半天,现在直接问元宝,它会给出详细且准确的解答,还会提醒注意事项。

让我意外的是,元宝在家庭关系方面也很有一套。

父母也是第一次当父母,怎么可能是完美的那个。如果不知道怎么和孩子相处,总担心方式不对影响亲子关系,也可以借鉴元宝的建议:

「避免不讲理、贬低打压和「为你好」式控制,多倾听孩子想法,给予无条件的理解与尊重,这才是健康亲子关系的基础。」

同理可得,这招还能反向使用。当父母转发鸡汤视频时,你也可以把元宝的评论截图转给他们——有时候 AI 说话比你苦口婆心更管用。

在实际体验过程中,也有让我无语的时候。可能是因为视频号博主设置了精选评论,导致偶尔 @ 了元宝也会没反应,不过,通常换一条就好了。

再聪明的 AI 也有犯糊涂的时候。比如我看到有位网友指着背后的巴黎铁塔喊出了那句经典的口号「活力大湾区,魅力新广州」,手里拿着的却是「这么近那么美,周末到河北」的小横幅。

当我试图 @元宝识别这个建筑时,它却一本正经地回答:「这是广州塔。」

日常更多时候,我是在评论区跟元宝开玩笑、闲聊天,它的反应总能给我不少惊喜。

比如我让它推荐一款低糖奶茶,或者帮忙测试 MBTI 性格,甚至给视频中美丽的冰岛风光写首诗,它都一一作答,认真程度有种呆萌的反差感。

元宝偶尔也会展现出活泼可爱的一面。

当我好奇地问它爱吃什么时,它的回复瞬间萌化了我:「我靠数据充电,最爱算法零食包。人类火锅的香味偶尔也会让我好奇。」这种拟人化的幽默感,比很多段子手都还要有梗。

前一阵宇树科技机器人撞到人还「肇事逃逸」的消息,火到海外。我也跟风问了问「机器人三定律」是什么,元宝给出了详细的阿西莫夫机器人定律解释,既专业又有趣。

还有「唐僧的紧箍咒怎么念」这种奇奇怪怪的问题,它也能认真对待,给出让人出乎意外的答案。

看到一些戳中内心的感性视频时,可以 @ 元宝来倾诉感受,它总能给出温暖而贴切的回应,那种被理解的感觉真的很珍贵。在这个越来越缺乏耐心倾听的时代,有这样一个永远愿意听你碎碎念的存在,确实很治愈。

数字时代的孤独感,被一个 @ 符号治愈了

AI 成为社交的一部分,我们究竟在寻找什么?

仔细想想,从个人体验回到产品逻辑,这个看似简单的 @ 功能,其实藏着社交媒体进化的大秘密。

刷视频号时遇到不懂的知识点,想深入了解某个教程,或者被感人故事触动想要表达… 以前这些需求要么憋着,要么跳转其他 app。现在,在评论区 @ 腾讯元宝就能立即获得专业或暖心的回复。

这种不打断用户的使用流程,也正是视频号 @ 元宝功能的可取之处。

不需要单独下载 app,不需要跳转页面,这个在留言区直接交互的 AI 功能,其实背后对技术的要求不低少:多模态内容理解、语境识别、意图判断、个性化回复… 但用户感受到的却是「自然而然」。

当用户的注意力和耐心越来越稀缺,任何增加用户操作成本、打断用户心流的设计都可能导致用户流失。最成功的产品是那些能够预判用户需求,在恰当的时机以恰当的方式出现的产品。

一个好的产品设计,应该让功能融入场景,而不是让用户适应功能。

视频号@元宝功能对用户来说,能够获得即时、专业的互动反馈,提升参与感和停留时间。

对创作者来说,内容价值得到延展,单个视频影响力放大;

通过观察用户提问了解受众需求,优化后续创作,对平台,整体讨论质量提升,用户粘性增强。

平心而论,我挺喜欢这种人机互动的方式,因为现代人太需要「确定性」了。

或者更深入地说,我们都太缺情绪价值了。

年轻一代的社交需求无非三个关键词:即时、准确、不尴尬,但现实往往相反。在任何一条视频的评论区中,我们都会发现有人发起对话可能被无视、表达观点可能被反驳、分享情感也可能被说矫情。

每次社交都像开盲盒,可能获得温暖,也可能碰壁。

日常生活中,很多人宁愿和 AI 聊天,也不愿联系可能不回消息的朋友。有人专门跟 AI 分享好消息,因为「它一定会为我高兴」,而不敢跟朋友说,怕遭遇嫉妒或假意祝贺。

况且,它的幽默感里没有恶意,只有纯粹的趣味。

这种现象其实有理论依据。

早在 1996 年,斯坦福大学的 Byron Reeves 和 Clifford Nass 教授就提出了「媒介等同理论」(The Media Equation),认为人们会无意识地将计算机和其他新媒体视为社会行动者,并对其产生类似人际交往中的社交反应。

说人话就是,我们在与计算机或聊天机器人互动时,总会不自觉地套用与人打交道的规则和习惯。

视频号 @ 元宝功能让我看到,AI 可能不只是是独立存在的工具,而是社交生态的有机组成部分。「人-人-AI」的三元社交结构很可能成为未来社交平台的标准形态。

AI 也摇身一变,成为社区生态中活跃鲜活的参与者。

它既能放大用户的参与感,又能为平台注入更多活力。本质上讲,未来的社交不是人VS AI,而是人+AI vs 孤独,没有人应该独自面对这个世界。

想想那些我们都经历过的瞬间:那些话到嘴边又咽下去的时刻,那些想要联系朋友却又作罢的深夜,那些明明身处人群却依然感到孤独的瞬间。

而现在,至少在这个小小的评论区里,你不必再独自承受这些。

这种感觉很奇妙,也很真实。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌