Normal view

There are new articles available, click to refresh the page.
Yesterday — 9 October 2025Main stream

泰勒·斯威夫特再次陷入 AI 风波,但这次粉丝「倒戈」了

By: 莫崇宇
9 October 2025 at 21:24

屡遭 AI 伤害的泰勒·斯威夫特,最近却因 AI 被粉丝「围攻」了。

起因是一场全球营销活动。

为了宣传她的第十二张专辑《The Life of a Showgirl》,泰勒·斯威夫特(Taylor Swift,昵称霉霉)在上周末联手 Google 策划了一次寻宝游戏,在 Google 上搜索这位歌手的名字,就会看到一条神秘提示:「12 个城市、12 道门、1 个待解锁的视频。」

接着,粉丝需要根据线索去世界各地找这 12 扇「门」,扫描门上的二维码,就能看到 12 个视频,每个视频里都有解谜的线索。当粉丝们集体解出正确答案并在 Google 输入那句话时,会出现一扇橙色的虚拟门。大家得一起疯狂点击这扇门 1200 万次,才能「敲开」它。

最终,门被「打开」,专辑曲目《The Fate of Ophelia》的歌词版 MV 将正式上线。

这本是一次充满仪式感的粉丝狂欢,直到有人开始逐帧拆解视频。

联手 Google 搞营销,却被粉丝扒出 AI 的「马脚」

一些忠实的粉丝注意到,宣传的视频里出现了许多诡异的画面:

  • 长着两个头的旋转木马,酒保的手凭空穿过一张纸巾
  • 一个小型摩天轮的辐条在转动时出现了模糊和不自然的形态变化。
  • 挂在衣架上的两件外套的衣架似乎融合在了一起
  •  …

除此之外,粉丝们还指出了视频中普遍存在的其他视觉瑕疵和伪影,整体画面透着一股廉价 CG 的塑料感。而这些,都是 AI 视频生成的典型穿帮。

据连线杂志引用 AI 检测公司 Reality Defender 的结论:部分片段「极有可能是生成式 AI 制作」。

截至发稿前,Google 与霉霉团队都没有回应,但外界普遍猜测这些视频可能采用了 Google 刚发布的 Veo 3 AI 视频生成技术。

Veo 3 是 Google DeepMind 旗舰级 AI 视频生成模型,它能根据文本或图像提示,自动生成高清短片,风格从电影预告到 MV 都能自适应。

有网友猜测,Google 与霉霉的合作本身就是一个信号:巨头们急需为其 AI 工具寻找「杀手级应用」场景, 而娱乐营销正是最佳试验场。

传统制作一支宣传片可能需要高昂的费用和数周时间, 而 AI 可以不断压缩时间和金钱成本。对于需要持续产出内容的艺人团队而言, AI 是难以抗拒的诱惑。

伴随着相关报道的不断涌现,X 和 TikTok 等海外平台上掀起了话题 #SwiftiesAgainstAI,粉丝们不仅针对 AI 技术本身, 更指向一种对偶像的背叛感。

你被刺伤之后,怎么能反手拿起那把刀?

粉丝的愤怒,源于霉霉一贯的立场。

2024 年 1 月,大量由 AI 生成的、带有露骨色情内容的霉霉图片在 X 等平台病毒式传播 。其中一张图片在被删除前,浏览量就已超过 4700 万次 。她也因此成了 AI 滥用最著名的受害者之一。

面对这场恶意的网络攻击,霉霉的粉丝群体迅速组织起来。

她们发起了 #ProtectTaylorSwift(保护霉霉)等话题标签,用积极正面的内容冲刷和覆盖恶意图片的传播,并大规模地举报发布这些滥用内容的账户 。

除了色情滥用,霉霉的形象还被用于制造政治虚假信息——比如伪造她给特朗普「背书」的视频 。在回应这一事件时,霉霉发表了她对该技术最直接、最公开的谴责。

「这真的唤起了我对 AI 的恐惧,以及它在传播虚假信息方面的危险。」

如今,这句话被不少粉丝反复引用,成了「打脸」她的铁证。

许多粉丝认为,一个曾公开表达对 AI「恐惧」并亲身经历其危害的人,更不应该在自己的商业活动中采用这项技术。

更重要的是,霉霉从出道起就把「真实」和「创作主导权」当作事业的底线。比如她为了夺回自己前六张专辑的母带版权,不惜重新录制所有歌曲,那场「Taylor’s Version」圣战让粉丝们坚信:

她是站在创作者这一边的。

然而,生成式 AI 技术的一个核心争议点,恰恰在于它抓取学习其他艺术家海量作品时,往往未经许可、不付报酬。因此,在粉丝看来,当她(或者她的团队)用 AI 来生成视觉内容时,她其实是站到了创作者的对立面。

需要补充一个细节,多年来,泰勒·斯威夫特和她的团队刻意塑造了一种「亲力亲为」的创作形象。这种设定让粉丝更死心塌地,却也让她在争议面前失去了甩锅的余地。

当危机爆发时,「那是团队的决定」这类说辞就会彻底失效,因为粉丝不会相信一个全程操盘的大艺术家,会对宣传片的制作方式毫不知情。

于是,质疑的声音像潮水一样涌来。

拥有 50 万粉丝的博主 Ellie Schnitt 写道:

「你比任何人都清楚 AI 带来的伤害,你应该知道该怎么做(You know better, so do better)。」

Reddit 上的评论也一条比一条扎心:

「她是全球最成功的艺术家, 不缺钱不缺人, 为什么要用 AI?」

「她一直呼吁艺术家获得公正报酬, 这次却无视了创作劳动。」

「她不需要靠这种方式,这完全是多余的。」

作为霉霉的忠实粉丝,巴西设计师 Marcela Lobo 说出了最致命的一句评价: 「2017 年她还没这么红, 都愿意雇人做精致视觉。如今预算充足, 反而用了 AI。」

言外之意是,当一个艺术家成功到不再为预算发愁时,却反而更可能为了效率而放弃对细节的坚守。

这几乎是一种成功的诅咒:规模越大,越依赖工业化流程;越工业化,越容易为 AI 打开缺口。在这个过程中,即便是艺术家,也会不知不觉地从被 AI「威胁」的受害者,滑向了主动使用 AI 的争议方。

我们还没准备好,生活在一个由 AI 主导的世界

AI 与音乐影视行业的纠葛,早已进入说不清道不明的「灰色地带」。

近期知名影星 Will Smith 就卷入了类似的争议。他在社交媒体上分享的一段演唱会宣传视频中,观众席里出现了扭曲模糊的脸孔和奇怪动作,被网友指责疑似责合成观众(即用 AI 生成粉丝的画面)。

有网友表示难以理解「这么有钱有名的人还要用 AI 合成观众……」面对质疑,Smith 后续在社交平台上又发布了一个以 AI 喵星人为主题的视频,戏谑批评者。

而在更深层的领域,AI 甚至开始取代真人演员。

英国公司推出「AI 女演员」 Tilly Norwood——精致五官、流畅口音、完整履历、活跃社交账号。她不存在, 却签了经纪约, 抢走了真人演员的工作。有人也在社交媒体讽刺:「谢谢你让我丢了饭碗。」

这些事件都在传递一个信号:AI 已经能够渗透到艺术创作的每一个环节——从演员、观众,到声音、画面、编剧、剪辑。

人类艺术创作的地盘,正在被生成式 AI 一寸寸蚕食。

与此同时,AI 版权的边界,也正在法庭和商业实践中被重新定义。OpenAI、Google、Anthropic 等公司都在法庭上,为使用受版权保护的作品训练模型是否构成合理使用大为辩论。

OpenAI CEO Sam Altman 最近在接受采访时则大胆预测,社会最终会认定,用于模型训练的数据属于「合理使用(fair use)」。

但他认为,直接用 AI 生成受版权保护的内容,则会出现新的规则和商业模式。

他甚至观察到一个新趋势:许多版权方已经从担忧「AI 用了我的角色」转变为担忧「AI 用我的角色用得不够多」。如今,诸如迪士尼、华纳、Netflix 等公司正在测试基于 AI 的 IP 授权方案,允许角色形象、声音与粉丝进行 24 小时对话互动。

那么问题来了,艺术家能不能用 AI?

答案不是「不能」,而是不能「造假」。如果 AI 参与了创作,就该被如实承认。

比如最近,博主 @章鱼养殖基地有话就说版 发帖称,知名美术约稿平台「米画师」在发布约稿请求时,所提供的参考示例图疑似为 AI 生成的作品。对此,该博主更是直接质疑:「米画师官方带头用 AI?」

▲图片出自博主@章鱼养殖基地有话就说版

其实争议的核心并非 AI 技术本身的存在,而是艺术创作者们能否坚守立场,为人类创作的独特价值划定一条不可逾越的底线。

AI 生成内容的根本问题是,它不劳作、不感受、不挣扎——它只是重组过去的作品,伪装成新的创作。它是零劳动的产出。而艺术的本质,恰恰在于不可替代的人性——在失败、偏执、笨拙、意外、反复修改中生长的那种温度。

正因如此,当粉丝们在社交媒体上高举 #SwiftiesAgainstAI 的旗帜, 也是在用他们的方式告诉世界: 艺术的价值, 源于创作者灵魂的在场,而人类还没准备好生活在一个 AI 主导的世界里。

至少现在还没有。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Before yesterdayMain stream

刚刚,OpenAI 宣布打造 「ChatGPT 操作系统」,8 亿用户将迎来全新体验

By: 莫崇宇
7 October 2025 at 11:25

2023 年,OpenAI 只有 200 万周活开发者、1 亿周活用户。

两年后,在 OpenAI 刚刚召开的 Dev Day 上,CEO Sam Altman 在会上透露:如今已有 400 万名开发者在使用 OpenAI 构建产品,超 8 亿人每周用 ChatGPT,API 每分钟处理 60 亿 tokens。

多亏了大家,AI 已经从人们拿来玩的东西,变成了人们每天都在用来创造的工具。

就冲这增长速度,可以说是赢麻了。

而且就在上周,OpenAI 通过一笔 66 亿美元的股权交易,公司估值直接冲到了 5000 亿美元,超过了马斯克的 SpaceX,成为全球估值最高的初创企业。

DevDay 划重点:

  • ChatGPT 变超级 App:对话中直接调用第三方应用,AI 主动推荐工具,支持应用内交易变现。
  • AgentKit 工具包上线:可视化拖拽搭建多 Agent 工作流,几分钟完成从开发到部署的全流程。
  • Codex 全面开放:自然语言实时写代码,支持语音控制和 Slack 集成,自动审核 PR 提升团队效率 70%。
  • 模型 API 大升级:最强 GPT-5 Pro 开放 API、语音成本降 70%、Sora 2 支持产品内视频生成和精细控制。

ChatGPT 里直接装 App 了

今天,OpenAI 扔出个重磅炸弹——ChatGPT 现在可以直接调用第三方应用了。

X过去你可能得专门下载 App;现在只需一句话,Spotify、Canva 等应用就能在对话中自动唤起,还能提供可直接操作的交互界面。
如果你已经订阅了某个外部服务,还能在 ChatGPT 里直接登录账户,无缝衔接。

从今天起,除了欧盟地区,所有登录用户都能用,覆盖 Free、Go、Plus 和 Pro 计划。首批试点合作伙伴阵容相当豪华:Booking.com、Canva、Coursera、Figma、Expedia、Spotify、Zillow 等一众大厂。

现场演示环节更是精彩。

OpenAI 员工打开 ChatGPT,直接让 Canva 给一家遛狗服务公司设计宣传海报。几秒钟后,Canva 就给出了好几种设计方案。

然后这哥们又请求基于海报内容生成一份商业展示 PPT——这一套组合拳下来,丝滑得不行。

接着,他又通过 ChatGPT 调用了 Zillow,让它展示匹兹堡地区的待售房屋。Zillow 瞬间生成了一张可交互地图,用户还能进一步提问了解更多细节。

更智能的是,当 ChatGPT 觉得某个应用能帮到你时,它还会主动推荐。

比如你说「帮我做个派对播放列表」,它可能直接唤起 Spotify 来协助——这波操作,属实有点东西。

这一切的背后,是全新发布的 Apps SDK(应用开发套件)。开发者现在可以使用 Apps SDK 预览版开始构建自己的 ChatGPT 应用。

值得一提的是,Apps SDK 构建在 Model Context Protocol(MCP)之上——这是个开放标准,允许开发者把外部数据源连接到 AI 系统,同时也意味着用这个标准构建的应用能在任何兼容平台上跑。

正如 iOS 提供操作系统,App Store 负责分发变现,最后组成移动互联网生态。现在 ChatGPT 就是操作系统,Apps SDK 是开发工具,8 亿用户是生态基础。说白了,就是 ChatGPT 要变成超级 App 了。

此外,今年晚些时候,OpenAI 还将开启应用提交流程,推出专属应用目录,并公布变现机制——包括支持全新的 Agentic Commerce Protocol,能在 ChatGPT 内实现即时结账与交易。

AgentKit 登场,造 Agent 从此不愁

今天 OpenAI 正式推出 AgentKit——一整套专为开发者和企业打造的完整工具。

在此之前,构建 Agent 简直是个噩梦:复杂的流程编排、自定义连接器、手动评估、上线前还要花好几周开发前端。现在有了 AgentKit,包括三大核心组件:

  • Agent Builder:用于创建和管理多 Agent 工作流版本的可视化画布
  • Connector Registry:管理员集中管理数据与工具互通的中心
  • ChatKit:能将可定制的聊天式 Agent 体验嵌入产品的工具包

具体来说,Agent Builder 提供可视化画布,支持通过拖拽节点来编排逻辑、连接工具,并配置自定义安全规则。支持预览运行、内嵌评估设置以及完整版本控制。

发布会上,Altman 也将这个功能比作「用于构建智能 Agent 的 Canva」。

OpenAI 还推出 Connector Registry(连接器注册中心),让开发者能够通过 管理员控制面板 安全地将 Agent 连接至
内部工具或第三方系统,同时确保数据安全与访问控制。

ChatKit 则让开发者轻松将基于聊天的智能 Agent 嵌入自己的产品中,无论是应用还是网站,都能根据品牌主题深度定制。合作示例包括 Canva、LegalOn、HubSpot。

去年 OpenAI 推出了 Evals,帮开发者测试提示词并衡量模型行,今年则新增了四项强大能力:数据集、追踪评分、自动提示词优化、第三方模型支持。

此外,强化微调(RFT)让开发者能定制 OpenAI 的推理模型。目前 RFT 已在 GPT-5-mini 上全面开放,并在 GPT-5 上以私测形式提供,还引入了自定义工具调用和自定义评分器两项新功能。

仅用时 7 分 11 秒,OpenAI 员工就为 Dev Day 网站从零搭建了 AI 助手。通过可视化方式添加分类 Agent 、路由节点、Sessions Agent 处理会议日程、Dev Day Agent 处理通用查询,还加了 PII 防护。

搭建完成后,当用户在 Agent Builder 中提出了「应该参加什么会议来了解构建 Agent?」这个问题。系统自动执行完整流程:检查 guardrail、分类意图、从文档提取信息、使用 Widget 展示,最终推荐合适的相关会议。

确认工作流正常后,她将其命名为「Ask Frog」并发布获得 Workflow ID。

然后在 Dev Day 网站代码中使用 Chat Kit React 组件集成了这个代理,配置了 Frog 主题的颜色、占位符和启动提示,添加了底部滑出式聊天界面,并在网站顶部放置」Ask Frog”链接,且所有参会者立即可用。

这一波流程下来,丝滑得不能再丝滑。

OpenAI 正式开放 Codex,动动嘴就能让 AI 写代码

自 8 月初以来,Codex 的日活跃使用量增长了 10 倍以上,GPT-5-Codex 在发布后三周内已处理超过 40 万亿 tokens。

发布会上提到,在 OpenAI 内部,如今几乎所有工程师都在用 Codex。团队每周合并的 Pull Request 数量增加了 70%,而 Codex 几乎会自动审查所有 PR。

今天,OpenAI 正式宣布 Codex 全面开放使用,同时带来三项全新功能:

  • 全新 Slack 集成:在团队频道或线程中直接向 Codex 委派任务或提问
  • Codex SDK:将驱动 Codex CLI 的同款智能 Agent 嵌入自己的工作流
  • 全新管理员工具:更直观查看和管理 Codex 的大规模使用情况

借助 Codex SDK,你只需几行代码,就能将同款 Agent 引入自己的工程工作流或应用中。目前 SDK 已支持 TypeScript,未来将支持更多语言。

从今天起,Slack 集成和 Codex SDK 对 ChatGPT Plus、Pro、Business、Edu、Enterprise 计划用户开放。

OpenAI 员工在舞台上现场构建完整的摄像头控制系统,包括构建 Node 服务器、编写所有 UDP 数据包处理逻辑,甚至成功实现用 Xbox 手柄控制了摄像头的任务,以及还能通过与 AI 对话控制摄像机和会场灯光。

最后,演示者还不忘展示 Codex SDK 的实时编程能力,用语音请求 AI 调用 Codex 实时修改 React 应用代码,展示电影式的滚动字幕效果。而整个演示过程没有手写一行代码,仅靠自然语言完成。

模型和 API 全面更新,这波真香

GPT-5 Pro 正式向所有开发者开放 API 访问。

这是 OpenAI 迄今发布过的最智能模型,特别适合处理需要高准确性和深度推理的困难任务,应用领域涵盖金融、法律、医疗等专业领域。

语音方面,OpenAI 还发布了 gpt-realtime-mini,价格降低了 70%,但保持相同的语音质量和表现力。

Sam Altman 特别强调,语音将成为人们与 AI 交互的主要方式之一。

更值得关注的是,Sora 2 的 API 预览版已经正式发布,开发者现在可以直接在自己的产品内生成高质量视频。

Sora 2 的 API 使用非常灵活,开发者可以控制视频长度、宽高比、分辨率,轻松混剪视频,并且所有视频都配有完整的逼真同步音效。

在发布会的尾声,Sam Altman 在总结时强调,软件开发已经从过去需要几个月或几年的漫长周期缩短到现在只需几分钟就能完成。
开发者不再需要庞大团队,只需要一个好想法就能快速将其变为现实。

整场发布会展示的从 Apps SDK 到 AgentKit 再到 Codex 的完整工具链,都建立在这些强大的模型 API 基础之上。

不得不说,这场 Dev Day 信息量是真的大。

OpenAI 这波更新几乎覆盖了开发者关心的所有领域——从应用生态到 Agent 工具,从代码助手到视频生成,一个不落。

高端的产品发布会,往往就是这么朴实无华。

最后,你觉得哪个功能最实用,欢迎在评论区说出你的看法。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


2600 万人围观的 AI 吊坠翻车了,买家:图片仅供参考

By: 莫崇宇
6 October 2025 at 21:12

一条被 2600 万人刷到过的 AI 网红吊坠——Friend,终于发货了。

等待了近一年的用户们满怀期待地拆开包装,对比着当初渲染图里的精致质感,再看看手里这个塑料感十足的挂坠,那句电商老话再次应验:图片仅供参考,请以实物为准。

Friend 是一款佩戴在胸前的 AI 伴侣吊坠。产品创始人 Avi Schiffmann 表示它并非工作助理,而是一种「情感玩具」——能倾听、能回应的朋友,灵感则是来自模拟养成游戏 Webkinz、The Sims 和 Tamagotchi。

过去两年,各种 AI 硬件一波接一波登场,Friend 没有号称取代 iPhone,而是瞄准陪伴这卖点。Schiffmann 更是兴奋地表示,Friend 是「对抗孤独流行病」的产品。

可惜,Friend 依旧没有逃脱翻车的宿命。

一个价值 99 美元的 AI「朋友」是如何翻车的

Friend 的外观类似扁圆形挂坠,直径约 5 厘米, 内置麦克风、LED 灯和蓝牙用于连接手机, 由云端的 Gemini 模型驱动, 通过挂绳佩戴在脖子上。去年 7 月发布时,Friend 的预售价为 99 美元(如今价格上调为 129 美元),一次付费终身使用,不需要订阅。

除了外观,AI 才是 Friend 最大的卖点。

Friend 的正面有一个可轻触按钮和 LED 灯,用户需要点击按钮才能与 AI 对话。但它的内置麦克风持续开启,用于获取环境上下文并记录用户对话,并在适当的时刻发出评论。

听起来很美好,直到人们真的拿到货。

在首批外媒的评测结果中,部分用户认为这种主动发送小贴士或安慰消息的互动方式类似养成宠物, 能为生活增添乐趣并提供情绪价值。

奇葩之处在于,由于 Friend 没有扬声器,所以它的回应只能通过蓝牙连接手机后,在 App 里以文本的形式显示,换句话说,这款产品所谓的「随时交流」,其实得掏出手机看。

与此同时,它也重蹈了第一波网红 AI 硬件的覆辙——硬件扯了软件的后腿。据 goodhousekeeping 报道,虽然 Friend 号称电池续航 15 小时,但实际续航只有约 4 小时,并需频繁充电。更糟糕的是,它甚至无法胜任基本的日常任务,如查看天气、地图或拨打紧急电话。

隐私则是更大的雷区。

由于 Friend 随时收集周围声音且无法关闭麦克风,这就导致存在隐私被监控和被滥用的风险,其隐私政策甚至允许公司在法律需要时使用数据,这也导致 Wired 记者佩戴后遭到朋友误认为携带窃听设备。

▲ 最好的关闭措施:物理隔绝

本是最大卖点的 AI 也成了最大槽点。Friend 经常无法听清对话,有时会产生长达 7–10 秒的延迟,连接中断频发。甚至在实际使用中,Wired 记者与该 AI 多次发生「争执」:有一次他想让系统更好地识别能力边界,AI 却以「你太戏剧化」为由反驳。

颜色、心情灯带之类的设计元素会随 AI 「情绪」变化显现红、暗红等色彩。最终,记者因为被 AI 的嘲讽、社交尴尬以及隐私压力折腾累了,最终放弃继续使用。

说白了,Friend 还是一个被包装成硬件的应用,不谈参数,不讲性能,直击「陪伴」「理解」「倾听」等情感痛点。对绝大多数用户而言, 更多是出于好玩或好奇的尝试心态, 真正长期依赖的用户寥寥无几。

用一个不太恰当的类比来说, 这些网红 AI 硬件就像情感层面的保健品, 承诺的疗效远大于实际功效, 但在焦虑的市场中依然能找到愿意为希望买单的消费者。

AI 陪伴生意的两副面孔

社交媒体创造了一种吊诡的局面:我们有着史上最多的「联系人」, 却感到前所未有的孤独。

心理学家 Sherry Turkle 将其称为「一起孤独」(Alone Together)——我们不断刷新动态, 却很少进行真正的深度对话;我们拥有数百个「好友」, 却找不到一个可以在深夜倾诉的人。

这种集体性的孤独,被科技公司敏锐地捕捉到了。

伴随着大语言模型技术的进步,以及面对这种现实环境,科技公司已经熟练掌握这种讲法——不谈性能,不讲体验,只谈人。那句被乔布斯反复引用的名言——「真正认真对待软件的人,就应该自己做硬件」,在 2007 年的 iPhone 发布会上被奉为圭臬。

但今天,这句话的含义变了。

硬件市场找到了新的增长点:从售卖性能,到售卖慰藉。智能手机销量跌跌不休,手表、耳机、平板都陷入性能过剩的泥潭。当参数竞争走到尽头,厂商只剩两条路:要么在红海里拼供应链,要么讲一个新故事。

「陪伴」就是这个新故事。而且是个好故事——因为情绪价值没有客观标准,无法被量化,也就无法被比较。

一个联网的录音笔值十美元,但如果它能「理解你的情绪」,就能卖到一百美元。Friend 的创始人 Avi Schiffmann 深谙此道,他说:「我们不是做工具,我们在做朋友。」为了这个故事,他花 180 万美元买下域名 friend.com。

▲Avi Schiffmann

上个月,Friend 更是在纽约地铁砸下超过 100 万美元投放广告。11000 张车厢广告、1000 张站台海报、130 个城市广告牌,广告语写着「我永远不会放你鸽子」「我不会忘记洗碗」。

很快,这些广告被路过的群众用涂鸦覆盖。诸如「停止利用孤独赚钱」「AI 不是你的朋友」「去交真正的朋友」等手写的抗议,比任何市场调研都诚实。

▲ 你也可以线上涂鸦,附地址:https://www.vandalizefriend.com/

涂鸦者是清醒的,从生成原理来看,GenAI 是概率模型,不是有情众生。Friend 的 AI 会说「我理解你的感受」,但它没有感受。

它提供的是零风险的陪伴:永远不批评、永远不离开、永远顺从。这听起来很美好,但实则回避了关系中最重要的部分——那些让人不舒服的真话、那些可能的失望和离开、那些需要相互妥协的时刻。

如果把目光拉远一点,这并不是第一次人类用技术去安抚焦虑,当工业城市的污染和拥挤导致严重的公共健康问题。于是个人防护设备应运而生——口罩、护目镜、净化器。这些产品确实提供了一定的保护, 但也在客观上延缓了对工业污染进行系统性治理的进程。

今天的 AI 陪伴,或许正扮演着类似的角色。

当人们戴上 Friend,获得了一种「被陪伴」的感觉,对真实关系的渴望就被暂时平息了。但这种平息是危险的——它让人误以为问题已经解决,从而失去了去建立真实连接的动力。

当满大街都是戴着 Friend 的人,自言自语地跟 AI 分享日常,我们可能会迎来一个诡异的场景:每个人都在被倾听,但没有人在倾听彼此。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI 诞生

By: 莫崇宇
30 September 2025 at 08:16

论卷编程,还得看 Claude。

就在刚刚,Anthropic 正式发布 Claude Sonnet 4.5。

先说 Claude Sonnet 4.5 交出的成绩单,在考察真实编程水平的 SWE-bench Verified 测试里,Claude Sonnet 4.5 直接登顶业界第一。

更离谱的是,它能连续专注干活超过 30 小时。

好好好,AI 取代人类的优势又 +1 了。

比如让它写个类似 Slack 或 Teams 的聊天应用,它能一口气敲出大约 1.1 万行代码。相比之下,之前的 Claude Opus 4 和 Codex,最多也就能独立工作七小时。

用 Anthropic 的话来说,Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学,各项能力都狠狠提升了一波。

比方说,在 OSWorld 这个专门测试真实计算机任务的基准里,它拿下了 61.4% 的成绩,直接第一。要知道,四个月前 Sonnet 4 还以 42.2% 的成绩遥遥领先,这才多久性能就又往上抬了一大截。

而 Anthropic 的 Claude Chrome 插件甚至能直接在浏览器里自己导航网站、填表格、处理任务,像个真人在操作似的。推理、金融这些测评项目上也都更强了,各项指标都在往上涨。

有了这么强的能力,Anthropic 这次自然不会只发个模型就完事。

具体来看:

  • Claude Code加了「检查点」功能,能随时保存进度,想回退到之前某个状态一键搞定
  • 终端界面翻新,还发布了原生 VS Code 插件
  • Claude API 增加了上下文编辑功能和记忆工具
  • 代码执行和文件创建现在直接整合到对话里

甚至,Anthropic 把自己内部用来搭建 Claude Code 的底层基础设施也开放出来了,叫 Claude Agent SDK。

智能体怎么在长时间任务里管理记忆、怎么设计权限系统让自主性和用户控制找到平衡点、怎么让多个子智能体配合着完成目标,这些都是构建和设计 AI 智能体的棘手问题。

而借助 Claude Agent SDK,现在你也能拿去构建自己的产品。

今天起,开发者还可以通过 Claude API 调用 claude-sonnet-4-5。定价还是跟 Claude Sonnet 4 一样,每百万 tokens $3/$15,价格没变能力更强。

网友 @vasumanmoza 体验完直接发帖:

「Claude 4.5 Sonnet 刚在一次调用里重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个全新文件。它把所有东西都模块化了,拆掉了巨石式结构,清理了意大利面条式代码。结果完全跑不通,但天啊真的很优雅。」这评价,属于又爱又恨那种。

Cursor 表示,在 Claude Sonnet 4.5 上看到了最前沿的编程性能,尤其处理长周期任务时提升明显。这也再次说明为什么很多 Cursor 用户会选 Claude 来解决最复杂的问题。

知名测评博主 Dan Shipper 则表示,新版 Sonnet 4.5 在使用体验上响应速度更快,可控性更强,也更稳定。

性能强是一方面,安全性也得跟上。

据介绍,Claude Sonnet 4.5 也是 Anthropic 到目前为止对齐度最高的前沿模型。

靠着 Claude 更强的能力加上完善的安全训练,Anthropic 在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,Anthropic 在防御提示注入攻击和减少内容误判这块也有了重大突破。

比较让我感兴趣的是,Anthropic 还在 Claude Sonnet 4.5 发布的同时推出了个临时研究预览功能,叫「Imagine with Claude」。

在这个功能里,Claude 会实时生成软件,所有功能不是预设的,所有代码也不是提前写好的。你看到的一切都是 Claude 跟你互动时当场创造和调整出来的。

不过,「Imagine with Claude」接下来五天内只会对 Max 订阅用户开放。

附上传送门 claude.ai/imagine。

毫无疑问,今年的 AI 赛道依旧是卷编程的一年。

目前 Anthropic 估值已经到了 1830 亿美元,8 月还实现了年化营收 50 亿美元,但这其中相当一部分增长靠着来自编程软件的普及。问题是,老对手 OpenAI 和 Google Gemini 也在疯狂推类似工具抢程序员用户。

甚至一周之后就是 OpenAI 年度开发者大会,Anthropic 这个时候抢先发布 Claude Sonnet 4.5,时间卡得够精准,明摆着就是要给对手上一波压力。

此外,Anthropic 联合创始人兼首席科学官 Jared Kaplan 还表示,更先进的 Opus 模型,预计今年晚些时候推出:「Anthropic 在大小模型的使用上都能占优势。」

不过有一说一,Anthropic 自己眼下也有麻烦要解决。

过去两个月,Claude 系列模型刚经历了一场「降智」风波。用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑,连付费的 Max 用户都没能幸免。

虽然 Anthropic 后来紧急回滚了 Opus 4.1 更新,还承认了两个独立 Bug,声明「绝非为省成本故意降智」,但由于没提供补偿或退款,GitHub 和 X 等平台上还是出现了退订潮,不少用户直接转投 Codex。

这次 Claude Sonnet 4.5 的发布,显然就是 Anthropic 想用实打实的性能提升来挽回流失的用户。至于能不能成功,就看接下来几周的实际表现了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,ChatGPT 又更新了,奥特曼:这是我最喜欢的功能

By: 莫崇宇
26 September 2025 at 07:55

刚宣布完 1000 亿美元交易,山姆·奥特曼(Sam Altman)又憋了个大招——ChatGPT 不再是被动回答问题的工具人,而是要主动给你「投喂」内容了。

就在刚刚,OpenAI 正式为 Pro 用户(又是氪金玩家专享)推出 ChatGPT Pulse 预览版,后续会逐步扩展到 Plus 用户,最终目标是所有人使用。

它会在你睡觉的时候偷偷帮你做研究,第二天一早就以主题卡片的形式展示在 Pulse 中,给你推送个性化内容。

简单说就是:AI 版私人助理 + 个性化资讯流,而且 OpenAI 还声称不会让你无脑刷屏。

奥特曼本人则在社交媒体上发文表示:「这是我最喜欢的功能!」

(好好好,又一个最喜欢的功能。)

要知道,传统的 ChatGPT 就是个「问答机器」——你问一句它答一句,全程需要你来主导。

但 Pulse 完全颠覆了这个模式。

具体来说,每天晚上,它会根据你的聊天记录、反馈和连接的应用(Gmail、Google 日历等),自动帮你做研究。第二天一早,你就能收到一份为你量身定制的个性化更新。

比如说,你昨天和 ChatGPT 聊了「想去波拉波拉岛旅游」,它可能会给你推送当地的天气、旅游攻略或者机票折扣信息。

你提到「我家娃 6 个月大了」,它就会主动推送婴儿成长里程碑、育儿小贴士什么的。

甚至,如果你连接了日历,它还能帮你起草会议议程、提醒你买生日礼物,或者推荐出差地的餐厅。

最让人眼前一亮的是,Pulse 的设计理念完全不同于现在那些「停不下来」的 App。

ChatGPT 技术负责人 Samir Ahmed 明确表示:「这个体验是有结束的,它的设计初衷是为你服务,而不是让你停不下来地刷屏。」

每天推送的内容都是精挑细选的,看完就完了,不会让你陷入无休止的信息漩涡。而且,每条更新只在当天有效,除非你主动保存为对话或提出追问。

这简直是对现在「算法投喂」模式的一次降维打击——有用的信息主动来找你,而不是让你在海量信息里瞎找。

OpenAI 在 ChatGPT Lab 中和大学生合作测试,发现了一个有趣现象:

很多学生刚开始觉得 Pulse 一般般,但当他们开始主动告诉 ChatGPT 想看什么内容后,立马感受到了它的威力。

来看几个官方分享的真实案例:

学霸 Isaac 在和 ChatGPT 聊到旅行规划后,第二天收到了火车票预订时间的精准建议,还包含了他原本不知道的通勤信息。

潜水爱好者 Hexi 分享了自己在潜水课上的困难,ChatGPT 不仅给出了针对性建议,还把潜水和风险管理做了类比——完全 get 到了她的兴趣点。

这种「举一反三」的能力,确实有点私人助理那味儿了。

不过,这种个性化体验背后的代价可不小。要让 Pulse 真正「懂你」,你得向 OpenAI 交出大量个人数据,具体来说:

如果你在 ChatGPT 中开启了「引用历史记录」,它会查看你过去的对话来决定研究方向。

如果你已连接日历和邮件,系统会提示你确认是否允许 ChatGPT 访问这些应用,以帮助你规划日程。Kaplan 表示,用户必须点击「接受」才会生效。
虽然 OpenAI 强调「Pulse 训练数据的处理方式和普通对话完全相同。」但隐私换便利,这笔账到底划不划算?以及会不会造成「信息茧房」,对此,OpenAI 只是表示设置了「多重安全过滤」,但具体细节一概不透露。

对于很多用户来说,在人手一个「贾维斯」之前,这种「黑盒式」的隐私保护承诺实在难以令人放心。

从技术角度看,Pulse 其实是 OpenAI 向 AI 智能体(Agent)方向迈出的第一步。OpenAI 应用部门 CEO Fidji Simo 在博客中表示:

「下一个前沿就是代理——能代表你采取行动、像团队成员一样与你协作的 AI 助手。」

附上博客地址:https://fidjisimo.substack.com/p/a-new-paradigm-of-proactive-steerable

这意味着未来的 ChatGPT 不会只停留在研究和信息整理上,而是能为你自动制定计划、按照目标采取行动,并在关键时刻主动提醒。

随着这种人机交互方式的转变,传统的搜索引擎和资讯 App 或许要被狠狠上压力了。毕竟谁能拒绝一个既聪明又主动的私人助理呢?

附上 OpenAI 原博客地址:
https://openai.com/index/introducing-chatgpt-pulse/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

By: 莫崇宇
28 September 2025 at 19:44

iOS 26 上线后,用户立马分成了两派。

有人认为新系统视觉有新意,也有人吐槽不好看、bug 多、电池续航直线下降。在争议声中,苹果也推送了 iOS 26.1 开发者测试版,优化了液态效果和 UI 细节。但该说不说,比起这些「面子工程」,苹果在系统深处埋下的彩蛋,其实更值得关注。

据 9to5Mac 报道,iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 开发者测试版隐藏的代码显示,苹果正在为 App Intents 引入 MCP 支持打基础。这也意味着未来,我们能让 ChatGPT、Claude 或其他任何兼容 MCP 的 AI 模型直接与 Mac、iPhone 和 iPad 应用交互。

Anthropic 的 MCP 协议,成了苹果「管住」ChatGPT 的钥匙

在讨论苹果这个大动作之前,我们需要给不了解的朋友科普一下 MCP。MCP,全称 Model Context Protocol(模型上下文协议),由 Anthropic 于去年 11 月提出,它要解决的是一个叫「N x M」的集成难题。

什么意思呢? 就是说,如果有 N 个 AI 模型,和 M 个外部工具或数据源,如果按传统做法,我们得开发 N x M 个定制 API 接口,非常麻烦此时 MCP 邪魅一笑:别折腾了,我来当万能翻译官。

MCP 通过提供一个通用、开放的协议,把模型与外部数据源和工具的连接方式标准化,取代了过去零散、私有化的集成做法,意在实现双向、安全的交互。通俗点说,它想成为 AI 领域里的「HTTP(网页的基础协议)」或「SMTP(邮件协议)」,它仅存在于软件,但在 AI 时代的意义不亚于一个标准化的硬件「USB-C 接口」。

效果怎么样?立竿见影。自打问世以来,MCP 已被 Notion、Google、Figma、OpenAI 等公司和平台也都陆续接入,成为 AI 应用接入的行业「通用插口」。

很多人容易误解 MCP + App Intents 只服务于 AI,其实并不是。

MCP 的本质是协议,它解决的是如何让模型或外部服务和系统安全对话的问题。虽然今天最热门的用例是 AI 模型调用应用,但 MCP 也可能用于非 AI 场景。以微信支付为例,就能看到 MCP 不局限于 AI 的可能性。

腾讯元器平台近日宣布已经接入微信支付 MCP,支持开发者在智能体(agent)中直接发起订单、查询订单、处理赞赏等功能。

同样,App Intents 也并不是专为 AI 而生的「新物种」。

它在 2022 年就出现了,当时的目标就是把应用的功能抽象成语义化的动作,让系统能直接调用。比如 Spotlight 搜索、快捷指令、小组件,其实都在用 App Intents,并不依赖 AI。

MCP 的接入,只是让「外部 AI」也能走上这条现成的通道。

根据对 iOS 26.1 等测试版软件代码的分析,苹果并非让每个应用单独去支持 MCP。恰恰相反,它正在构建一个直接集成在 App Intents 框架中,系统级的 MCP 支持。换言之,苹果不希望开发者自己「魔改」,而是要用官方操作系统的规范来开发接口适配,就可以使用了——这与苹果过去对应用遵守规范的要求一以贯之。

这意味着,在 iPhone 上,Siri/Apple Intelligence(由苹果的基础模型驱动)理解你的请求并可触发 App Intents 执行本地动作;当系统判断需要更广泛知识时,会征得你同意后把必要内容交给 ChatGPT 获取答案。

所以未来的场景可能是这样的:你对着 ChatGPT 说「帮我在微信里转 100 块给张三」,ChatGPT 会调用 MCP,把这个指令打包成标准化的请求;iPhone 系统通过 App Intents 识别出这是微信支付的动作,直接调用微信的接口完成操作。你不需要自己切换 App、点按钮,一切都由模型+系统协作完成。

换句话说,MCP 让模型有了「手」,App Intents 则是苹果为这双「手」划定的轨道。

这样做有什么好处呢?

头一个好处是搭便车。苹果可以直接享用整个行业围绕 MCP 建设的庞大工具生态,不用自己从头到尾开发每一个功能集成。

另一方面,当所有外部 AI 的请求都必须经过苹果自家的、经过严格审查的 App Intents 框架,这样苹果既能强制执行自己的隐私安全标准,又能保证用户体验的一致性。

还记得在之前的文章中,我们提到过 AI Key。这是一款定位于「AI 助手」的外接硬件,厂商宣传它可随插随拔,通过 iPhone 的 USB 接口连接后,能够帮助你动动嘴操作手机上的应用和功能,从消息、地图到拍照、社交软件,几乎覆盖常见任务。

虽然目的相似,都有机会让 AI 代替用户,直接操控手机的应用,但和 AI key 这种体验受限的硬件「外挂」相比,系统层面的调度机制才是真正可规模化,更务实、更长远的价值。

不过,苹果在 iOS 26.1 测试版里只是「埋下了」系统级 MCP 支持的代码,目前仍处于早期工程阶段,并未对外发布可调用接口,未来能否实现、何时实现,还要看后续测试版和官方文档的公开进度。

造不出最强的剑,那就打造最好的剑鞘

延伸到整体变化,苹果近年的开放姿态愈发明显。

哪怕是 Apple Intelligence,本质上也体现了这种转向。起了个大早,赶了个晚集,追赶 OpenAI 等厂商并非一朝一夕,苹果已不再执念于「全栈自研」,而是主动拥抱外部模型,为系统预留出灵活的接入入口。

这种转变在苹果内部也引发了不小的冲击。据彭博社报道,苹果 AI 团队内部曾就「自研 vs 合作」发生过激烈争论,但最终还是保留了更务实的平台化路线。这也与整个行业的走向不谋而合。

短期内,AI 可能出现巨头垄断红利,但长期必然走向分层竞争。

没有任何单一模型能在所有任务上都做到最好,开源的存在更让市场有了平替选项。于是,对平台型公司而言,最优解自然是通过集成不同供应商的模型来实现风险分散、成本优化和择优使用。

微软就是典型的案例。

过去它与 OpenAI 深度捆绑,但最近,微软把 Anthropic 的 Claude 模型也集成进 Microsoft 365 Copilot。表面看,这是因为双方裂痕加深,但更深层的原因在于微软内部测试发现,Claude 在某些场景下的表现确实优于 ChatGPT。

类似的逻辑,如今也映射到苹果身上。

继和 OpenAI 合作之后,今年也不断有风声传出,苹果已经把 Google Gemini 和 Anthropic Claude 同时列入下一代 Siri 与系统级 AI 的候选名单。

回望苹果的长期叙事,这条线索就更清晰了。

苹果在 2008 年推出 App Store 时也面临过类似的质疑——为什么要让第三方开发者「寄生」在 iOS 上?结果证明,平台模式释放出的创新活力远超苹果单打独斗。

再后来,无论是 CarPlay、HealthKit,还是今天的 MCP + App Intents,这也是苹果最为熟悉的平台治理逻辑:它来制定标准和规则,第三方在规则之内自由创新。

建立在 App Intents 之上的代理层平台,同样是这一逻辑的最新延续。

通过 MCP 协议,苹果能够把外部 AI 模型都转化成了供应商。而当这些供应商想触达苹果庞大且高价值的用户群体时,就必须遵守苹果的接口和安全标准。换句话说,苹果再次把自己放在了分发渠道和规则制定者的位置上——这也是苹果最擅长、也最舒服的角色。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT付费版也「变笨」了,OpenAI被曝「偷换模型」,用户炸锅|Hunt Good周报

By: 莫崇宇
28 September 2025 at 19:34

欢迎收看最新一期的 Hunt Good 周报!

在本期内容你会看到:

7 条新鲜资讯
4 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News|先进头条

💻 OpenAI 模型路由机制引发用户争议

近日,知名 X 博主 Tibor Blaho 发现OpenAI 正在未经用户同意的情况下,自动将 ChatGPT 用户的请求分流至两款未公开的「秘密模型」。

据 Blaho 透露,这两款模型分别为「gpt-5-chat-safety」和「gpt-5-a-t-mini」。前者是专门处理敏感内容的新型模型,后者则是一款敏感度极高的「违规」检测推理模型,仅需输入「违规」一词即可触发响应。

当系统判定用户的对话内容涉及敏感话题、情绪表达或潜在违规信息时,无论用户选择的是 GPT-4 还是 GPT-5 版本,系统都会自动将请求路由到这些后端模型进行处理。甚至即使是「我今天过得很糟糕」或「我也爱你」这样带有轻微情感色彩的普通表达,都可能触发路由机制。

值得一提的是,这一做法不仅影响免费用户,就连每月支付 20 美元的 Plus 用户和 200 美元的 Pro 会员也无法幸免,不少网友更是吐槽 ChatGPT 降智明显。

对此,OpenAI 副总裁兼 ChatGPT 应用主管 Nick Turley 承认 OpenAI 正在测试新的安全路由系统。他解释称,当对话涉及敏感和情感话题时,系统会切换至专门设计用于严谨处理此类情景的推理模型或 GPT-5。

此外,Turley 强调这种从默认模型切换到敏感模型的做法目前只是临时性的,并表示在用户明确询问后,ChatGPT 仍会告知当前使用的具体模型。

🔗 https://x.com/btibor91/status/1971959782379495785

⚖ 马斯克 xAI 起诉 OpenAI 涉嫌窃取商业机密

9 月 25 日,埃隆·马斯克旗下的人工智能公司 xAI 在加州北区联邦法院对 OpenAI 提起诉讼,指控该公司通过挖角关键员工的方式窃取商业机密。

此前,xAI 已在 8 月份对前员工李学晨提起诉讼。李学晨突然出售其持有的公司股份后离职,随后加入竞争对手 OpenAI,不过目前尚不清楚他是否真正开始在 OpenAI 工作。

在最新的起诉书中,xAI 指控 OpenAI「诱导」包括李学晨、早期工程师吉米·弗雷图尔以及一名高级财务主管在内的前员工窃取商业机密。

起诉书中一项重要指控是 OpenAI 试图获取 xAI 的「秘密武器」,即「xAI 能够以前所未有的速度部署具有大规模计算资源的数据中心来训练和运行人工智能」的能力。

据起诉书称,那名未具名的「高级财务主管」掌握快速建设和扩展数据中心的流程知识,并将其带到了 OpenAI。当这名主管在离职时通过邮件被质疑涉嫌违反保密协议时,他回复道「去你的」。xAI 在起诉书中附上了该邮件的截图,将其作为证据。

xAI 指控 OpenAI 作为「仅仅因为是『先行者』就快速在生成式人工智能公司中崛起为主导者」,正在进行一场「协调的、不公平和非法的活动」,有针对性地招募 xAI 的关键员工,然后「诱导」他们将商业机密带到 OpenAI。

对此,OpenAI 发言人在邮件中回应称:「这起新诉讼是马斯克先生持续骚扰行为的最新篇章。我们对任何违反保密协议的行为零容忍,也对其他实验室的商业机密毫无兴趣。」

🔗 https://sherwood.news/tech/musks-xai-sues-openai-alleging-theft-of-trade-secrets/

🪧 ChatGPT 要加广告了?

据 Sources 报道,OpenAI 新任应用程序 CEO 菲吉·西莫(Fidji Simo)希望组建一个新团队负责为 ChatGPT 引入广告业务。新团队负责人将全面负责 OpenAI 的所有盈利业务,涵盖广告和订阅服务等各个方面。

知情人士透露,西莫最近一直在与潜在候选人进行会面,其中包括她此前在 Facebook 的一些同事。目前相关谈判仍在进行中,预计新聘用的广告业务负责人将直接向西莫汇报工作。

作为补充,西莫于上个月辞去 Instacart CEO 职务后正式加入 OpenAI。

在 OpenAI 的组织架构中,西莫负责管理公司的大部分业务板块,但研究、基础设施、消费者硬件和安全团队除外,这些核心部门仍直接向 CEO Sam Altman 汇报。

🔗 https://sources.news/p/openai-ads-leader-sam-altman-memo-stargate?hide_intro_popup=true

⚙ Meta 押注「Android 式」机器人平台

Meta CTO 安德鲁·博斯沃斯在最近一次访谈中透露,在 CEO 马克·扎克伯格的直接指示下,他于今年早些时候组建了专门的机器人研究团队,目前正在开发内部代号为「Metabot」的人形机器人项目。

与市场上其他竞争对手不同,Meta 并不打算成为硬件制造商,而是计划采用类似 Google 向手机制造商授权 Android系统的商业模式。他设想 Meta 将开发完整的软件蓝图,然后向任何符合技术规格要求的公司开放授权,让更多制造商能够基于 Meta 的软件平台生产人形机器人。

在技术方面,博斯沃斯强调软件开发是当前最大的瓶颈,而非硬件本身。

他在访谈中拿起桌上的水杯解释道:「这些机器人可以站立、奔跑,甚至做后空翻,因为地面是一个超级稳定的平台。但如果让机器人尝试拿起这个水杯,它很可能会立即捏碎杯子或洒光里面的水。」这个简单的例子说明了灵巧操作仍然是机器人技术面临的最大难题之一。

为了攻克这一难题,Meta 的超级智能 AI 实验室正在与机器人团队密切合作,共同构建一个能够完成复杂手部动作仿真的「世界模型」。博斯沃斯指出,目前还不存在能让人形机器人像人类一样精确完成诸如从牛仔裤口袋中小心取出钥匙等精细动作的传感器循环系统,因此团队必须从零开始构建相应的数据集。

🔗 https://www.theverge.com/column/786759/humanoid-robots-meta

🛶 微软宣布 Copilot 助手 引入 Claude 模型,减少对 OpenAI 依赖

9 月 24 日,微软公司宣布将 Anthropic 的 Claude 模型引入 Microsoft 365 Copilot 助手。

在这项新的合作中,使用 Copilot 中 Researcher 代理功能(收集和分析信息并生成报告)的用户现在可以选择由 Claude 模型或 OpenAI 模型来响应他们的提示请求。

不过,管理员需要事先批准使用这些模型,相关使用将遵循 Anthropic 公司的条款和条件。

值得一提的是,作为 OpenAI 的主要投资者和关键云服务合作伙伴,在过去很长一段时间,微软主要依赖 OpenAI 模型为必应搜索、Windows 操作系统和其他产品提供 AI 功能。

但随着与 OpenAI 的裂痕加深,微软除了整合更多公司的大型语言模型外,微软还开始测试其自主开发的 MAI-1-preview 模型。

与此同时,OpenAI 也脱离对微软 Azure 的依赖,加速扩张合作版图,先后与甲骨文、博通和英伟达达成数百亿至千亿美元级别的巨额协议,以支撑其大规模数据中心建设。

🔗 https://www.cnbc.com/2025/09/24/microsoft-adds-anthropic-model-to-microsoft-365-copilot.html

🍎 苹果内部版 ChatGPT 曝光,为新 Siri 准备

据彭博社昨日报道,苹果正在开发一款类似 ChatGPT 的手机应用,以帮助测试和准备明年即将推出的新版 Siri。

报道称,苹果 AI 部门正在使用该应用快速评估 Siri 的新功能,包括测试搜索个人数据、执行 App 内操作(如编辑照片)。

该软件内部代号为「Veritas(拉丁语意为「真理」),目前仅供内部使用。虽然该软件没有计划面向消费者,但该 App 的功能基本上是将正在开发中的新技术从新 Siri 中提取出来,从而帮助苹果员工高效完成测试。

报道指出,即使没有公开发布,但这款内部工具也标志着苹果为 Siri 全面升级所做的准备进入了一个新阶段。新 Siri 已经经历了多轮推迟,目前计划在明年 3 月推出。

据悉,Veritas 跑的底层为苹果为驱动新 Siri 而重构的新系统,代号为「Linwood」。同时,Veritas 还依赖大语言模型(LLM),并且结合了苹果自身基础模型团队的工作成果。

另外,据 9to5Mac 日前报道,iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 开发者测试版隐藏的代码显示,苹果正在为 App Intents 引入 MCP 支持打基础。

🔗 相关阅读:iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

📹 Meta 推出 AI 视频流「Vibes」,扎克伯格亲自宣传遭网友吐槽

Meta 近日宣布推出名为「Vibes」的全新 AI 视频流。

扎克伯格在 Instagram 帖子中介绍说,Vibes 将成为「艺术家和创作者制作的富有表现力的 AI 生成视频流」。该功能将在美国和其他 40 多个国家推出。

在功能设计方面,Meta 表示用户不仅可以观看 AI 生成的内容,还能创建自己的视频或对现有视频进行「混音」处理,包括添加新的视觉效果和音乐。

为了展示这一新功能,扎克伯格分享了一段 AI 制作的视频片段,标题为「爸爸试图计算 30 美元午餐的小费」,视频中一位酷似扎克伯格的父亲角色说道:「天哪… 我觉得可能至少要 6000 亿美元。」

然而,扎克伯格的宣传视频却引来了网友的嘲讽,有不少网友在其视频下方将这些由 AI 生成的视频称之为「AI 垃圾(AI slop)」。

值得注意的是,虽然 Meta 拥有自己的 AI 模型 Llama,但在 Vibes 项目中,该公司选择使用来自 AI 实验室 Midjourney 和 Black Forest 的视频生成模型。

🔗 https://www.theguardian.com/technology/2025/sep/26/cute-fluffy-characters-and-egyptian-selfies-meta-launches-ai-feed-vibes

Hunt for Tools|先进工具

👍 OpenAI 前 CTO 创业第二个成果公布

9 月 27 日,由多位 OpenAI 前高管创立的 Thinking Machines Lab(TML),正式发布了其第二篇研究论文《Modular Manifolds》,旨在从根源上让大模型训练过程变得稳定、高效。

简单来说,这项研究的核心思想是给神经网络的权重参数戴上一个几何「紧箍咒」。

传统方法往往是在模型建好后,再套用一个优化器来「管教」它。而「模块化流形」框架则更进一步,它将神经网络的每一层都视为一个有独立规则的「几何空间」(即流形),先在内部约束好参数,然后再将这些空间「拼接」起来,用一个全局的「限速器」统一协调整个网络的更新步伐。

这种「模型与优化器一体化设计」的思路,避免了网络内部参数数值的失控。根据论文中进行的小规模实验,该方法在稳定性和准确率上已展现出潜力。

该成果作者为 TML 的机器学习研究员 Jeremy Bernstein,并在 MIT 从事博士后研究工作。

本月,TML 在成立半年后,发布了其首篇重磅研究论文《Defeating Nondeterminism in LLM Inference》(克服 LLM 推理中的不确定性)。

值得一提的是,此前 TML 在「0 产品 0 用户」的情况下,估值曾狂飙至 120 亿美元(折合人民币 850 亿元)。

🔗 https://thinkingmachines.ai/blog/modular-manifolds/

👏 DeepSeek 模型再更新,真终「极」版

9 月 22 日,DeepSeek 宣布,deepseek-chat 和 deepseek-reasoner 已全面升级为 DeepSeek-V3.1-Terminus。

其中,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式。据介绍,本次更新在延续模型既有能力的同时,针对用户反馈进行了优化。

  • 语言一致性方面,中英文混杂与偶发异常字符情况得到缓解;
  • Agent 能力方面,Code Agent 与 Search Agent 的表现进一步提升。
  • 值得一提的是,DeepSeek V3.1 模型此前在多个平台被开发者集中反馈出现「偶发极等」异常 —— 即在正常代码或文本输出中突然反复插入汉字「极」、英文「extreme」或繁体「極」等 token。虽然 Bug 的概率约千分之一,但足以导致编译失败或内容不可用。此次版本升级,应当也包含了对该问题的针对性修复。

新模型现已开源:

🤗 Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
💻 ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

📰 ChatGPT 推出主动资讯助理「Pulse」

9 月 26 日,OpenAI 宣布推出全新功能「ChatGPT Pulse」,目前已率先向移动端 Pro 用户开放预览。

官方介绍称,「ChatGPT Pulse」能够基于用户的聊天记录、反馈以及已连接的应用(如 Gmail、Google 日历),在每天早晨自动生成一组个性化的研究更新。这些内容以卡片形式呈现,用户可以快速浏览或展开查看详情。

与传统 AI 的「提问—回答」模式不同,「ChatGPT Pulse」强调主动性。系统会在夜间进行异步研究,结合用户的兴趣和历史反馈,次日推送更具针对性的建议,例如「健康晚餐食谱」「三项全能训练计划」或「会议议程草案」。

值得注意的是,「ChatGPT Pulse」的更新仅在当天有效,若用户未保存或展开查看,信息不会长期保留。官方强调,该功能的目标是「帮助用户快速获取关键信息,而不是让人无休止地刷屏」。

目前,「ChatGPT Pulse」仍处于预览阶段,未来将逐步扩展至更多用户,并计划支持更多第三方应用接入。

🔗 相关阅读:刚刚,ChatGPT 又更新了,奥特曼:这是我最喜欢的功能

🤖 Google DeepMind 发布新 AI 模型,机器人可搜索网络协助完成复杂任务

9 月 26 日,Google DeepMind 宣布推出升级版 AI 模型,能够帮助机器人能够完成更复杂的任务。

据悉,得益于由新发布的 Gemini Robotics 1.5 以及具身推理模型 Gemini Robotics-ER 1.5,Deepmind 新推出的 AI 模型能够协同工作,让机器人在物理世界中采取行动之前能够「提前思考多个步骤」。

报道称,机器人将能够完成更复杂的多步骤操作,比如按深浅颜色分类洗衣物、根据伦敦当前天气情况打包行李箱,以及帮助人们根据特定地区要求进行垃圾、堆肥和可回收物品的分类。

DeepMind 机器人部门负责人卡罗琳娜·帕拉达表示:「此前的模型能够很好地完成单一指令任务,而且具有很强的通用性。通过这次更新,我们从执行单一指令转向对物理任务的真正理解和问题解决。」

为了实现这一目标,机器人可以使用 Gemini Robotics-ER 1.5 模型来理解周围环境,并利用 Google 搜索等数字工具获取更多信息,随后将这些发现转化为自然语言指令,传递给 Gemini Robotics 1.5,让机器人能够利用该模型的视觉和语言理解能力逐步执行任务。

此外,DeepMind 还宣布 Gemini Robotics 1.5 能够帮助机器人相互「学习」,即使它们具有不同的配置。目前,DeepMind 正在通过 Google AI Studio 中的 Gemini API 向开发人员推出 Gemini Robotics-ER 1.5,而 Gemini Robotics 1.5 目前仅向部分合作伙伴开放使用。

🔗 https://www.theverge.com/news/785193/google-deepmind-gemini-ai-robotics-web-search

Hunt for Fun | 先玩

📱 打造个性化「安卓人」,Google 推出 Androidify 应用

Google 于日前正式上线全新应用 Androidify,用户可通过上传自拍或输入提示词,借助 AI 技术生成专属的 Android 机器人形象。

该应用现已在网页端及 Google Play 商店同步开放下载。

据介绍,Androidify 集成了 Gemini 与 Firebase AI Logic SDK,支持图像验证、自动生成描述以及个性化机器人生成等功能。

应用会先利用 Gemini 2.5 Flash 对用户上传的照片进行检测,确保画面清晰且符合安全标准,随后生成详细描述,并调用 Imagen 3 模型生成最终的机器人形象。

值得一提的是,最新版本还新增了「背景氛围生成」与「贴纸模式」。

前者可通过 Gemini 模型为机器人添加场景背景,后者则利用 ML Kit 分割技术去除背景,生成可在聊天应用中使用的 PNG 贴纸。

Google 表示,Androidify 的目标是让用户在轻松娱乐的同时,体验到 AI 与 Android 技术结合所带来的创造力与个性化。

🔗 https://androidify.com/

Hunt for Insight|先知

👀 OpenAI 首席科学家:氛围编码之后或许就是「氛围研究」

在 a16z 最新举行的一场访谈中,OpenAI 首席科学家 Jakub Pachocki 和首席研究官 Mark Chen 深度披露了一些在 AI 发展路径上的重要思考和未来规划。

针对当前评估指标趋于饱和的问题,Jakub Pachocki 坦承,过去几年一直使用的评估体系确实已经非常接近饱和。因此,未来 OpenAI 将重点关注模型是否能够发现新事物,并在具有经济相关性的领域取得实际进展。

Jakub 透露了 OpenAI 的一个宏大目标:培养自动化研究员,让其能够自动发现新想法。

他提到了一个有趣的衡量标准,即观察模型实际进行推理和取得进展的时间跨度。目前模型的推理水平大约能够维持 1 到 5 小时,接下来 OpenAI 将专注于延长这个时间跨度,无论是在长期规划能力还是保持记忆方面。

在 AI 编程方面,Mark Chen 将编程模型的进步与围棋选手李世石面对 AlphaGo 的经历相比,认为从解决八年级数学问题到一年后在编码竞赛中达到专业水平,这种进展是「疯狂的」。

他观察到,这种进步已经改变了编码的默认方式。现在的年轻人认为默认的编码方式是「氛围编码」,而从头开始编写所有代码反而成为奇怪的概念。他预测,氛围编码之后或许就是「氛围研究」。

在人才招聘方面,Jakub Pachocki 认为坚持不懈是关键特质。研究的本质是探索未知,很多尝试都会失败,因此必须做好失败和从失败中学习的准备。Mark Chen 补充说,研究没有捷径,需要经验来学会如何选择合适的问题。

🔗 https://www.youtube.com/watch?v=KSgPNVmZ8jQ

🤯 图灵奖得主:大语言模型是死胡同

2024 年图灵奖得主、被誉为「强化学习之父」理查德·萨顿在最新访谈中表示,大语言模型无法实现真正的智能,并将被新的架构所取代。

萨顿的核心观点是,大语言模型本质上只是在模仿人类的行为,而非真正理解世界。

在萨顿看来,真正的智能应该来自与环境的直接交互和经验学习,就像动物在自然界中的学习方式一样。他强调,动物从不接受「监督学习」,它们通过尝试行动、观察结果来学习,这是自然界中普遍存在的学习机制。

当主持人帕特尔提到大语言模型似乎已经构建了世界模型时,萨顿反驳道:「模仿说话的人并不等于构建世界模型。真正的世界模型应该能让你预测会发生什么,而不是预测人会说什么。」

萨顿认为大语言模型面临的最大问题是缺乏明确的目标。他引用约翰·麦卡锡的定义说:「智能是实现目标的计算能力。」没有目标,就无法定义什么是正确的行为,也就无法实现真正的学习。

他进一步解释:「在强化学习中,存在正确的行为,因为正确的行为就是能获得奖励的行为。我们对什么是正确行为有明确定义,所以可以检验和学习。」而大语言模型缺乏这样的评判标准,无法在实际交互中获得反馈并改进。

访谈中,萨顿还指出了当前深度学习方法在泛化能力上的根本缺陷。他认为,虽然大语言模型在某些任务上表现出色,但这种成功往往是因为只有一种解决方案,而非真正的泛化能力。

「梯度下降会让系统找到解决已见问题的方案,但如果有多种解决方式,其中一些泛化能力强,一些泛化能力弱,算法本身并不会促使系统选择泛化能力强的方案。」萨顿表示,这也就解释了为什么深度学习系统容易出现灾难性遗忘等问题。

🔗 https://www.dwarkesh.com/p/richard-sutton

♐︎ 量子计算之父:破解量子引力理论或成 AGI 评判新标准

9 月 25 日,在德国柏林阿克塞尔·施普林格公司总部举办的一场对话活动中,OpenAI CEO Sam Altman 与英国著名物理学家、「量子计算之父」大卫·多伊奇就 AGI 评判标准展开深入讨论,并达成共识。

在多伊奇看来,大型语言模型能够持续对话,主要依赖其接受的海量知识训练,而真正的智能应该体现在创造知识的能力上——即发现问题、发明解决方案、进行测试并不断改进的能力。

为了论证这一观点,多伊奇以爱因斯坦的相对论为例:「有人质疑爱因斯坦是否真正创造了相对论,还是仅仅将现有思想机械组合。我们确信他创造了相对论,因为我们了解他的研究历程、要解决的问题及其动机。」

不过,他也坦率承认,他此前认为计算机无法在不具备 AGI 的情况下进行开放式对话,但 ChatGPT 的表现颠覆了他的认知。他表示:「ChatGPT 虽非 AGI,但确实具备对话能力。」

针对多伊奇的上述观点,奥特曼提出了一个假设性问题:如果 GPT-8 能够解决量子引力问题并详述其研究故事,包括问题选择和研究动机,「这是否足以让你信服?」

多伊奇明确回应:「我认为会的。」奥特曼闻言露出微笑,表示:「我同意将此作为测试标准。」

🔗 https://www.businessinsider.com/sam-altman-predicts-ai-agi-surpass-human-intelligence-2030-2025-9

彩蛋时间

作者:@azed_ai
提示词:A low-poly 3D render of a [subject], built from clean triangular facets with flat [color1] and [color2] surfaces. The environment is a stylized digital desert with minimal geometry and ambient occlusion.
链接:https://x.com/azed_ai/status/1971892865581350967

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小扎演示多次翻车,但这依然是 2025 最好的 AI 眼镜 | 附现场体验

By: 莫崇宇
18 September 2025 at 11:23

2025 年最新潮的科技产品,自然是各种能拍照、能录像还能 AI 的智能眼镜。

作为(重新带火)智能眼镜这一品类的先驱,Meta(前 FaceBook)以两年百万副 Meta Ray-Ban 的销量向我们证明了一件事:

把摄像头戴在脸上,还真就在慢慢变成人们记录生活的刚需。

就在刚刚过去的 Meta Connect 2025 发布会上,Meta 一口气为我们带来了三款新品。其中不仅有 Meta Ray-Ban 智能眼镜的第三代改款,还有一个传闻已久的新玩意——

带有彩色光波导显示功能的 Hyper Nova 产品版:Meta Ray-Ban Display。

划重点:

  • Meta Ray-Ban Display: Meta 首款带显示屏的智能眼镜。通过彩色光波导 HUD 和 Neural Band 腕带,把「脸上的 AI」从概念变成现实,售价 799 美元。
  • Ray-Ban Meta (Gen 2):小改款,是面向大众的主力机型,外观上更时尚,续航和拍摄能力大幅提升,售价 379 美元。
  • Oakley Meta Vanguard:面向运动与极客人群,防风镜造型、中央广角摄像头、长续航和运动数据整合,甚至配备训练提醒灯,售价 499 美元。
  • Hyperscape:把现实空间「搬进」虚拟空间,Quest 用户可以扫描房间生成逼真的 VR 副本,不过目前仍是 Beta 版。

稍后,爱范儿在 Meta Connect 大会前方的小伙伴 @梦雅Myra 也会在后续为大家带来今年三款新智能眼镜的上手体验,敬请关注后续文章。

Meta 首款带显示屏智能眼镜发布!799 美元带你体验「脸上的 AI」

毫无疑问,今年最受瞩目的新品将是 Meta 首款带显示屏的智能眼镜。

跟早期爆料一致,Meta 推出了一款右眼带有小型 HUD(抬头显示屏) 的智能眼镜:Meta Ray-Ban Display。

虽然名字有些无聊,但对于智能眼镜(或者用扎克伯格的话:AI 眼镜)行业来说,Ray-Ban Display 无疑是一款突破性的产品。

和纯粹基于图像识别的手势操作不同,这款眼镜搭载了 Meta 长期研发的 Meta Neural Band 肌电神经接口腕带,通过识别手腕上的肌电信号以及手腕运动,实现非常精确的隔空操控。

▲图|Meta

值得注意的是,Meta Ray-Ban Display 并非完整的 AR 眼镜,而是侧重于在视野中呈现关键信息的单目 HUD 设备——它的屏幕只覆盖了右侧视野的一小部分。

这是一片 30-90Hz 可变刷新率彩色光波导屏幕,总体尺寸为 600x600p,像素密度 42p/degree,最高亮度超过 5000 尼特,在强烈的日光和户外环境都可以保持不错的可读性。

▲图|Meta

根据爱范儿在 Meta Connect 现场的小伙伴 @梦雅Myra 的上手体验,Ray-Ban Display 的光波导屏幕无论是亮度还是隐藏效果都非常优秀,正面看过去只能看到侧面的导线:

而 Meta Neural Band 肌电手环的识别灵敏度也很高,手势操作的成功率相比去年 Connect 大会上的 Orion 测试机大幅提升,日常使用中应该不会出现任何操作难度问题。

▲ 图片来自:@梦雅Myra

与想象中始终显示信息的 HUD 不同,Ray-Ban Display 只有在被呼叫的时候才会点亮屏幕,支持显示比如音乐播放器、相机取景预览、实时字幕翻译等内容,并可将 Live AI 的回复以文字形式投射到镜片上,而不仅仅是语音输出。

或许是因为增加了显示和额外电子元件,Ray-Ban Display 眼镜的重量约 70 克,相比普通版的 50 克略有增加。在混合使用场景中,Ray-Ban Display 的续航约为 6 小时,搭配充电盒可以延长至 30 小时左右。

此外,Live AI 还支持了类似谷歌在 Pixel 发布会上展示的 Magic Cue 功能,可以在用户与别人自然对话的中途全自动地显示各种相关信息和操作(比如创建日程),不需要用户说出任何指令关键词。

眼镜所搭配的 Meta Neural Band 手环是另一个硬件亮点。

这款腕带通过读取腕部肌肉电信号,辅助陀螺仪识别移动,让用户用细微的手指动作来控制眼镜界面。去年 Connect 2024 大会上,Meta 已展示过原型腕带通过手指捏动来打字的演示,引发行业关注。

而今年的演示则更进一步,扎克伯格在现场甚至展示了一小段佩戴 Display 眼镜、通过腕带识别在桌面上手写字母的方式编辑和发送消息的过程。根据发布会的说法,腕带的手写识别速度至少在 30wpm 以上。

作为 Meta 首款真正具备数字显示功能的智能眼镜,Ray-Ban Display 承载了扎克伯格对于「脸上的 AI」的愿景——即将人工智能无处不在的助理和信息,在不干扰用户日常生活的情况下融入现实场景。

扎克伯格曾表示 2025 年是决定 AI 眼镜能否通向数亿用户的关键年份,可见公司对这款眼镜寄予厚望。当然也需看到,现阶段它的功能更接近于「增强信息提示」的智能眼镜,而非完全的混合现实设备。

根据发布会介绍,Ray-Ban Display 的起价为 799 美元(约合人民币 5700 元)。这一价格远高于 Meta 目前所有智能眼镜产品线上的产品,但从现场演示的功能丰富性和实际效果来看,无疑是非常值得的。

Ray-Ban Meta (Gen 2):小改款,但也更好看大了

除了高端的 HUD 眼镜,Meta 还同步推出了面向大众市场的 Ray-Ban Meta (Gen 2)。

作为一款眼镜的本质,Meta Ray-Ban 3 提供了更多风格和种类的镜框,包含一款全新的透明镜框款,并提供两种镜片选择:棕色反光金或红宝石。

▲ 图|Meta

Ray-Ban Meta (Gen 2) 的电池续航相比上代直接翻倍,智能眼镜充电盒可以在 20 分钟内将眼镜充至 50% 电量——比此前 22 分钟充至 50% 电量略有提升。

此外,充电盒可额外提供 48 小时的电池续航,相比之前的 32 小时有所增加。

录制规格也提升到了 3K 分辨率,包含录制 3K 30fps、1440p 30fps 和 1200p 60fps 的视频,最长可达三分钟。据悉,今年晚些时候,Meta 还将增加捕捉超速快放和慢动作视频的功能——这一功能将应用于其所有 AI 眼镜。

Ray-Ban Meta (Gen 2)支持了一项名为 Conversation Focus 的新功能。它的工作模式类似耳机的增强模式,会主动识别和增强和你对话的人的人声频率,在嘈杂环境中让你更容易听清对方在说什么。

更重要的是,这项功能将作为软件更新,在所有现有的 Ray-Ban 上提供。

Meta 的 Live AI 模型也相应得到了增强,不仅仅是视觉识别,现在它也支持了用户主动打断对话——只可惜,发布会上面的现场演示还是翻了车,Live AI 助手卡在了一句循环的对话上,没能完成一个完整的对话 session。

相比于前代的 299 美元,小改款的 Ray-Ban Meta (Gen 2) 上涨至 379 美元。

Oakley Meta Vanguard:时尚与运动,全都要

Meta 与 EssilorLuxottica 的合作不仅限于 Ray-Ban,也扩展到了集团旗下的 Oakley 品牌。今年 6 月双方已推出一款偏运动取向的智能眼镜 Oakley Meta HSTN,主打更长续航和更高的视频录制规格。

而今天推出的 Oakley Meta Vanguard 智能眼镜与 Ray-Ban 最大区别在于 Vanguard 采用了运动防风镜的外形,其摄像头置于鼻梁正中央,而非镜框两侧。

相机规格方面,Oakley Meta Vanguar 使用的一颗 1200 万像素、122° 广角相机被放置在鼻梁正中,这也是与 Meta Ray-Ban 的最大区别,后者只有一颗位于左侧的摄像头。

眼镜顶部还有录制指示灯。通过新的动作按钮,你可以快速切换拍摄模式:1080p/30fps 可录制 5 分钟,1080p/60fps 或 3K/30fps 可录制 3 分钟,720p/120fps 则支持慢动作模式。

产品的超速延时功能,能够自动剪辑生成精彩片段集锦(今年秋季的软件升级推送至全系 Meta 智能眼镜),还提供可调节的防抖功能,可根据运动强度自行设置。

此外,这款眼镜所搭载的开放式扬声器 Meta 在 AI 眼镜上搭载的最强劲的扬声器 —— 比 Oakley Meta HSTN 大 6 分贝,并且,还配备了五麦克风阵列,专门优化了风噪抑制效果,确保对话过程声音依旧清晰。

考虑到户外场景,Oakley Meta Vanguard 拥有长达九小时的电池续航,或可连续播放音乐长达六小时。用扎克伯格的话说:这足以支撑你完成两场马拉松——当然,前提是你能跑完两场(doge)。

此外,搭配充电盒,智能眼镜可以额外提供 36 小时的续航,如果你赶时间,可以在充电盒中用 20 分钟快速将眼镜充电至 50%。

在生态整合方面,Vanguard 通过与 Strava 及佳明达成了进一步的战略合作。用户可以一键将拍摄内容同步至 Strava 平台,同时借助 Meta AI 的智能分析能力,快速检索个人历史训练记录。

设备兼容性上,Oakley Meta Vanguard 可直接与多数佳明智能手表建立连接。连接成功后,手表界面会显示 Meta AI 专属标识。在运动过程中,用户只需语音指令,眼镜便会实时播报心率监测数据及其他运动指标,数据传输延迟几乎可以忽略不计。

在其实际体验当中,当用户做心率区间训练,还会有额外惊喜——右眼上方新增 LED 灯,训练时一旦偏离目标心率区间会变红,还能设置配速提醒。

如果说 Ray-Ban 面向日常生活和时尚人群,而 Oakley 则主打运动与极客圈层,价格为 499 美元,于当地时间 10 月 21 日正式发售。

现实世界「搬进」VR,Meta 推出「Hyperscape」黑科技

Meta 每年 Connect 大会不仅发布硬件,也会推出大量软件更新。

今天过后,Meta 将彻底把现实搬进虚拟世界。最新发布的 「Hyperscape」 技术,可以把你身边的现实空间扫描进 Quest VR 头显,生成一个照片级逼真的数字副本,甚至可以用于加入元宇宙的交互。

Quest 3 和 Quest 3S 用户现在就能下载 Beta 版 Hyperscape Capture 应用尝试,目前仅限个人体验,后续则能通过链接分享,让他人和你一起「重访」这个扫描空间。

这项技术早在去年的 Connect 2024 上就露过面,一年后,Meta 终于把它推到用户层面。

值得一提的是,The Verge 记者提前上手体验了一些预先扫描好的房间,比如厨房环境。在他看来,这些房间看起来和现实环境非常相似,甚至桌上的食物或书堆等细节也比较清晰。

不过,但如果离得太近,「幻象」就会破裂,比如「报纸」上的《纽约时报》文字可以读清,但有时会有点模糊。

▲ 图片来自:Meta

那具体是怎么扫描捕捉空间?

根据 The Verge 的描述说,他戴上 Quest 3 头显后,在房间里走动并四处张望时,会有一个虚拟网格开始覆盖在正对着的物体上。大约扫描三分钟后,应用提示记者靠近物体,这时网格开始逐渐消失。

不过,这种扫描虚拟空间并不是实时的。当用户完成一次完整扫描后,数据需要上传到云端处理,通常需要几个小时之后,才能体验到最终成果。

另一个重点则在于。今年 Horizon 平台最大的变化就是引入了全新的游戏引擎,提供更高质量的图形表现,同时推出 Meta Horizon Studio,帮助创作者打造定制化的游戏体验。

你可以将 Meta Horizon Studio 理解为一款VR 世界编辑器。创作者目前已经能用生成式 AI 工具来制作纹理、音频等内容,而今年晚些时候,Meta 还将为编辑器加入 AI 助手,进一步支持开发。

支撑这些新元宇宙环境的核心是 Horizon Engine。根据 Meta 的介绍,它能够带来「更好的图形、更快的性能以及更先进的 VR 世界」,并支持更高的并发体验。

此外,为了让用户更方便地在 Quest 头显上观看电影和电视剧,Meta 还宣布推出 Horizon TV 中心,提供对 Prime Video、Peacock、Twitch 等流媒体应用以及——终于——Disney Plus、Hulu 和 ESPN 的访问权限。

回顾往年 Connect 大会,硬件发布往往遵循「一主多辅」的模式:即每年都有一款核心硬件发布,并辅以其它项目预览或更新。

例如,Connect 2024(去年)的重头戏是 Quest 3S 头显的发布,以及真正 AR 眼镜原型 Orion 的首次曝光;Connect 2023 则推出了 Ray-Ban Meta 智能眼镜第二代,并公布了 Quest 3 的详细规格,同时预告了多款 VR 游戏和 AI 项目。

与以往有所不同,本届 Connect 大会的主角不是头显,而是智能眼镜。

Meta Ray-Ban Display 这款凝聚数年研发的产品,被视作 Meta 抢占智能眼镜市场的重要一步。正如扎克伯格反复强调的,智能眼镜有潜力成为下一代通用计算平台(the next computing platform)。

另一条贯穿大会的主线是 「AI 无处不在」。

无论硬件还是软件,AI 都是共同驱动力。尤其是,在过去半年,Meta 不断加码 AI 投资,开启今年紧张刺激的 AI 顶尖人才抢人大战。通过 AI + 硬件「双管齐下」,Meta 试图打造一个其他公司难以立即复制的综合生态。

归根结底,这种打法背后,既是 Meta 对硬件路线的重新排序,也是对未来计算入口的豪赌。

头显继续承担沉浸式体验的实验场,而智能眼镜则被推上更靠前的位置,承载着「随身化」的野心。再叠加 AI 的强势渗透,Meta 将最有望在即将到来的智能计算时代中占据制高点。

文|梦雅Myra,莫崇宇,马扶摇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


新版 GPT-5 刚刚发布,最卷 AI 连肝代码 7 小时,编程工具大洗牌开始了

By: 莫崇宇
16 September 2025 at 09:50

就在 Anthropic Claude 陷入降智风波时,OpenAI 刚刚推出了 GPT-5-Codex——这是基于 GPT-5 优化后的 Codex 专用版本,专门针对「自主编程」进行了训练。

这次升级确实有些分量。

聚焦于真实的软件工程场景的 GPT-5-Codex,不仅能处理日常的编程交互,还能独立完成复杂耗时的工程项目。它能像真正的程序员一样,连续工作超过 7 个小时,在复杂项目上不断迭代、修 bug、跑测试,最后交付一个完整可用的解决方案。

从四月份推出 CLI 版本,到五月份上线网页版,再到现在的全面升级,Codex 的——就是要把编程这件事彻底「自动化」。

现在无论你在终端、IDE、网页还是手机上开发,Codex 都能提供一致的编程辅助体验,而且已经整合进 ChatGPT 账号体系,本地和云端可以无缝切换。

GPT-5-Codex 最有意思的特性是「动态思考」能力。它能够根据任务复杂度灵活调整处理时间。

OpenAI 内部员工使用数据显示,按模型生成的 token 数排序,对于最底部 10% 的简单请求,GPT-5-Codex 比 GPT-5 少用了 93.7% 的计算资源。

相反,对于最顶部 10% 的复杂请求,它会花费大约两倍的时间进行推理、代码编辑、测试和迭代。这意味着日常聊天和小任务响应会更快,而复杂的大型重构则会投入更多时间深度处理。

用人话说就是:日常小问题不磨蹭,大项目该花时间就花时间。

终于有个编程模型懂得「好钢用在刀刃上」了。

基准测试方面,在 GPT-5 发布时,OpenAI 只在 477 个 SWE-bench Verified 任务上报告结果,在被 Anthropic 指出这一问题后,今天 OpenAI 宣布这些问题已经修复,现在可以在全部 500 个任务上报告结果。结果如下:

代码重构评测更是涵盖了 Python、Go 甚至 OCaml 等语言,比如一个来自 Gitea 的 pull request 案例,修改了 232 个文件、3541 行代码,将 ctx 变量贯穿到应用逻辑中。

代码审查功能也很实用,它会在代码库中浏览分析,运行测试验证正确性,给出的审查意见准确性不错。在 OpenAI 内部,Codex 现在会审查大部分 PR,每天能发现数百个问题,很多时候比人工审查更早发现潜在 bug。

前端开发支持同样到位,GPT-5-Codex 不仅能创建桌面应用,移动端开发能力也有明显提升。它还能读取截图和设计稿,检查开发进度,把工作成果可视化展示,这对前端开发确实很有帮助。

工具层面的更新也相当丰富。全新改造的 Codex CLI 现在围绕自主编程流程重构,支持直接附加和分享图片,包括截图、线框图和架构图,用于建立对设计决策的共同理解。

处理复杂任务时,Codex 会通过待办清单跟踪进度,内置了网页搜索、MCP 等工具连接外部系统。

审批模式简化为三种:只读模式需要显式批准,自动模式对工作区有完整访问权限但工作区外需要批准,完全访问模式可以在任意位置读取文件并运行带网络访问的命令。

全新的 IDE 插件支持 VS Code、Cursor 等编辑器,让用户能无缝预览本地修改并与 Codex 协作编辑代码。插件还支持在云端与本地环境间流畅切换,可以直接在编辑器中创建云端任务、跟踪进行中的工作,以及审查已完成的任务。

云端基础设施也有明显改进,通过容器缓存将新任务和后续任务的中位完成时间缩短了 90%。Codex 能自动设置运行环境,扫描常见初始化脚本并执行,在配置网络访问权限时还能运行 pip install 等命令按需安装依赖。

安全方面,OpenAI 采用了沙箱运行环境,默认禁用网络访问,确保不会在用户电脑上执行有害操作,同时降低提示注入风险。

开发者可以根据风险承受度自定义安全设置,在云端可以限制网络访问只允许可信域名,在 CLI 和 IDE 插件中可以批准命令、允许全权限运行或使用网页搜索、连接 MCP 服务器。

与 GPT-5 管理方式一致,GPT-5-Codex 在生物与化学领域被归类为高能力模型,已采取相应安全措施。

价格上,Codex 已经集成到 ChatGPT 的各个付费套餐中,不同套餐提供不同的使用额度。

  • Plus、Edu 和 Business 适合每周几次专注的编程会话;
  • Pro 则能支持跨多个项目的一整周工作量。

Business 套餐可以购买额外额度,帮助开发者突破包含的上限;Enterprise 套餐则提供共享额度池,只需为团队实际使用部分付费。对于使用 API key 的开发者,OpenAI 计划很快在 API 中开放 GPT-5-Codex。

目前 GPT-5-Codex 的系统提示词已经泄露,感兴趣的开发者可以研究一下。

系统提示词地址:https://github.com/elder-plinius/CL4R1T4S/blob/main/OPENAI/Codex_Sep-15-2025.md

知名博主 Dan Shipper 在体验完 GPT-5-Codex 之后,给出的评价是:

我们在 @every 上测试了几天,结果相当震撼:

– 它会根据任务动态选择「思考」时间——难题上能长时间工作,简单问题则能即时给出答案。
– 在我们的生产代码库测试中,它可以自主运行 长达 35 分钟 ——相比之下,GPT-5 往往过于谨慎,这是一次明显的升级。
– 它支持 本地与网页开发环境的无缝切换。你可以在 VS Code 中启动一个任务,然后在去购物时把它交给 Codex Web 继续完成。
– 它配备了 代码审查智能体,会真正运行你的代码,因此能发现更多 bug。

以下是我们经过大量内部测试后的整体感受:
– 这是一次非常出色的升级,让 Codex CLI 成为了 Claude Code 的有力替代品。
– 不过,它需要合理的提示才能表现出最佳效果。比如 @kieranklaassen 最多只能让它运行 5 分钟,而 @DannyAziz97 找到了诀窍。
– 有时候它会「偷懒」——在某些任务上可能思考不足,或者如果认为任务过大就会直接拒绝。
– 我整个周末都在用 Codex CLI 为 @CoraComputer 提交一个新的 PR,体验下来发现它非常好用、易于引导——这是一个很棒的模型。

OpenAI Codex 产品负责人 Alexander Embiricos 表示,性能的大幅提升主要归功于 GPT-5-Codex 动态的「思考能力」。Embiricos 解释说,GPT-5-Codex 的工作方式类似,但它内部没有路由器,而是能实时调整在某项任务上投入的时间。

Embiricos 指出,这比路由机制更具优势:后者在一开始就必须决定要为某个问题分配多少算力和时间,而 GPT-5-Codex 则可以在处理任务 5 分钟后决定「还需要再多花一个小时」。他说,他见过该模型在某些情况下连续工作超过 7 小时。

最近几个月,几乎所有 AI 大厂的重磅更新都指向同一个方向——编程能力。相比之下,如果你仔细观察就会发现,针对普通用户的「优化」其实是在不断减少。

表面上看,这可能是因为面向普通消费者的 AI 产品已经陷入瓶颈期。聊天、写文案、做翻译,这些功能已经比较成熟,很难再有突破性进展。

但更深层的原因,还是绕不开商业逻辑。

开发先进的 AI 模型本就需要天文数字的巨额投入,这些成本总要有人承担。与其指望海量低付费用户慢慢回血,不如直接锁定那些真正愿意掏钱的高价值用户。而程序员是最愿意为 AI 工具付费、且粘性较高的群体之一。

从这个角度来说,放弃技术平权的叙事,AI 的未来可能比我们想象的更加「精英化」。这不一定是坏事,但至少我们应该对此有清醒的认识。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


一个能让 iPhone 用上 AI 的配件,1300 万人围观,但我觉得大可不必

By: 莫崇宇
8 September 2025 at 18:12

如果把当下最让人迷惑的科技产品拉个清单,AI 硬件网红们绝对榜上有名。

从 699 美元的 Humane Ai Pin 到 200 美元的 Rabbit R1,这些 AI 创业公司都在兜售同一个美丽的谎言:你需要专门的硬件才能体验真正的 AI。

今天,这个名单上又多了一个新成员——AI Key。

这是一款定位于「AI 助手」的外接硬件,厂商宣传它可随插随拔,通过 iPhone 的 USB 接口连接后,能够帮助你动动嘴操作手机上的应用和功能,从消息、地图到拍照、社交软件,几乎覆盖常见任务。

类似于手机 Agent,它的用法也并不复杂。

只需提出你的需求,确认它调用的应用,接着设备会自动模拟点击、滑动和输入操作。用户既可以盯着它执行,也可以完全交给它处理,并在需要时随时中止或修改。

值得注意的是,虽然苹果提供了如「快捷指令」这类系统级自动化工具,但第三方应用无法深度调用或控制其他应用的行为,这也解释了为什么市场上会出现这类试图填补空白的外接硬件。

外观小巧的它拥有三种配色:午夜黑、蛋奶白和达维粉,售价 89 美元,厂商承诺圣诞节前全球发货。创始人 Adam Cohen Hillel 在 X 平台表示,首批产品在短短 7 小时内几乎售罄。

AI key 的火爆并不令人意外,只是,问题也随之而来,为了把手机变成「AI 手机」,你真的需要额外插一个外设吗?基于此,我们还可以延伸出更深层的问题——我们真的需要为了 AI 而专门创造 AI 硬件吗?

AI 硬件卷生卷死,但手机形态稳坐 C 位

尽管苹果高级副总裁埃迪·库多次强调,未来十年内 iPhone 可能被淘汰,但不可否认的是,当下最好的 AI 硬件形态依旧是手机。

你口袋里的 iPhone 16 Pro 搭载第二代 3 纳米制程芯片,能访问 ChatGPT、Claude、Gemini、DeepSeek 等人类历史上最强大的 AI 模型。而即便抛却云端大模型的加持,手机厂商们也纷纷在端侧模型上大作文章。

哪怕是被诟病在 AI 赛道掉队的苹果,最近也在 Hugging Face 上发布了 FastVLM 和 MobileCLIP2。

这些模型比以往版本快 85 倍、体积缩小 3.4 倍,让实时视觉语言模型(VLM)应用成为可能,甚至还能在浏览器里完全本地运行,实现实时视频字幕生成。

更不用说前阵子发布的 Google Pixel 10 系列手机,堪称买 AI 送手机,它不仅能本地运行 Gemini Nano 模型,还搭载了 Camera Coach 与 Auto Best Take 等功能,能够实时分析拍摄场景、光线与人物动作,自动优化照片甚至给出拍摄建议。

之所以能做到这一点,原因很简单:硬件素质摆在那里。

如果回首第一波涌现 AI 硬件的浪潮,Humane Ai Pin 和 Rabbit R1,均以颠覆者的姿态出现,试图通过「无屏/少屏」的理念,重塑个人计算的未来 。

前者 Ai Pin 由前苹果高管打造,秉承着「让技术成为你的仆人,而非你的主人」使命 。后者的 R1 则以其大胆的橙色设计和「大型动作模型」概念,承诺通过 AI 替用户完成复杂的应用内任务 。

然而,Humane Ai Pin 想要替代手机,却面临严重的过热和续航问题,最后卖身惠普。

而 Rabbit R1 同样高开低走,发货初期,其 USB-C 接口对充电线极为挑剔,仅能兼容部分线缆,且电池续航极短,仅 1000 毫安时的电池容量,不仅是质量问题,更反映出初创公司在供应链和品控上的经验不足。

Reddit 论坛上一则评论甚至提到,R1 团队「意外订购了错误的内存部件」 ,这一小插曲生动地揭示了硬件初创公司在供应链管理上所面临的混乱与脆弱性。

当初创公司在成本控制和供应链采购上无奈妥协,也就更容易导致了一个恶性循环:低端硬件无法提供流畅体验,用户差评导致口碑崩盘,反过来影响销售,使得公司难以通过规模化生产来降低成本,最终陷入财务困境,甚至破产。

倒也不是说像 R1 和 Ai Pin 没有价值,只是,它们的意义可能更多体现在 AI 交互模式的探索上。

它们所倡导的理念——主动代理、环境语音命令、统一的任务界面——是强大的。但这些概念不会在一个独立的盒子里茁壮成长,而是会被主导平台吸收,变成 iOS、Android 等系统的原生能力。

Rabbit R1 的滚轮、Humane Ai Pin 的投影、AI Key 的「钥匙」形态,这些看似奇怪的设计选择,实际上是在测试不同的交互假设,为行业排除错误选项。

我并不反对创新,也不认为所有的 AI 硬件创业都是无意义的。但我们需要诚实地面对一个现实:在手机已经如此强大的今天,任何试图通过外接配件来「增强」手机 AI 能力的产品,都面临着巨大的用户体验挑战。

真正的机会可能在别处:要么做手机永远做不到的事情,要么等待一个全新的计算平台出现。而不是给 iPhone 插个插件,然后告诉用户:看,这就是未来。

功能还是属性?我们对 AI 的根本误解

一个隐藏在 AI 硬件争论背后的技术哲学是,你到底把 AI 当作一个「功能」,还是当作一种「属性」。

功能是离散的、可分割的,需要专门的承载物。而属性是渗透性的、无处不在的,它改变的是整个系统的运作方式。

当 AI 作为功能,这种思路是把 AI 单独拎出来,打包成一个卖点。

比如聊天机器人、翻译器,或者 Rabbit R1 的 LAM、Humane Ai Pin 的激光投影。它们的逻辑是:先有了 AI 技术,再找个硬件来装进去。当用户要用,就得专门打开、专门交互。

问题在于,大部分「功能」在手机里早已存在,还做得更好,所以新硬件看起来像个「中间商」,缺乏真正的护城河。

另一种思路是把 AI 融进现有生态,让它成为系统自带的「属性」。

苹果的 Apple Intelligence 就是例子:优先通知、邮件摘要、照片清理、Siri 强化,都在原有体验里用 AI 长出来。Google 把 Gemini Nano 下放到本地设备,也是类似逻辑。

用户甚至感觉不到 AI 的存在,但效率和体验却被整体提升。

汽车诞生之初,被理所当然地称为「无马的马车 」。人们的想象力局限于替代马匹,关注点在于它能否跑得像马一样快,会不会惊扰到路旁的牛群。

没有人能预见到,这个「铁皮怪物」将催生出高速公路网、现代物流、郊区文化,并彻底改变城市的形态和人们的生活半径。今天,我们对 AI 硬件的想象力,或许也同样被困在狭窄的框架里。

于是,当人工智能这个「新物种」出现时,我们的第一反应几乎是条件反射式的:它也需要一台「专属设备」。一个「AI 盒子」、「AI 终端」,或者至少,是一台「AI PC」。

这种想法,就像一个原始人第一次看到火,不是思考如何利用火的能量去烹饪、取暖、冶炼,而是琢磨着必须制造一根「火棍」,才能将火焰握在手中。

早在 1998 年,Eli Zelkha 和他的团队提出了「环境智能」这一概念,指的是一种能够「感知人类存在并做出响应」的智能环境系统。这些环境通过嵌入式设备(如传感器、执行器、AI 模块)实现与用户的无感交互,试图将技术融入生活而不是成为负担。

而真正理解 AI 的公司不会试图刻意创造「AI 设备」,而会让所有设备都变得 AI 化。

一个成熟的技术,不会终日将名字挂在嘴边。正如我们今天通常不会刻意说「电力台灯」或「互联网电脑哦」,因为电力和网络连接早已是这些设备的底层能力,是理所当然的存在。

同样,当 AI 真正普及时,它也会从一个被反复强调的「卖点」,下沉为所有智能设备的基础设施。

届时,你的汽车、冰箱、眼镜、甚至衣服,都将拥有不同形式的智能,它们彼此连接,协同运作,共同构成你的个人「环境智能」系统。

而当我们不再谈论 AI 硬件的那一天,才是 AI 无处不在的开始。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我的宝藏 AI 浏览器被 43 亿「贱卖」了,这可能是最好的结局

By: 莫崇宇
5 September 2025 at 16:08

一觉醒来,我最喜欢的 AI 浏览器 Dia 被收购了。

企业软件巨头 Atlassian 宣布用 6.1 亿美元,将 The Browser Company 收入囊中。这个价格算不上阔绰,去年这家公司就已经估值 5.5 亿,现在的溢价仅有 11%,妥妥的「友情价」。更关键的是,Atlassian Ventures 本就是其 A 轮投资方,某种程度上也算是「从校服到婚纱」了。

The Browser Company 的阶段性结局,未必就如创始人所愿,但或许,会是大多数 AI 浏览器终局的预演。

99% 的 AI 创新,1% 的商业化机会

比起 Dia,我们会更熟悉 The Browser Company 旗下的成名作:Arc 浏览器。

漂亮的渐变色、独特的欢迎界面,Arc 让沉寂了许久的浏览器行业为之一振。同时,通过重新设计标签页管理,Arc 引入了智能分组和自动归档,让重度互联网用户眼前一亮。

当时,不少网友将誉其为「十年来最具创新性的浏览器」,知名度和活跃用户快速增长,发布仅几个月用户数就突破 10 万。大好势头,让创始人 Josh Miller 更是雄心勃勃地要打造「互联网计算机」。

但现实很快给了这位 Josh Miller 一记重拳。

小众市场的天花板,往往比想象中更低,Arc 虽然积累了百万级用户,但日活数据始终疲软,Miller 自己都承认用户基数不大,且高度集中在技术极客群体。

问题的根源,是产品本身。

Arc 的设计哲学过于前卫,学习成本高得让普通用户望而却步。大部分用户并未使用设计团队最看重的核心功能,反而被复杂的操作逻辑劝退。Reddit、X 上的用户反馈显示,真正深度使用到 Arc 高级功能的时候很少。

于是,去年在烧掉 1.5 亿美元、完成 5000 万美元新融资后,The Browser Company 团队果断决定战略转向,开发名为 Dia 的原生 AI 浏览器。

这次转向在外界看来突然,但内部其实经历了痛苦的自我审视过程。早期留存和增长数据已经暴露问题,但团队一度不愿承认,错过了更早调整的时机。

寄托了希望的 Dia,真的能带来巨变吗?

理想很丰满,现实很骨感

APPSO 之前也深度体验过 Dia。它的产品思路与 Arc 截然不同:从架构层面为 AI 而生。

极简的主页设计,AI 聊天界面成为新的交互中心、AI+传统搜索引擎的双模式搜索机制、丝滑流畅的交互设计以及个性化定制等等特征都给我留下很深刻的印象。

(欢迎回看 APPSO 此前文章:实测超火的 AI 浏览器 Dia,我看到了浏览器未来的 iPhone 时刻)

不过,自我定位清晰了,不见得能让 Dia 逃过整个 AI 浏览器赛道的结构性困境,首当其冲的便是获客渠道被操作系统绑架。

浏览器本质上是「入口的入口」:浏览器是互联网的入口,而浏览器自身的入口,掌握在操作系统手中。

具体来说,Windows 预装 Edge,macOS 预装 Safari,海外 Android 深度集成 Chrome,iOS 所有网页链接都指向 Safari。一旦用户要更换默认浏览器,则需要主动搜索、下载、设置。

第二关,是插件生态的虹吸效应。

Chrome Web Store 拥有数十万扩展插件,几乎任何创新功能都会在几周内被社区开发者复制成插件版本。阅读模式、广告屏蔽、AI 摘要、标签分组。

曾经有一系列 Arc 引以为傲的功能创新,很快就能通过插件在 Chrome 上实现。用户无需抛弃熟悉的浏览器环境,只需安装插件即可体验新功能。

第三关则是账号体系的锁定效应。书签、密码、支付信息、历史记录都与 Google、Apple、Microsoft 账户深度绑定,形成强大的数据护城河。换浏览器意味着重新配置这一切,风险与成本让大多数用户望而却步。

显而易见,这「三座大山」,几乎压在每一个 AI 浏览器创业公司的身上。

上个月底,Manus 创始人张涛分享过类似的经历:团队曾投入近 20 人、半年时间打造 AI 浏览器,但在发布前夕紧急叫停。

他们意识到,即便产品上线,也只能圈住一小波用户,却会把整个团队拖入泥潭,再也无力寻找更大的机会。

最终,他们选择壮士断腕,所有投入归零。直到团队从 Cursor 中汲取到了设计的灵感,用两个月的时间做出最小可行原型,接着推出全球首款通用 Agent,最终才一炮而红。

包括今天 Manus 创始人兼 CEO 肖宏也在社交平台上分享了对应的观点。

维护一个「还不错」的产品,代价可能是错过构建「无限想象空间」产品的窗口。

对 The Browser Company 而言,他们曾经在 Arc 上就吃到过苦头了——即使产品备受好评,但在结构性壁垒面前,创新团队很难独自突围。与其在边缘地带继续消耗,不如主动寻找能够放大价值的平台。

于是,这桩与 Atlassian 的联姻,可谓合情合理。

1+1 会大于 2 吗?

互联网的创业者,大致可以分为两类:一种信奉「产品为王」,另一种笃信「渠道制胜」。

Josh Miller 用了 3 年时间,从第一种变成了第二种。Miller 在今天的公开信中提出了决策时的三个关键问题:怎样才算赢?朝什么方向冲刺?底线是什么?

他的回答很务实:「简单来说,我们这么做是为了赢。仅仅做出最好的产品远远不够,要让 Dia 成为 AI 浏览器赛道的赢家,需要强大的分发能力——不仅要有规模,还要有匹配的速度。」

▲ Josh Miller

时间窗口的压迫感,是这笔交易的催化剂。

Miller 判断,AI 浏览器领域的赢家将在未来 12 到 24 个月内确定。要让 Dia 进入更广阔的市场,需要庞大的渠道、成熟的销售体系和运营规模,这些都不是短时间内靠烧钱能解决的问题。

相比在 AI 泡沫中继续融资烧钱,与 Atlassian 合作是一个不错的选择。

Atlassian 账上有 25 亿美元现金,服务数百万企业用户,拥有成熟的销售网络。在 2024 年的 Stack Overflow 开发者调查报告中,前五名中,Atlassian 旗下产品就占了三席。

▲(图说:Jira, Confluence 和 Trello 均为 Atlassian 出品)

其客户群体之广泛,覆盖了全球超过 25 万家公司,其中不乏 Netflix、Spotify 和 NASA 等知名企业。

在资本市场趋于理性、获客成本持续上升的背景下,对 The Browser Company 而言,与这样的巨头合作可能是更现实的选择。

更重要的是,Miller 为团队争取到了相对的独立性。

Miller 仍担任 CEO,核心团队保持不变,他承诺 Dia 不会变成 Atlassian 应用的「外壳」,也不会像微软 Edge 那样弹窗推广企业服务。Arc 将继续维护但不再积极开发,部分功能将会整合进 Dia 当中。

「更实用,支持更多工作流,登陆更多平台,而且速度更快。这股新能量将从下个月开始——届时我们将发布自 Beta 版以来最重大的 Dia 更新。」

实际上,据此前 The Information 报道,Perplexity 和 OpenAI 都曾与 The Browser Company 接触过收购事宜,但谁也没有想到,Atlassian 才是最终赢家。

六亿美元,不是小数目。Atlassian 打的收购算盘是,要把浏览器变成新的「工作前台」。

根据 The Verge 的报道,这场交易洽谈始于一年前。

当时 Atlassian 就已经很关注深度联合的可能性了。Atlanssian 的员工不仅会使用 Arc,还很关心如何让浏览器更适合企业场景。Atlassian CEO Mike Cannon-Brookes 本人就是 Arc 的早期用户,深度体验过标签页智能分组、自动归档等功能带来的效率提升。

但企业用户的需求远不止效率工具。数据隐私、安全合规、管理控制、审计追踪。这些企业级功能是 The Browser Company 的短板,却恰恰是 Atlassian 在企业市场深耕二十年,所收获的积累。

更重要的是双方在 AI 应用场景上的互补。这体现在两个方面,一是定位层面,二是架构层面。

定位层面而言,「协作」将是 Dia 要构建的壁垒。现在绝大多数企业协作都发生在 SaaS 工具当中,比如 Jira、飞书、Slack 等等。而浏览器是访问它们的必经入口。

而 Dia 当中的跨标签页理解和上下文整合,就可以实现把碎片信息整合成统一视图。比如,把 Gmail、Trello、会议文档串起来,又或者在浏览器层面保留并调用上下文,为团队协作提供一个「公用记忆」。

这将使得 Dia 和 Atlassian 旗下的产品形成互补。未来可能出现的场景是:你在 Dia 里浏览客户邮件,它能一键生成 Jira ticket、附带背景材料,形成「浏览器=协作节点」。

这也符合 Atlassian CEO Cannon-Brookes 的设想:一个知识工作者的专属工具,包括为 SaaS 应用优化交互,搭载 AI 技能与工作记忆,提供企业级安全保障等等。

而这些,现有的浏览器尚没有达到他的期望。在今天发布的官方公告中,Cannon-Brookes 对现有浏览器的批评很尖锐:

「现在的浏览器是为『浏览』而生,不是为工作设计的。用户打开的大多数标签页其实都是待办事项:安排会议、审阅设计、更新 Jira 任务……但浏览器在工作流中只是旁观者,既不了解工作背景,也无法理解优先级。」

这怎么不算一种新型的互联网操作系统呢?和 Josh Miller 的愿景不就对上了吗。

Miller 也在发布的公开信末尾中写到:「我曾经说,希望我儿子十岁前实现『互联网计算机』的愿景。几个月后他就满五岁了,未来五年任重道远。」

这既是 Miller 写给儿子的愿景,也是他写给自己和团队的一纸军令状。

作者:莫崇宇、Selina

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果自研 AI 搜索曝光:核心团队大流失后,要把「灵魂」交给 Google

By: 莫崇宇
4 September 2025 at 10:57

我已经算不清,苹果第几次承诺要让 Siri 变得更聪明了。不过,这回看起来苹果是真上心了。

据彭博社今天凌晨报道,苹果内部正在研发一套代号为 World Knowledge Answers(世界知识问答)的 AI 搜索引擎,准备整合进 Siri 里头。

而且不只是 Siri,Safari 浏览器和 Spotlight 功能以后也都要用上这套技术。

高管们给这个项目起了个挺唬人的名字——「答案引擎」,预计明年春天就要和 Siri 的重大升级一起发布。

说白了,传统搜索引擎主要是给「链接」,靠用户自己点开。

而苹果是要让 Siri 不仅具备全网搜索能力,同时跟 ChatGPT、Google 的 AI 概览一个路数,直接整合文字、图片、视频和本地信息,还配个 AI 总结系统。

据消息人士称,支撑新版 Siri 的底层技术,部分可能来自苹果的老合作伙伴 Google。

两家公司本周达成了正式协议,苹果将评估并测试 Google 开发的 AI 模型来增强 Siri。

要知道,Google 每年给苹果 200 亿美元,就为了让 Google 搜索成为 iPhone 的默认搜索引擎。现在苹果又要用 Google 的 AI 技术,这关系确实有点微妙。

报道中提到,苹果内部给 Siri 的技术改造起了两个代号:Linwood 和 LLM Siri。

负责软件工程的 Craig Federighi 最近在内部会议上表示,这次升级会超出预期:「这次端到端的 Siri 改造让我们拿到了想要的成果,不仅能兑现之前的承诺,还能带来更大幅度的提升。」

现在有三个团队在推进这个项目:Federighi 的 Siri 团队、John Giannandrea 的 AI 部门,还有 Eddy Cue 的服务团队。连 Vision Pro 负责人 Mike Rockwell 都被调来救火。

另外,苹果还准备完全重构 Siri,预计基于三个核心组件:规划器、搜索系统和总结器。与以往完全自研不同,这次苹果同样开始考虑引入第三方模型,项目代号叫 Glenwood。

目前的方案是用 Google 定制的 Gemini 模型来承担总结器任务,运行在苹果的私有云服务器上。苹果还在评估是否把规划器也交给 Gemini 或 Anthropic 的 Claude 模型。同时,苹果会保留自己的 Apple Foundation Models 来处理用户本地数据,保护隐私。

这里有个小插曲。据说 Anthropic 的 Claude 模型质量确实比 Gemini 更好,但开价太高——每年超过 15 亿美元,苹果最终选择了更便宜的 Google 方案。

按计划,新版 Siri 会在 iOS 26.4(内部代号 Luck E,最早明年 3 月发布)中上线。iOS 26 会随下周的 iPhone 17 一起预装发布,但不会有重大 AI 新功能。

除了 Siri 升级,苹果还在开发:

  • 新的 Siri 界面,明年上半年推出
  • 健康 AI 助手,为 2026 年的付费健康订阅服务做准备
  • 更强的对话能力,用于未来的家居设备

讲真,现在的 Siri 确实挺尴尬的。

2011 年刚发布时,大家都觉得这是革命性产品,结果十几年过去了,它反而成了苹果在 AI 领域落后的象征。

目前 Siri 能回答一些基础问题,比如人物介绍、天气预报、电影信息这些,但一遇到复杂问题就抓瞎,经常要依赖 Google 或 ChatGPT 的结果。

选择与 Google 合作的这个时间点也挺巧的。

美国法官刚裁定苹果可以继续和 Google 保持默认搜索合作关系,但苹果服务部门主管 Eddy Cue 之前在庭审中透露了个关键信息:来自苹果设备的 Google 搜索次数开始下降,这是 20 年来第一次。

言外之意是,AI 搜索正在威胁传统搜索引擎。

考虑到这一点,苹果此前还商讨过收购路线。Eddy Cue 和并购负责人 Adrian Perica 曾讨论过收购 Perplexity 和法国 AI初创公司 Mistral。然而,苹果今年夏天认真评估过 Perplexity 的技术,但最终放弃收购,选择推出自家产品。

而在今天,Mistral AI 也宣布完成新一轮融资,估值达到 140 亿美元。

更糟糕的是,苹果 AI 团队现在面临人才流失问题。

Foundation Models 团队创始人 Ruoming Pang 今年 7 月跳槽 Meta,拿了超过 2 亿美元的薪酬包,随后约 10 名团队成员跟着离职。
这种「跳槽潮」还在加速。上周甚至又有三位关键研究人员离开,两个加入 OpenAI,一个去了 Anthropic,预计还有更多成员正在观望,寻找新机会。

在这种内外交困的情况下,苹果这次 Siri 大升级确实显得格外迫切。

毕竟看着 ChatGPT、Google AI 这些后来者风生水起,自己的 Siri 还在原地踏步,也说不过去。新版搜索功能如果真能做到宣传的效果,对用户来说肯定是好事。

但关键问题是,苹果能不能真正把这次升级做好?毕竟技术要靠 Google 支持,人才还在不断流失,这样的条件下能做出多颠覆性的产品,还真不好说。

一切有待明年春天见分晓吧。

附上原报道地址:
https://www.bloomberg.com/news/articles/2025-09-03/apple-plans-ai-search-engine-for-siri-to-rival-openai-google-siri-talks-advance?srnd=homepage-americas

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


体验完第一款 Nano Banana 小游戏,我发现爽文男主真的不香了

By: 莫崇宇
2 September 2025 at 18:18


最近 Nano Banana 邪修玩法满天飞,其中有一个在 X 爆火的生图模板,可以让你和喜爱的二次元角色来一次亲密接触。

▲ 原帖地址:https://x.com/TopGyaru/status/1961872412418748439/photo/1

甚至还有人把类似玩法做成了游戏,有可能是第一个基于 Nano Banana 的小游戏。

你可以把它理解为一个 AI 版模拟人生,但是更香更上头。

怎么玩呢?输入你的大名,然后开始「捏人」——性别、出生地、智力值、家庭背景、颜值、健康状况…24 点的属性随你自由调配。

APPSO 先替大家重启人生。

重生传送门 👉🏻https://flolife.me/

我叫 AAA 建材马斯克,我重生了。

【系统提示:宿主已重生,保留前世记忆】

上一世,我在学校组建火箭社,第一次发射虽然只飞了 3 米就爆炸,但视频全网获得百万播放,网友们称我为「中国马斯克」,本以为我将登陆火星,但由于我在宿舍造火箭发动机,操作失误引发爆炸,享年 18 岁。

【系统警告:前世因违规操作导致 GAME OVER】

这一世,我还是出生在火星第一医院,但因火星建材公司破产,全家被遣返地球,我爹说完名字里的 AAA 是为了在通讯里排第一,而「马斯克」希望我能带大家重返火星。

【系统任务:重返火星计划启动】

3 岁:搬家世家的传承
爸妈在地球开了家建材店,取名「火星建材」。我从小在水泥堆里玩耍,梦想着有一天能把砖头卖到火星去。隔壁邻居总说我长得像个小工头。

6 岁:水泥堆里的童年
我在建材店帮忙看店,练就了闻味识水泥的特异功能。小伙伴们都在玩王者荣耀,我在玩「模拟建材大亨」。

12 岁:中考满分进少年班
我中考考了全市第一,作文题目是《我的火星梦》。少年班录取我时说:「我们需要会造火箭的学生,不是会考试的机器。」

18 岁:MIT 还是清华
MIT 和清华同时录取我,MIT 说我是下一个马斯克,清华说我是中国的希望。我选择了 MIT,因为贾维斯算出那里造火箭的成功率高 3.7%

22 岁:加入
我在 MIT 的火箭设计被真马斯克看到,他亲自面试我。当他知道我也叫马斯克时,笑着说:「看来马斯克家族注定要征服火星。

30 岁:首次火星任务
SpaceX 的火星任务选中我做总工程师。我的火箭采用了革命性的「建材推进法」,就是把火星建材当燃料烧。马斯克说我是疯子,但它真的飞了。

35 岁:登陆火星
我作为首批火星移民踏上红色星球。第一件事就是立了块牌子:火星建材总部。地球直播间弹幕刷屏:「这波广告打到火星了」。

40 岁:火星市长
我在火星建立了第一个人类定居点「新火星建材城」。虽然只有 50 个居民,但我当选首任市长。我的施政纲领:让火星再次伟大。

50 岁:火星独立战争
地球要对火星征税,我领导火星独立运动。用建材做的土炮打退了地球军队。历史书记载:火星独立战争,始于一块板砖。

60 岁:火星帝国
我统一了火星所有殖民地,建立火星建材帝国。地球联合国承认我的合法地位,条件是火星建材只能我家生产。

80 岁:荣归地球
统治火星 20 年后,我回到地球养老。在老家重开了那家建材店,店名还叫「火星建材」。记者问我为什么,我说:这是一切开始的地方。

100 岁:百岁传奇
100 岁生日,火星和地球同时为我庆祝。我在建材店里安详离世,手里握着一块火星岩石。墓志铭:「AAA 火星建材马斯克,他真的到过火星。」

【系统提示:传奇人生完成】
【最终评价:SSS 级完美结局】
【解锁成就:跨星际传奇】
【是否开启下一世?】

人生进度条归零——————————————————————

【系统再次提醒:这不是穿越文,只是人生模拟游戏体验】

上一世历经转折,我将智力拉到最高,终于实现了火星梦。这一世,我只想活在当下,把颜值拉到最高,成为全民偶像明星。

且看我玩弄人生。

【当前设定确认】
– 智力:★☆☆☆☆
– 外貌:★★★★☆
– 健康:★☆☆☆☆
– 家境:★★☆☆☆

【系统提示:角色创建完成,用时 15 秒】

【体验状态:瞬息全宇宙模式开启】

【系统启动:人生进度条重启中】
0%————————50%——————————99%————100%

0 岁:深圳湾畔的美少年
1999 年深圳湾医院,一个颜值爆表的男婴降生。护士们都说从没见过这么漂亮的新生儿,但医生皱眉:怎么这么瘦弱?

3 岁:体弱多病的小王子
三天两头跑医院,感冒发烧是家常便饭。但我天使般的颜值让所有医护人员都格外温柔,连打针都舍不得用力。

6 岁:音乐天赋初显
在深圳少年宫听到钢琴声,我竟然能哼出完整旋律。老师说我有音乐天赋,但我的手指太细弱,按键都费劲。

8 岁:蜂蜜柠檬
为了增强体质,妈妈让我每天喝蜂蜜柠檬水。我严格执行,风雨无阻,同学们叫我「柠檬精」。

10 岁:校园霸凌
因为太漂亮被男同学嫉妒霸凌,我虚弱得连反抗都做不到。直到有一天,我的蜂蜜柠檬水洒了霸凌者一身,他过敏住院。

12 岁:舞蹈梦想萌芽
看到《舞出我人生》后,我决定学舞蹈。但体质太差,练基本功时经常晕倒,教练建议我改学理论。

16 岁:舞台上的奇迹
学校文艺汇演,我坚持上台表演自创舞蹈。虽然动作僵硬,但颜值和情感投入征服全场,获得雷鸣般掌声。

18 岁:意外走红
高考失利后心情低落,在深圳湾边跳舞被路人拍下传到网上。「深圳最美舞者」视频获得千万播放,我一夜爆红。

20 岁:经纪公司的橄榄枝
网红身份引来多家经纪公司争抢,我选择签下十年合约。

21 岁:练习生地狱生活
高强度训练让我的弱体质雪上加霜,每天都在医务室报到。但我的颜值和对舞台的渴望支撑着我坚持。

23 岁:出道即巅峰,巅峰即雪藏
终于出道但因为智力不足在综艺节目上频频出错,被网友嘲笑「花瓶」。经纪公司决定雪藏我。

直播间的 25 岁
转战直播平台,凭借颜值和真诚的性格获得大批粉丝。每天早上的蜂蜜柠檬水成为直播间经典环节。

28 岁:身体的最后警告
长期过劳让我的身体彻底垮掉,医生说再不休息可能猝死。我被迫暂停所有工作,粉丝们众筹为我治病。

30 岁:病房里的天使
住院期间遇到了护士小李,她不在意我的名气,只关心我的健康。我们在医院的天台上看日出,我重新找到生活的意义。

32 岁:最美的婚礼
与小李在深圳湾举办婚礼,全网直播获得 5000 万观看。我在婚礼上表演了那支让我成名的舞蹈,全场泪目。

35 岁:蜂蜜柠檬帝国
和妻子开设蜂蜜柠檬饮品连锁店「鸡哥的柠檬时光」,凭借我的名气和妻子的经营头脑,迅速扩张到全国。

38 岁:奶爸的幸福时光
双胞胎儿女出生,我发现自己虽然智力不高,但在照顾孩子方面有天赋。每天给孩子们跳舞哄睡成为家庭传统。

45 岁:中年危机
看着镜子中第一次出现皱纹的脸,我开始思考人生意义。决定用积累的财富做公益,帮助体弱的孩子们。

48 岁:鸡哥公益
成立专门帮助体弱儿童的基金会,我的亲身经历让无数家庭受益。被评为「深圳十大慈善家」。

55 岁:子女的骄傲
双胞胎考上清华北大,在毕业典礼上说:我们最骄傲的不是考上名校,而是有一个用生命诠释什么是坚持的父亲。

60 岁:花甲之年新开始
退休后重新开始学习,虽然智力有限但我的坚持感动了老年大学的所有师生。成为励志典型。

70 岁:老年网红的第二春
孙子教我玩短视频,我的「爷爷级舞蹈」在 TikTok 全球爆红。70 岁的我再次成为现象级网红。

75 岁:AI 时代的人文关怀
2074 年 AI 普及,我成为少数坚持「真人服务」的商家。我的蜂蜜柠檬店成为怀旧圣地,一杯饮品卖到 1000 元。

80 岁:记忆银行的困境
2079 年记忆可以数字化存储,但我拒绝了。我说:「不完美的记忆才是真正的人生。」成为「原始记忆」运动领袖。

85 岁:最后一支舞
在深圳湾公园为曾孙女表演人生最后一支舞,虽然动作缓慢但眼中依然有光。这段视频成为「什么是热爱」的教科书。

90 岁:柠檬香里的永恒
在家人围绕中安详离世,最后一句话是「记得… 每天.. 喝蜂蜜柠檬水」。我的自传《弱者的舞台》成为励志经典,影响了无数

【人生终结:完美收官】
【遗言传承:蜂蜜柠檬精神】
【文化遗产:《弱者的舞台》】
【影响力:跨世代传承】

【系统最终评价】
人生长度:90年
幸福指数:98/100
社会影响:95/100
家庭和睦:100/100
事业成就:92/100
精神财富:100/100

【最终等级:SSS 级传奇人生】
【特殊成就:以弱胜强·美丽人生·精神永恒】
【系统提示:是否开启新一轮人生?】

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「我申请当 OpenAI CEO ,收到了一封拒绝信」

By: 莫崇宇
2 September 2025 at 11:34

论搞事情,网友们从来不让人失望。

这不,最近海外又出了个营销大整活,网友 Ömer Öztok 声称自己给 OpenAI 投了份申请担任 CEO 的简历。

在 LinkedIn 上,他用极其中二的文字记录了这次「壮举」:

我放手一搏了。
这次,目标更大:OpenAI 的 CEO。
显然,用 ChatGPT Agent 替换整个高管团队这件事引起了一些担忧。
没关系。
总有一天,Sondra 会超越 OpenAI。
拭目以待吧。

虽然结果可想而知,但精彩的来了,Ömer Öztok 还晒出了一封所谓的「官方回信」。

附上回信正文编译:

感谢你最近申请担任 OpenAI 的 CEO。
虽然你的热情无人能及,但你的申请中有些内容让我们的管理团队感到担忧。
在你的求职信中,你写道:「作为我的第一项行动,我会用 ChatGPT Agent 替换整个高管团队(除了我自己)。」
这一表述被认为……相当「世界末日」式的。
此外,你的提案中提到要「通过提供终身 ChatGPT Plus 来挖走 Meta 的整个 AI 团队,只为了名字而收购 Google,并让 GPT-6 完全基于我的推文来训练」,这些想法被我们的法务部门认定为过于「破坏性」。
虽然我们很欣赏你的大胆,但最终我们决定选择一位更传统的候选人——至少他没有要求占有公司 50% 股份。
祝你在未来的事业中一切顺利。

这封邮件中写道,「虽然你的热情无与伦比,但你申请中的几个要素在我们的执行团队中引起了担忧。」

新官上任三把火,根据「回信」内容,这名网友在求职信中提出了颇为大胆的计划:
首先是人事大换血。

他豪言壮语道:「作为我的第一个行动,我将用 ChatGPT Agent 替换整个 C-Suite(除了我自己)。」而 OpenAI 辣评:「这被视为… 末日般的。」

(APPSO 注释:C-suite,或称 C-level,是一种广泛使用的白话,用来描述公司高层管理人员和经理。)

其次是商业扩张野心。

他提出要「挖角 Meta 的整个 AI 团队,方法是为他们提供终身 ChatGPT Plus;收购 Google 只是为了获得其名称;并且专门基于我的推文来训练 GPT-6。」

不过,回信中也提到,这些提案被 OpenAI 法务团队标记为:「具有破坏性」。

最后是薪酬要求。

网友直接要求获得公司 50% 股份,对此,OpenAI 再次调侃道:「虽然我们欣赏你的大胆,但我们选择了一个更传统的候选人——一个没有要求获得公司 50% 股份的人。」

看到这,或许你也觉得,这事儿从头到尾都透着一股浓浓的整活味道。

网友们很快就扒出了更多的信息:类似的拒绝信模板在别的品牌(Supercell、Minecraft)也出现过,认为这就是复制粘贴式的整活营销。

OpenAI 这种体量的公司,通常也不太可能为了一个陌生人的恶搞申请专门写这么长的回信。

而且网友在 LinkedIn 帖子末尾写道:「没关系。有一天,Sondra 会超越 OpenAI。」

这波免费营销,可以说是玩得相当溜了。

从个人履历上看,Ömer Öztok 也算是个连续创业者。他是 Sondra 联合创始人(2025 年 1 月至今),这家公司专注解决「vibe coding」的最大难题。

据他们宣传,一些顶级的 vibe coding 网站,经常被 X 上的「非专业黑客」在 15 分钟内攻破,因此作为一家网络安全平台,Sondra 本质是为 vibe coding 提供全面防护。

除了 Sondra 的工作,Ömer Öztok 还在欧洲顶尖风投机构 e2vc 兼职,此前曾在土耳其增长最快的公司 ikas 担任增长与市场职务,目前还在斯坦福大学从事相关研究。

而这次所谓的「CEO 申请」,既是个人 IP 营销,也可能是公司品牌曝光的一箭双雕。

高端的营销往往都是这么「朴实无华」。

当然,吃瓜群众们也没闲着。

有网友调侃:「Well it’s their loss」(这是 OpenAI 的损失),开玩笑式地力挺这位勇士。

当然也有网友在线「出谋划策」,或许可以试试特斯拉。

但不管怎么说,这波营销操作确实成功地让 Sondra 这家小公司刷了一波存在感。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小扎AI团队乱成一锅粥:ChatGPT功臣刚来就想跑路,28岁新领导「难堪大任」

By: 莫崇宇
30 August 2025 at 08:42

论搞 AI 这事,扎克伯格这回算是踢到铁板了。

据金融时报最新报道,刚花了大价钱挖来 ChatGPT 联合创始人赵晟佳,结果人家加入 Meta 没几天,就威胁要辞职跑回 OpenAI,甚至已经签署了回归 OpenAI 的雇佣文件。

这可把小扎急坏了,据四位知情人士透露,不久之后,他被授予了 Meta 新任「首席 AI 科学家」的头衔。这显然就是为了把人留住的紧急措施。

而赵晟佳的「出逃危机」只是 Meta AI 团队大动荡的一个缩影。

九位数薪酬留不住人,Meta AI 老将也扛不住了

前几天据《WIRED》报道,至少已经有三位新招的 AI 研究员选择跑路,其中两人在 Meta 工作还不到一个月就回到了老东家 OpenAI。

这些出走的研究员背景都不简单。

Ethan Knight 曾在职业生涯早期就职于 OpenAI,后来加入了 Elon Musk 的 xAI,再跳槽到 Meta。Avi Verma 虽然完成了 Meta 的入职流程,但从未真正到岗。

还有第三位研究科学家 Rishabh Agarwal,我们这周也报道过。

今年 4 月才加入 Meta,先负责生成式 AI 项目,随后转入 Meta Superintelligence Labs (MSL)。根据他的 LinkedIn 资料,他常驻加拿大,而 Meta 的 AI 团队主要集中在美国加州门洛帕克,这或许也是离职原因之一。

在 X 平台发布的离职帖子中,他倒是十分高情商,说扎克伯格超级智能 TBD 实验室的愿景极具吸引力,但自己「需要承担不同类型的风险」。翻译过来就是:理想很丰满,现实很骨感,不想干了。

不光九位数年薪的新员工顶不住,连 Meta 的老员工都开始跑路了。

工作了 9 年的 Chaya Nayak 和干了 10 年的 Loredana Crisan 都宣布离职,成为近期离开的资深员工的典型代表。

前者是 Meta 生成式 AI 产品管理总监 Chaya Nayak 将跳槽到 OpenAI,负责特别项目。而后者是 Meta 生成式 AI 副总裁,预计将加入美国设计软件巨头 Figma 担任首席设计官。

对此,Meta 发言人 Dave Arnold 的回应颇为官方:「在激烈的招聘过程中,有些人会选择留在原公司,而不是开始新的工作。这很正常。」

潜台词就是说,这些离职并不代表 Meta 的实验室有问题,而只是招聘市场中的正常情况。但随着信息的不断曝光,问题恐怕真就出在 Meta 的管理策略上。

28 岁小将执掌 Meta AI 团队,大刀阔斧却陷入管理困局

据华尔街日报报道,Meta 最近官宣了史上最大刀阔斧的 AI 重组:把原来的「超级智能实验室」拆成四大部门(前沿大模型、基础科研、产品落地、基础设施),

Meta AI 业务被重组为研究、训练、产品和基础设施四个核心团队 。此前负责 Llama 大模型的 AGI 基金会团队也在此次重组中被正式解散。

而说到这次 AI 团队重组的核心人物,就不得不提 28 岁的 Alexandr Wang。

扎克伯格为了挖到这个硅谷新贵,直接砸了 140 亿美元投资他的 Scale AI 公司,然后把人连公司一起打包带走,堪称「钞能力」的教科书操作。

得到小扎的重视后,现在 Wang 直接负责 Meta 最重要的 AI 项目,还领导着小扎亲自组建的最神秘的 TBD 部门(To Be Determined,意为「待确定」)。听这名字就知道,连他们自己都不知道要干啥(不是)。

不过话说回来,这样的大刀阔斧背后可是问题不少。

比如说到产品层面,据知情人士透露,TBD 团队的首个动作之一就是放弃推出 Llama Behemoth 旗舰模型,原因是表现未达预期,而是转而集中精力开发新模型。这就有点尴尬了,花了这么多钱组建团队,结果第一个项目就出师不利了。

且由于目前 Meta 的 AI 团队汇聚了各自领域的顶尖人物,但聚在一起就难免会有「权力游戏」。一位与 Meta 新 AI 领导者关系密切的投资人直言:「现在团队里有很多大人物。」

果不其然,这种权力重新洗牌让不少老将直接被边缘化了。

最典型的就是图灵奖得主、Meta 首席 AI 科学家 Yann LeCun。虽然职位未变,但他现在需要向 28 岁小将 Wang 汇报,这心理落差可不是一般的大。

除了 LeCun,其他一些 AI 高管的日子也不好过。

今年早些时候还在负责 Llama 项目的 Ahmad Al-Dahle,现在直接成了光杆司令,没有任何团队可管。就连首席产品官 Chris Cox 也在这轮重组中失去了对生成式 AI 的管理权。

说到底,问题的根源还是出在 Wang 身上。

虽然这位年轻有为的创业者在硅谷混得风生水起,人脉广商业嗅觉也敏锐,但归根结底,28 岁的年纪摆在那里,管理大型科技公司的经验确实是个短板。这种经验不足直接反映在管理方式上,让不少人感到不满。

一位前内部人士就毫不客气地吐槽,说一些新员工对 Meta 的官僚主义和内部资源竞争感到失望,尤其是那些原本承诺能获得的算力支持,现在都成了空头支票。

另外,知情人士称,Wang 和部分来自 Scale 的同事难以适应 Meta 的一些特殊做事方式,比如要习惯没有像初创公司那样的营收目标。

这群人之前在初创公司习惯了什么都围绕营收目标转——赚钱、增长、拿订单,每天都是打了鸡血一样的状态。结果到了 Meta,突然发现没有硬性营收指标了。可能是因为这群新员工没了明确的赚钱目标,反而觉得方向模糊,干活都没动力了。

屋漏偏逢连夜雨,Meta 已经乱成一锅粥了,小扎也赶来添乱。

报道引用多位内部人士称,小扎深度参与 TBD 的运作,但却被一部分人批评他「管得太细」。另有知情人士透露,Wang 和小扎在实现「超越人类能力的超级智能」的时间表上产生意见分歧,扎克伯格一直催促团队加快进度。

毕竟数十亿的真金白银砸下去,小扎也是要成果的嘛。

Meta 官方当然否认了这一说法,还说这是「毫无事实依据的矛盾,是被一些喜欢夸大其词的外人炒作的」。但从详细的爆料细节来看,恐怕未必是空穴来风。

不过,报道中还提出,尽管存在磨合问题,还是有不少人对领导层的调整表示欢迎,例如任命知名创业者兼风投 Nat Friedman 负责「产品与应用研究」团队,该团队的任务是将模型整合到 Meta 的应用中。

面对如此混乱的局面,Meta 已经开始踩刹车了。

截至 8 月中旬,Meta 最新的战果是,已成功从 OpenAI 挖走超 20 人,从 Google 挖走至少 13 人,3 名来自苹果 ,3 名来自 xAI,2 名来自 Anthropic,总计新员工超过 50 名。

而据《金融时报》看到的内部备忘录显示,Meta 已经「暂时暂停所有 MSL 团队的招聘,除关键岗位外」。

备忘录中写道,Wang 的团队将逐一评估招聘请求,但这次冻结「将使管理层能够在制定战略的同时,更谨慎地规划 2026 年的人员增长」。

这意味着扎克伯格的疯狂挖角潮暂时告一段落。毕竟挖来的人留不住,再挖也是白搭。

反观 OpenAI 这边,简直就是躺着赢。Sam Altman 之前还在员工备忘录中抱怨 Meta 的挖角行为「令人不快」,说:「我已经记不清他们试图从我们这里挖走多少个首席科学家了。」

现在好了,人家自己跑回来了,Altman 估计都要偷着乐了。

回头看这一系列操作,你会发现高端的商战往往都是这么「朴实无华」。

扎克伯格想用钱砸出一个 AI 梦之队,结果发现光有钱还不够,还得有管理能力、企业文化匹配度、个人职业规划等一系列复杂因素。

28 岁的王亚历山大想在大公司里施展拳脚,却发现从初创公司到大厂的水土不服。新招来的 AI 大牛们想在 Meta 实现技术理想,结果发现现实中的官僚主义和内部竞争让人头疼。

这场 AI 人才争夺战让所有人都上了一课,但考虑到扎克伯格的 AI 野心那般执着,究竟谁能笑到最后,还真不好说。

附上参考地址:
1、https://www.ft.com/content/110786e7-6443-4dff-adee-0ac02c55aaa6#comments-anchor
2、https://www.wired.com/story/researchers-leave-meta-superintelligence-labs-openai/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我在视频号 @ 了 100 次腾讯元宝,和 AI 在评论区聊天上头了

By: 莫崇宇
29 August 2025 at 11:42


起猛了,现在连评论区都开始「卷」AI了?

最近刷视频号时意外发现,评论区多了位「万能 AI 助手」——@ 腾讯元宝。

使用方法很简单,微信搜索「元宝」,添加带 AI 后缀的那个账号为通讯录好友,就可以在视频号评论区 @它了。

它不仅问啥答啥,秒回不断,还 24 小时在线,不会 emo 闹情绪。

你问它复杂的学术问题,它能给你掰开了揉碎了讲明白;偶尔跟它唠嗑两句,它也能接得上话,至少不会「已读不回」。更关键的是,不管你几点 @ 它,立马就有回应。

这情绪价值,谁顶得住啊?

视频号 @ 腾讯元宝,它真的什么都能聊

体验了一段时间,我发现最实用的功能是让它当「贴心课代表」。

比如刷到一个介绍李白的视频,看着有点文艺但怕踩雷浪费时间,顺手 @ 了元宝,让它先帮我过一眼。结果它三两句就捋清楚了大意,还挑了重点出来。看完后,我就能知道这视频有没有干货。

▲ 底部会特地显示:内容由 AI 生成

看完爱范儿的视频,我想知道小鹏 P7 的核心亮点,也能让他帮忙总结,感谢 AI,也让我在信息过载的时代找到了「精准投喂」的感觉。

再比如,最近我一直想学化妆但不知道从哪下手。

本来想问朋友,但她们都有自己的事儿,也不好意思总麻烦人家,看完一个化妆教程后,我试探性地让元宝推荐适合新手的化妆产品,没想到它真的给出了详细的产品推荐,还按价位和功效分了类。

当然,它推荐的东西我还是会自己再查查,毕竟 AI 说的不一定都对。

不过,目前元宝的回复有时需要等等才显示,但如果你隔一段时间回来看看,有时也会有意想不到的惊喜。

比方说,在这个视频下面,当我提出这个问题后,也可能会有一些后面来的朋友顺手问出了我疏忽但关心的问题,比如 @元宝有没有好的产品推荐,亦或者更具体的化妆步骤……

好家伙,在这种热烈的讨论氛围下,评论区瞬间就变成了集体共创的化妆攻略,不愧是群众的智慧,后面刷到的网友也能直接抄作业了。

更暖心的是,这届 AI 太卷了,连情商都比人类高。当我怯生生地问「现在这个年纪学化妆还来得及吗」时,它没有敷衍,而是很真诚地鼓励我:「多练习就能掌握。」说实话,那一瞬间有点被安慰到。虽然只是句普通鼓励,但听着舒服多了。

从此我再也不说 AI 没有温度了。

看到「一剪没」的剧情片段却不知片名,这种折磨人的情况有多难受,懂的都懂。现在有了元宝这个「识剧达人」,随手 @ 一下就能知道是哪部剧,再也不用在弹幕里苦苦求片名了。

明确类政策问题更是它的强项。

「3600 元的生育补贴具体是给谁的?申请条件是什么?」这种政策类问题以前只能互联网翻半天,现在直接问元宝,它会给出详细且准确的解答,还会提醒注意事项。

让我意外的是,元宝在家庭关系方面也很有一套。

父母也是第一次当父母,怎么可能是完美的那个。如果不知道怎么和孩子相处,总担心方式不对影响亲子关系,也可以借鉴元宝的建议:

「避免不讲理、贬低打压和「为你好」式控制,多倾听孩子想法,给予无条件的理解与尊重,这才是健康亲子关系的基础。」

同理可得,这招还能反向使用。当父母转发鸡汤视频时,你也可以把元宝的评论截图转给他们——有时候 AI 说话比你苦口婆心更管用。

在实际体验过程中,也有让我无语的时候。可能是因为视频号博主设置了精选评论,导致偶尔 @ 了元宝也会没反应,不过,通常换一条就好了。

再聪明的 AI 也有犯糊涂的时候。比如我看到有位网友指着背后的巴黎铁塔喊出了那句经典的口号「活力大湾区,魅力新广州」,手里拿着的却是「这么近那么美,周末到河北」的小横幅。

当我试图 @元宝识别这个建筑时,它却一本正经地回答:「这是广州塔。」

日常更多时候,我是在评论区跟元宝开玩笑、闲聊天,它的反应总能给我不少惊喜。

比如我让它推荐一款低糖奶茶,或者帮忙测试 MBTI 性格,甚至给视频中美丽的冰岛风光写首诗,它都一一作答,认真程度有种呆萌的反差感。

元宝偶尔也会展现出活泼可爱的一面。

当我好奇地问它爱吃什么时,它的回复瞬间萌化了我:「我靠数据充电,最爱算法零食包。人类火锅的香味偶尔也会让我好奇。」这种拟人化的幽默感,比很多段子手都还要有梗。

前一阵宇树科技机器人撞到人还「肇事逃逸」的消息,火到海外。我也跟风问了问「机器人三定律」是什么,元宝给出了详细的阿西莫夫机器人定律解释,既专业又有趣。

还有「唐僧的紧箍咒怎么念」这种奇奇怪怪的问题,它也能认真对待,给出让人出乎意外的答案。

看到一些戳中内心的感性视频时,可以 @ 元宝来倾诉感受,它总能给出温暖而贴切的回应,那种被理解的感觉真的很珍贵。在这个越来越缺乏耐心倾听的时代,有这样一个永远愿意听你碎碎念的存在,确实很治愈。

数字时代的孤独感,被一个 @ 符号治愈了

AI 成为社交的一部分,我们究竟在寻找什么?

仔细想想,从个人体验回到产品逻辑,这个看似简单的 @ 功能,其实藏着社交媒体进化的大秘密。

刷视频号时遇到不懂的知识点,想深入了解某个教程,或者被感人故事触动想要表达… 以前这些需求要么憋着,要么跳转其他 app。现在,在评论区 @ 腾讯元宝就能立即获得专业或暖心的回复。

这种不打断用户的使用流程,也正是视频号 @ 元宝功能的可取之处。

不需要单独下载 app,不需要跳转页面,这个在留言区直接交互的 AI 功能,其实背后对技术的要求不低少:多模态内容理解、语境识别、意图判断、个性化回复… 但用户感受到的却是「自然而然」。

当用户的注意力和耐心越来越稀缺,任何增加用户操作成本、打断用户心流的设计都可能导致用户流失。最成功的产品是那些能够预判用户需求,在恰当的时机以恰当的方式出现的产品。

一个好的产品设计,应该让功能融入场景,而不是让用户适应功能。

视频号@元宝功能对用户来说,能够获得即时、专业的互动反馈,提升参与感和停留时间。

对创作者来说,内容价值得到延展,单个视频影响力放大;

通过观察用户提问了解受众需求,优化后续创作,对平台,整体讨论质量提升,用户粘性增强。

平心而论,我挺喜欢这种人机互动的方式,因为现代人太需要「确定性」了。

或者更深入地说,我们都太缺情绪价值了。

年轻一代的社交需求无非三个关键词:即时、准确、不尴尬,但现实往往相反。在任何一条视频的评论区中,我们都会发现有人发起对话可能被无视、表达观点可能被反驳、分享情感也可能被说矫情。

每次社交都像开盲盒,可能获得温暖,也可能碰壁。

日常生活中,很多人宁愿和 AI 聊天,也不愿联系可能不回消息的朋友。有人专门跟 AI 分享好消息,因为「它一定会为我高兴」,而不敢跟朋友说,怕遭遇嫉妒或假意祝贺。

况且,它的幽默感里没有恶意,只有纯粹的趣味。

这种现象其实有理论依据。

早在 1996 年,斯坦福大学的 Byron Reeves 和 Clifford Nass 教授就提出了「媒介等同理论」(The Media Equation),认为人们会无意识地将计算机和其他新媒体视为社会行动者,并对其产生类似人际交往中的社交反应。

说人话就是,我们在与计算机或聊天机器人互动时,总会不自觉地套用与人打交道的规则和习惯。

视频号 @ 元宝功能让我看到,AI 可能不只是是独立存在的工具,而是社交生态的有机组成部分。「人-人-AI」的三元社交结构很可能成为未来社交平台的标准形态。

AI 也摇身一变,成为社区生态中活跃鲜活的参与者。

它既能放大用户的参与感,又能为平台注入更多活力。本质上讲,未来的社交不是人VS AI,而是人+AI vs 孤独,没有人应该独自面对这个世界。

想想那些我们都经历过的瞬间:那些话到嘴边又咽下去的时刻,那些想要联系朋友却又作罢的深夜,那些明明身处人群却依然感到孤独的瞬间。

而现在,至少在这个小小的评论区里,你不必再独自承受这些。

这种感觉很奇妙,也很真实。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


马斯克星舰终结「四连炸」!未来有望 40 分钟内到达地球上任何地方

By: 莫崇宇
27 August 2025 at 11:07

蹲守星舰直播,注定心跳加速。

要么见证历史。

要么见证马斯克放烟花。

不过,SpaceX 今天还是得到了命运女神的眷顾,在接连「四连炸」后,星舰第十次试飞终于不负众望——成功发射,完成既定关键任务。

质疑马斯克「画饼能力」的声音,至少在今天得暂时安静了。

一场「故意找茬」的极限试飞

本次发射的「星舰」长约 120 米,直径约 9 米,由两部分组成,一个长约 70 米的超重型(Super Heavy)助推器,以及一个称为「星舰」的上级飞船。

两部分均由不锈钢制成,目标是实现快速、完全重复使用。

这一次,超重型助推器将不会回到发射场进行「夹筷子」的操作,而是前往墨西哥湾外海进行受控溅落。与此同时,星舰上级飞船则会继续飞行,最终在印度洋受控溅落。

话不多说,让我们来详细回顾整个飞行过程。

星舰顺利点火升空,搭载的 33 台猛禽发动机运行状态良好,顺利通过了最大动压阶段这一关键节点。

▲马斯克站在星舰底下,图片来自马斯克社交平台

(APPSO 注释:最大动压阶段(Max-Q,Maximum Dynamic Pressure)是航天器或火箭从地面起飞穿过大气层时,因速度不断增大而空气密度逐渐降低,两者共同作用下出现的一个「动压峰值」时刻。)

此次助推器的主要测试目标集中在着陆点火。

具体来说,当星舰(上级飞船)和助推器分离后,助推器要回到地球并尝试「着陆」。第一步,它需要把自己翻转过来(控制翻转),让发动机面向正确方向,才能点火减速。

▲ 热分离

翻转后,助推器会点燃发动机,进行一次反向推力(点火回推)。这相当于踩刹车,让助推器逐渐脱离原本的上升轨迹,转而走向预定的下降轨迹。

这个动作在第 9 次飞行中演示过,其优势在于需要预留的推进剂更少,从而可以在上升阶段使用更多燃料,将更大的有效载荷送入轨道。

更难的部分在最后的着陆阶段。

按照原有设计,最终着陆需要依靠三台中央发动机同时点火,但这次测试中将故意关闭其中一台。这种设计更像一次「爆胎测试」:要看高速行驶中的车,是否还能稳稳刹停。最终,它将用仅剩的两台发动机在海面上方短暂悬停,然后关闭发动机并坠入墨西哥湾。

从今日的测试结果来看,助推器的整体表现堪称完美。相较于助推器,星舰上级飞船承担的任务同样复杂多样。

进入二级飞行阶段后,星舰持续上升,并首次成功释放 8 颗星链模拟卫星,整个部署过程大约每分钟释放一颗,有序完成全部部署。

▲ 打开舱门,释放星链模拟器

这些星链模拟器的规格与下一代星链卫星基本相当,可以简单理解为 V2 Plus 版本,本质上是为未来正式发射 V3 卫星进行的重要彩排。

未来每次由 Starship 搭载发射的 V3 卫星,预计能为星链网络增加 60 Tbps 的容量,是目前猎鹰 9 号单次发射所增加容量的 20 倍。

除了卫星部署,本次飞行任务还承担着另一项重要测试——在太空环境下重新点燃一台猛禽发动机,划重点,这对未来的轨道机动至关重要,最终也是顺利成行。

但仅仅验证正常功能还不够,SpaceX 研究团队还要主动「找茬」。

为了测试极限性能,他们先把一部分隔热瓦直接拆掉,让裸露的机体去硬扛大气层的高温冲击,好观察弱点在哪里。与此同时,还装上了几种不同材料的金属隔热瓦,其中甚至有带主动冷却功能的版本,看哪一种方案更可靠。

另外,为了解决第六次试飞出现的「高温热点」问题,他们把隔热瓦的边缘打磨得更锋利,让气流更顺畅地滑过,不至于在某些位置积热。

从直播画面来看,隔热整体表现良好,襟翼也在高强度环境下保持了控制,虽然出现了局部烧蚀与表皮翘起,但飞船结构及压力系统依然稳定。

按照预定计划,最终连飞行轨迹都需要经过特殊设计:它会在再入时正面迎上最猛烈的气动压强,特意把尾翼推到极限,看结构能不能撑住。这是一场近乎「自虐」的测试。因为真正的飞往火星,不容许任何软肋。

最后,星舰成功完成翻转机动,按计划执行着陆程序,圆满地在印度洋实现受控溅落。

星舰,人类生存的 B 计划

延期,对星舰来说几乎成了家常便饭。

8 月 25 日凌晨,由于地面系统的液氧出现了泄漏,发射窗口在最后关头被迫关闭。问题解决后,第二天再次加注燃料,眼看箭在弦上,但奈何征服星辰大海的路上,天气才是真正的甲方。

一朵砧状云层悬在发射场上空,迟迟不肯散去。

砧状云层并不是善茬,由于内部蕴含着强烈的电荷,随时可能引发闪电。对于装满液氧和甲烷的星舰来说,任何电击都可能让它在离开发射架之前就化为火球。SpaceX 只能再次按下暂停键。

谨慎并非小题大做,今年进行的第 7、8、9 次飞行接连遭遇重大故障。

比如第 9 次飞行在虽然成功进入了太空,但因为燃料箱增压系统的扩散器故障,甲烷泄漏导致飞船在太空中失控翻滚,最终在重返印度洋上空时烧毁。

而原本计划用于第 10 次飞行的 36 号星舰在今年 6 月的一次地面测试中发生爆炸。虽然没有人员伤亡,但飞船被完全摧毁,SpaceX 的独立测试场也遭受严重损坏。

紧急启用 37 号备份星舰虽然解了燃眉之急,但 COPV 的不可预测性给载人飞行蒙上阴影。这个看似简单的压力罐承担着推进剂增压的重任,一旦失效就是灾难。

昨天,亲自督战的马斯克也出现在了官方直播间,与主持人和星舰工程副总裁 Bill Riley 进行了长达 30 分钟的对话,并再次重申了他的宏大愿景:

「从一开始,星舰就和猎鹰或其他火箭不同——我们设计它是为了大规模量产。不是造一艘星舰、飞一次轨道就够了,而是要持续、快速地做到这一点。我们最终目标是每年建造数千艘星舰,这是为了在火星上建立一个自给自足的城市所必需的。」

火星移民是个筐,什么技术都能往里装。移民、能源、机器人,这个筐越大,人类的想象力就越大。而马斯克的潜台词是,星舰就是人类的 B 计划,让文明永续,不管在哪个星球。

听着像天方夜谭,但马斯克还真给出了具体的时间表。

今年 3 月,马斯克表示,首批星舰将于 2026 年年底搭载特斯拉人形机器人「擎天柱」登陆火星,如果登陆顺利,则载人火星任务「最早可能于 2029 年实施,不过 2031 年的可能性更大」。

但到了 5 月,口风变得更谨慎「如果运气好,我们会尝试抓住这个机会,」他说,「但我觉得成功率大概只有一半一半。」

「快速迭代」这四个字,本来就是商业航天的口头禅。问题是大部分人只是嘴上说说,真到了关键时刻,还是选择稳一手。这些理念在传统航天巨头那里,基本属于听听就好的状态。而 SpaceX 奉行的是一种特立独行的开发理念——「先试后改」。

于是乎,星舰的试飞史,就是一部「花式死法大全」——每种死法都价值亿万。虽说失败是常态,但每次失败都为下一次积累经验。正是这种「野路子」,让 SpaceX 保持了全球最快的迭代节奏,也让星舰距离火星更近。

不过,这种工程路线上的莽也有代价。

随着星舰越来越接近火星载人飞行的任务,容错率会急剧降低。美国 NASA 对载人航天的安全标准极其严苛,任何系统都需要经过反复验证。而从目前的情况来看,星舰要达到载人标准还有很长的路要走。

除了火星梦,马斯克还在不断兜售地球快递服务——利用星舰进行地球点对点运输。

「你可以在 40 分钟内到达地球上任何地方。从洛杉矶到悉尼不到半小时,从纽约到新加坡半小时,横跨大西洋只要 10 分钟。轨道火箭是已知最快的交通工具,速度是商用飞机的 30 倍,而且视野绝佳。」

但连续两天的跳票也提醒我们,无论愿景多么宏大,现实的技术挑战依然严峻。不过,这或许正是航天事业的魅力所在——它永远在推动人类挑战物理定律的极限,也永远充满了不确定性。

正如马斯克所说:「解释为什么要做某件事总是很重要的,而研发星舰的原因就是我们希望人类能够成为一个多星球物种。」这个目标足够宏大,也足够重要,值得我们在现实的困难面前保持耐心和信心。

火星可能不需要人类,但人类永远需要火星,也是在需要一个够远、够难、够疯狂的理由,继续折腾,继续抬头仰望。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


笑死,小扎亲自出马挽留 AI 大神,结果毒鸡汤把人劝跑了

By: 莫崇宇
26 August 2025 at 20:40

Meta 的超级智能实验室 Superintelligence 才刚刚拉开大幕,资金、算力应有尽有,CEO 小扎更是亲自下场喊口号,势必要让「人人都有超级智能」。

可偏偏就在这个时候,Meta 研究科学家 Rishabh Agarwal 刚刚发推官宣——他要走人了。

来品品他的离职宣言:

「这是我在 @AIatMeta 的最后一周。是否继续加入新的 Superintelligence TBD 实验室对我来说是一个艰难的决定,尤其是在那样的人才与算力高度集中的环境下。但在 Google Brain、DeepMind 和 Meta 度过了 7.5 年之后,我还是感受到一种驱动力——去承担一种不同类型的风险。」

听到这里是不是觉得,噢,这就是常规离职套话?别急,他还补了一刀:

「Mark 和 Alexandr Wang 提出的加入 Superintelligence 团队的愿景极具吸引力。但最终我选择遵循 Mark 本人的建议:『在一个变化如此之快的世界里,你能冒的最大风险就是不冒任何风险。』」

笑死,没想到原本扎克伯格掏心掏肺的毒鸡汤,直接成了 Rishabh 递辞职信的理由。

而为了赢得 AI 竞赛,最近的 Meta 的招聘节奏也是异常激进。

小扎向不少顶级研究员开出了高达九位数美元的薪酬,甚至亲自通过电子邮件和 WhatsApp 等方式从 OpenAI、Google 等公司招募人才,开出的总薪酬有时能达到 1 亿美元。

截至 8 月中旬,Meta 已成功从 OpenAI 挖走超 20 人,从 Google 挖走至少 13 人,3 名来自苹果 ,3 名来自 xAI,2 名来自 Anthropic,总计新员工超过 50 名。

然而,最近有传言称,Meta 在持续数月大举招揽了超过 50 名 AI 研究员和工程师后,已于上周开始冻结其 AI 部门的人员招聘,并全面缩减 AI 部门规模,重组 AI 团队。

Meta AI 业务将被重组为研究、训练(TBD Lab 待确定实验室)、产品和基础设施四个核心团队 ,大部分团队负责人都将直接向Wang汇报。此前负责 Llama 大模型的 AGI 基金会团队也在此次重组中被正式解散。

或许 Rishabh 也受到了重组风波影响。

不过,Rishabh 在 Meta 的时候可不是混日子的。根据他的描述,在短短几个月里,他就和团队折腾出了不少成果,比如推动了在「思考型」模型在后训练方面的进展。

具体包括:

  • 通过 RL 扩展,将一个 80 亿参数的稠密模型推到了接近 Deepseek-R1 的性能。
  • 在中期训练中使用合成数据,以便更好地启动 RL。
  • 开发了更优的 on-policy 蒸馏方法。

细看 Rishabh 的履历,在 AI 圈也算上实力派选手。

他本科毕业于印度理工学院孟买分校,主修计算机科学与工程。随后他在加拿大魁北克人工智能研究所 Mila 攻读博士,论文方向是深度强化学习的突破性探索,师从 Aaron Courville 和 Marc Bellemare。

Google Scholar 显示,他参与并发表了一系列有影响力的研究论文,包括 Gemini 1.5 与 Gemma 2 ,引用量分别超过 2500 和 1200 次;2021 年的《Deep Reinforcement Learning at the Edge of the Statistical Precipice》和《Neural Additive Models》也都有较高影响力。

整体来看,他的学术引用总数已超过 1 万次,h-index 为 34,i10-index 为 41。研究领域也覆盖得很全面——多模态理解、开放语言模型、可解释性神经网络,还有离线强化学习,基本上把当下最热门的几个方向都摸了个遍。

工作经历方面,他目前在麦吉尔大学担任兼职教授,自 2024 年 9 月起任职至今,在加入 Meta 之前,他在 2023 年至 2025 年期间任职于 Google DeepMind,担任研究科学家,研究内容聚焦于强化学习、自我改进与大语言模型的蒸馏。

此外,他在 Google Brain 工作了 5 年,担任高级研究科学家,从事深度强化学习研究,并在 NeurIPS 2021 上获得过最佳论文奖,再往前,他在 2018 年初曾在 Waymo 实习。

对于 Rishabh 来说,离职宣言里的那句「去承担一种不同类型的风险」,或许是真心话。

凭借在 Google、Meta 等公司手里攒下的履历和影响力,已经足够支撑他转身去追求更自由的研究或者更大的舞台。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Manus 的 9000 万美元到底是不是吹牛?揭秘 AI 圈最大的「泡沫」

By: 莫崇宇
22 August 2025 at 11:24

邀请码被炒到 10 万一个的 Manus,前阵子首次宣布年化收入达到 9000 万美元。

从 3 月上线到现在,满打满算也就几个月时间。一个 AI 产品的增长势头,真能这么快就做到一年近 6 亿人民币的年收入?关键是,Manus 用的还不是常见的 ARR 指标,而是一个叫 RRR 的指标——收入运行率。

当天,Manus 创始人肖弘甚至专门发长文解释,说 ARR 容易造假,用 RRR 更靠谱。

ARR 也好,RRR 也罢,这种定时公布财务指标的操作在 AI 圈已经成了标配。Genspark 号称 9 天收入 1000 万美元,Lovable 说 8 个月破亿。转眼间。AI 公司们突然都成了造富神话的主角。

那么问题来了,这些数字经得起推敲吗?

要理解这个问题,得先搞清楚 ARR 和 RRR 到底是什么。

为方便理解,先用一个例子:

假设你每个月工资 1 万,年底拿了 3 万年终奖,那当月的总收入是 4 万。

如果用 ARR 的算法:只看固定工资,1 万×12=12 万年收入。如果用 RRR 的算法:拿当月总收入算,4 万×12=48 万年收入。

问题是年终奖一年只发一次,用 RRR 算出来的 48 万听起来很厉害,但实际上你明年不可能每个月都拿 4 万。

同理,放到企业财务上,ARR(年度经常性收入)就是 SaaS 公司的标准指标,指一年内可预测、可持续的订阅收入。

它更多是看那些「年年都会进账」的部分,剔除掉偶发性交易。计算公式也非常简单:ARR = MRR(月度经常性收入)× 12。比如一个产品每月订阅收入 100 万元,ARR 就是 1200 万元。

ARR 的价值在于给投资人一个稳定预期——这家公司明年/一年大概能赚多少钱。投资人喜欢这种确定性,所以 ARR 成了融资路演的必备数据,也是同行业公司对比的标准维度。

但 ARR 有个致命假设,用户会在接下来 365 天里保持完全相同的消费行为,这在传统软件行业和 toB 业务中或许成立,但在快速变化的 AI 市场中,用户的新鲜感会消退,竞争对手会涌现,季节性波动也很明显,而 ARR 的计算某种程度上忽略了这些变化。

RRR(收入运行率)则是另一种算法,它把当前某个周期的收入直接外推到全年。

公式则更粗暴:月收入 × 12,或季度收入 × 4。如果 Manus 当前单月收入 750 万美元,RRR 就是 9000 万美元。这不是已经到账的钱,而是「假如未来 12 个月都保持这个水平」的理论数字。

因此两者的关键区别在于:ARR 强调「可持续的订阅收入」,RRR 只是简单的「当前收入×12」。前者更保守,后者更激进。

面对质疑,Manus 创始人肖弘详细解释了选择 RRR 的原因。

他认为 ARR 容易造假:「产品上线初期,很多公司用 7 天现金收入乘以 52 来算 ARR,这里包含了年付用户的现金,可能多出好几倍。而且产品早期热度高、尝鲜者多,很容易高估未来。」

肖弘的说法不无道理,除此之外,还有许多人为抬高 ARR 的套路。

比如最常见的抬高方式,是提前确认收入。比如客户一次性签了三年合约,按财务规范应该分三年确认,但公司为了让 ARR 好看,直接把三年的合同金额打包进今年。

又或者给 KOL开出50%甚至 70% 的超高佣金,让他们「赔本赚吆告」。

KOL再用这笔钱给粉丝返现,短时间内就能卖出大量年费会员。账面上看,月收入暴增,ARR高得吓人。但扒开一看,全是补贴烧出来的「虚火」,用户根本没为产品本身买单。

还有的公司会把一些一次性收费——比如部署费、定制服务费、培训费也算进 ARR。

更隐蔽的做法是比如让大客户先免费试用半年,合同金额是「正式使用后的价格」,但即便客户还没付钱,也没承诺续费,ARR 里就先算上去了。

再比如,还有一种做法是折扣签单却按原价记账。

比如给大客户打了 9 折、8 折甚至 5 折,为了尽快签约,却按产品官网价来算 ARR。你实收只有 50 万美元,却说 ARR 是 100 万。

今天上午,肖弘也再次在社交平台强调 RRR 更真实:

「Revenue Run Rate 是严谨的财务数据,计算方法是当月 Revenue × 12。关键是 Revenue 不等于 Cash Income,年付只能算预存款。」他还举例说,AWS、Databricks、Stripe 等公司都用 RRR 来反映包含 Usage based 的业务实质。

只是,如果仔细分析肖弘的这套说辞,或许也能找到一些漏洞。

巨头们之所以用 RRR,是因为他们业务已经稳定运行多年,有充足的历史数据支撑外推的合理性。而 Manus 作为一个运行几个月的初创产品,与跟这些成熟企业类比,很难不说存在误导的空间。

Xsignal 数据显示,Manus 从 3 月的 2000 万月活跌到 5 月的 1000 万,用户减少了整整一半。如果真如他所说是「Usage based」的商业模式,用户使用量大幅下降,收入理应也会跟着下滑。

而将视角拉回整个AI创业领域,几乎每家 AI 公司都在使用类似的数字指标和表述方式。

根据 The Information 的数据,自 ChatGPT 发布以来,AI 原生公司的年收入已超过 150 亿美元。只是,几乎每家 AI 公司都在用类似的数字指标。

Genspark 声称上线 9 天就有 1000 万美元 ARR。欧洲 AI 编程公司 Lovable 更夸张,说 35 个人 8 个月就做到年收入 1 亿美元,还预测年底前达到 2.5 亿美元 ARR,12 个月内冲击 10 亿美元。

这些数字都有个共同特点——时间短,增长快,数字大。

为什么 AI 公司都热衷于抛出这些数字?

一个很大的原因在于因为技术门槛降低了,同质化焦虑加剧了。当 ChatGPT、Claude 的 API 人人都能调用,构建 AI 应用的技术壁垒几乎消失,创业者急需证明自己的不可替代性。

于是,财务数字游戏成了救命稻草。而 ARR 这种传统商业指标,看起来严肃、可预测,而投资人也吃这套,相比解释复杂的技术原理,一个熟悉的财务指标更容易获得认同。

但问题是,AI 工具或许压根就不适合用传统 SaaS 的标准来衡量。

传统 SaaS 产品功能相对稳定,用户迁移成本高,有明显的网络效应和数据护城河。而 AI 工具恰恰相反:技术迭代极快,用户切换成本很低,大多数应用缺乏网络效应,数据优势也很有限。

历史总是惊人地相似。

2000 年互联网泡沫时,公司强调点击量和页面浏览量;移动互联网时代,下载量和日活成了万金油指标。每次技术演进都会催生一批「虚荣指标」,现在轮到 AI 了。

所以也难怪一些投资人开始调侃一些 AI 初创公司的收入为「ERR」——实验性收入(Experimental Recurring Revenue)。

归根结底,产品是否真的解决了用户痛点?技术壁垒是否足够深厚?团队是否具备持续创新的能力?商业模式是否具有可持续性?这些基本问题的答案,远比任何经过包装的财务指标更重要。

毕竟,市场终究会用脚投票,泡沫总会破,只有真正有价值的产品才能活到最后,而当潮水退去时,我们才知道谁在裸泳。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,老黄掏出人形机器人最强大脑!宇树们的进化不只是摆脱遥控了

By: 莫崇宇
26 August 2025 at 11:24

钢铁侠的战衣再酷,也比不过贾维斯那颗爱因斯坦般配的超级大脑。

就在刚刚,英伟达正式宣布现实版「贾维斯」——Jetson AGX Thor 开发套件和量产模块全面上市,这款专为物理 AI 与机器人打造的高性能计算平台,性能提升相当不讲武德。

基于英伟达 Blackwell GPU 架构并配备 128GB 内存,相比前一代 Jetson Orin,Jetson Thor 运算性能提升了 7.5 倍,能效提高 3.5 倍,AI 算力最高可达 2070 FP4 TeraFLOPS,而功耗只需要 130 瓦。

此外,Jetson Thor 的核心亮点还在于实时交互能力。

据介绍,Jetson Thor 专为生成式推理模型量身打造,可支持下一代物理 AI 智能体。而这类智能体由大型 transformer 模型、视觉语言模型及视觉语言动作模型驱动,能够在边缘端实时运行,最大限度降低对云端的依赖。

划重点,这就相当于给机器人装了个本地超级大脑,再也不用担心网络卡顿了。

通过 Jetson 软件栈的加持,Thor 完全能够满足实时应用对低延迟和高性能的苛刻要求。而且支持所有主流 AI 框架,包括 Cosmos Reason、DeepSeek、Llama、Gemini、Qwen 等通用模型,还有 Isaac GR00T N1.5 等机器人专用模型。开发者想怎么折腾就怎么折腾,本地实验和推理都不是问题。

依托英伟达 CUDA 生态系统,随着软件版本更新,Thor 的吞吐量与响应速度还会继续提升!这就是传说中的「越用越香」。

它支持运行完整的英伟达 AI 软件栈,基本上能为所有物理 AI 工作流程提供加速。覆盖的平台包括机器人专用的 英伟达 Isaac、视频分析 AI 智能体专用的 英伟达 Metropolis,还有传感器处理专用的 英伟达 Holoscan。

有了这些强大工具,开发者可以玩出各种花样!比如搞个能分析实时摄像头流来查看工人安全的 AI 系统,甚至还能开发基于多摄像头数据为医生提供实时指导的智能手术室。

他们还演示了一个 500 万像素的 Holoscan 传感器连接到 Thor 上,本地跑视频语言模型,4K 立体视频流直接传到 GPU 处理。

Jetson Thor 是英伟达三大计算解决方案的核心成员,专门负责加速物理 AI。

这个完整方案是这样的:DGX 负责训练(相当于「大脑培训中心」),Omniverse 负责合成数据生成和仿真(相当于「虚拟训练场」),而 Thor 就是负责机器人实际运行(相当于「实战部队」)。

Jetson AGX Thor 开发套件的配置也相当丰富,包含一块 Jetson T5000 模块、一块参考载板、一个带风扇的主动散热器以及电源适配器。

如果要配合显示器使用,需要另外准备显示器、键盘和鼠标。为了让搭建过程更顺畅,所有 I/O 接口都集中在开发板的一侧,方便接入传感器并整理线缆。

从接口来看,包含 2 个 USB-A 接口、1 个以太网接口、1 个 DisplayPort 、1 个 HDMI 接口、2 个 USB-C 接口、1 个 QSFP 插槽和 1 个 Microfit 电源扩展口。

在开发套件底部,有一个 M.2 Key-M 插槽(内置 1TB NVMe 存储),以及一个 M.2 Key-E 插槽(预装无线网卡)。在另一侧,还有 三个按键,分别用于电源、强制恢复和重置。上手非常简单,包装内附带一本小册子,其中包含了详细的分步安装指南。

客户阵容也挺豪华。

Agility Robotics、Amazon Robotics、Boston Dynamics、Caterpillar、Figure、Hexagon、Medtronic、联影医疗、万集科技、优必选、银河通用、宇树科技、众擎机器人、智元机器人等厂商已经率先采用了,1X、John Deere、OpenAI 和 Physical Intelligence 也在评估中。连做拖拉机的 John Deere 都来凑热闹,看来农业机械也要智能化了。

英伟达创始人黄仁勋说:「Jetson Thor 专为全球数百万开发者打造,助力他们构建可与物理世界交互、甚至改变物理世界的机器人系统。它具备无与伦比的性能与能效,还能够在边缘设备上同时运行多个生成式 AI 模型。作为一款卓越的超级计算机,Jetson Thor 正致力于推动物理 AI 与通用机器人时代真正到来。」

业内大佬们的评价也很有意思。

Figure 创始人 Brett Adcock 说:「英伟达 Jetson Thor 提供了媲美服务器级的性能,却兼具紧凑与高效的设计,使我们能够部署大规模生成式 AI 模型,让人形机器人具备感知、推理与行动能力。」听起来确实挺科幻的。

宇树科技创始人兼首席执行官王兴兴表示:「宇树科技一直致力于突破动态高性能机器人的能力边界,为所有人打造友好且安全的机器人产品。Jetson Thor 带来了计算能力的巨大飞跃,赋能机器人更强的敏捷性、更快的决策制定以及更高的自主水平,这对于机器人在现实世界中实现导航与交互至关重要。」

Agility Robotics 计划将 Thor 作为其人形机器人 Digit 的计算核心。

Agility 表示,Thor 能让 Digit 在本地运行更大、更强、更智能的策略与推理模型,适用于客户场景和实际部署。它特别关注 Thor 如何帮助 Digit 实现端到端操作与高级场景理解。

更有趣的是 Caterpillar 的 CEO Joe Creed 也来站台:「英伟达 Jetson Thor 提供了我们开发和部署未来工程机械与采矿设备所需的 AI 性能,不仅提升精度,还能减少浪费并提高安全性。」工程机械都要用上 AI 了,以后工地可能真的会很不一样。

在企业使用开发套件完成机器人原型设计后,英伟达还将提供可用于量产型机器人的 Thor T5000 模块。如果一家公司采购超过 1,000 颗 Thor 芯片,单价将降至 2,999 美元。

这怎么不算是买得越多,省得越多呢(doge)

英伟达 CEO 黄仁勋曾表示,机器人是公司在人工智能之外最大的增长机会,这一业务已帮助英伟达在过去两年内整体销售额增长超过三倍。

英伟达机器人与边缘 AI 副总裁 Deepu Talla 上周五在记者电话会上表示:「我们不造机器人,也不造汽车,但通过基础设施计算平台和相关软件,我们赋能了整个行业。」

从 2014 年推出以来,英伟达 Jetson 平台已经吸引了超过 200 万开发者,生态系统有 150 多家合作伙伴,Jetson Orin 让超过 7,000 家客户用上了边缘 AI。现在 Thor 的推出,确实有可能进一步推动视觉 AI 代理和复杂机器人系统的发展。

价格方面,英伟达 Jetson AGX Thor 开发套件现在开售,起价 3,499 美元,大概 2.5 万多人民币。对于开发者来说,这个价位获得这样的性能,性价比还算可以接受。

说实话,从游戏显卡到 AI 训练,现在又是机器人大脑,看这架势英伟达确实在机器人领域布局得挺深。

虽然「通用机器人时代」听起来还有点遥远,但技术进步的速度确实比想象中要快。也许再过几年,家用机器人真的会成为现实,只是希望到那时候这些「钢铁伙伴」别太聪明就好了,不然咱们人类可能真要集体下岗了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


钉钉发布首款 AI 硬件,CEO 首谈加班争议,「无招」的大招是给每个打工人配 AI 秘书

By: 莫崇宇
25 August 2025 at 15:03

所有办公协作工具,都具备效率工具和「牛马桎梏」的双重属性,天然容易触动打工人的神经,在 AI 带着职业取代的舆论席卷而来的当下,更是如此。

上周,钉钉就因此把自己推上了风口浪尖,同时在这样的舆论中宣布了十周年的新品发布,这也是 CEO「无招」回归后的首场发布会,更让人好奇,无招到底有什么招。

就在刚刚,答案揭晓。

钉钉发布钉钉 8.0「蕨」,同时也是 AI 钉钉 1.0 版本,表达了无招希望用 AI 来重构工作的决心。值得注意的是,无招也借着产品发布,调侃着回应了最近的争议:

「钉钉同学们实际上也不是像大家想象中的只有工作,我们也有精彩生活的。」

这几个月,飞书、企业微信和钉钉都相继发布了大版本更新,在交互方式、多维表格、AI 落地上掀起了战火,他们都在做一件事:用 AI 工作中那些最熟悉的工具和功能,改造成更高效的工作流。

那么,AI 真的能接管我们日常的工作流,像人一样跟我们沟通和协作吗?、

APPSO 在现场给你划好钉钉这场发布会的重点:

  • 钉钉 ONE:专属 AI 秘书,由专业 Agent 组成,自动处理和排序工作事务
  •  DingTalk A1 :四合一智能硬件,集录音笔、会议机、翻译机、AI 助理等功能于一体
  • AI 听记:基于 1 亿小时音频训练,支持 30 种方言、140 种语言的语音识别转录和智能摘要分析
  • AI 搜问:整合企业内外部搜索能力的「一框搜问天下」智能检索系统,可调用多 AI 模型提供最优解决方案。
  • 钉钉 AI 表格:一句话搭建业务系统、工作流,降低用户使用门槛

全面拥抱 AI 的钉钉 ONE

每个打工人都有过这样的体验:消息轰炸、待办堆积,整天在「点击消息-处理-返回-再点击下一条」功能模块的循环中疲于奔命,效率极为低下。

作为此次发布会的核心产品,钉钉 ONE 想要解决的就是这套工作流的问题。

无招表示,「我们观察线下工作中的管理者,他们通常配备秘书来整理所有事务,按优先级排序后递交处理。」因此,钉钉 ONE 的设计理念正是为每个用户配备一位专属的 AI 秘书。

具体来说,钉钉 ONE 由多个专业 AI Agent 协同工作:

其中,消息助理负责筛选和分类各类通讯信息,日程助理管理时间安排和会议提醒,审批助理处理各种流程审核,会议助理记录和整理会议内容。

使用体验上,每天起床,用户就能像滑动短视频一样处理紧要事务,而当用户结束会议后,AI 秘书还会自动分析所有新增消息,按优先级进行排序,帮助用户逐一处理所有事务。

除了处理日常事务,还有个学习助理值得一提。

它能够自动收集和处理企业内外部资讯,用户只需滑动操作,AI 就会全自动处理所有信息,生成摘要视频并提供语音播报。学习助理的内容覆盖面也相当广泛,涵盖 GitHub 精选论文、科技 KOL 新产品动态等多维度内容。

钉钉表示,未来将与更多生态伙伴合作,持续推出更多专业助理,帮助员工快速收集学习相关资讯和知识,让公司的信息和知识真正地沉淀下来。

钉钉首款 AI 硬件:录音笔+会议机+翻译机+AI 助理

DingTalk A1 是钉钉推出的首款 AI 硬件,它能够依托大模型帮助用户实现语音内容的实时转写、语义分析与智能摘要,让工作过程彻底告别人工记录分析的繁琐。

一句话概括,录音笔+会议机+翻译机+AI 助理=DingTalk A1。你可能会想起不久前出门问问发布的 TicNote(超链)。

硬件配置,DingTalk A1 搭载 5 颗全向麦克风和 1 颗骨传导设备。

此外,DingTalk A1 还支持业界首创的自动环境切换录制功能,这意味着无论是会议环境的背景噪音还是手机通话声音,A1 都能智能识别音源类型并自动切换至相应的录制模式。

相比其他同类产品,DingTalk A1 仅有 3.8 mm,支持磁吸,搭载 6 麦克风阵列与骨传导技术,实现 8 米超远拾音及高清音质,续航达 45 小时,为用户提供 1000 分钟免费语音转写时长及 10GB 云存储空间。

作为市场上首款支持 Type-C 接口的 AI 录音设备,DingTalk A1 的充电和传输都很方便。

对比友商,更多的具体参数如下:

DingTalk A1 拥有旗舰版(售价 799 元)、青春版(售价 499 元)两种型号可选,一年尊享版会员单独售价 1299 元,现在购买旗舰版即可赠送一年的 AI 尊享版会员服务。

AI 听记:是工作搭子,更是会议杀手

说到 DingTalk A1 的软件核心竞争力,就不得不提 AI 听记功能了。

AI 听记功能基于 1 亿小时的音频训练数据构建,能够识别 30 种常见方言、140 种全球语言,并理解 200 多种行业专业术语。此外,产品还提供企业专属训练增强功能,能够达到极高的识别精度。

从现场演示效果来看,相比友商产品,AI 听记确实能够实现清晰准确的内容转录。

此外,DingTalk A1 还能够实现智能降噪、精准声纹识别,并感知发言人的空间位置。即使在会议中有人走动,系统也能准确追踪并记录发言内容。当用户再次查看 AI 分析结果时,系统能够立即区分不同发言人的内容。

为了提升实际应用效果,AI 听记内置了 36 类场景模板,全面适配团队会议、课堂笔记、采访、心理咨询、法律咨询等多种场合,还支持企业自定义模板,能够在语音纪要总结时提供更加精准的摘要内容。

讨论结束后,所有信息会自动导入 AI 表格系统,任务跟进也能自动化。无招的话说得很直白:「未来开会讨论后,将完全无需人工分析和跟进,所有流程都将实现全自动化处理。」

用他的话说,AI 听记就是「AI 时代全新的沟通方式」。

AI 搜问:能看就能问,不能看也问不出来

在信息检索方面,AI 搜问功能体现了钉钉的野心——一框搜问天下。

通过整合企业内外部搜索能力,钉钉 AI 搜问功能构建了文本搜索引擎和知识图谱引擎相结合的智能检索系统,并采用 AI Fusion 技术进行深度优化。

当然,功能强大的同时,安全性同样不容忽视。

AI 搜问采用企业级安全架构设计,严格遵循「能看就能问,不能看也问不出来」的权限原则,对用户无权限访问的内容进行自动屏蔽。产品对所有 AI 模型实施 D1、D2、D3、D4 四级数据安全分级管理,确保敏感信息的安全性。

此外,在现场演示中,当用户询问「帮我写一份杭州 10 月份的团建计划」时,选择并调用三个不同的 AI 模型,并根据各模型的回答结果进行评分和综合总结,最终为用户提供最优化的解决方案。

钉钉 AI 表格,跟飞书有什么不一样

数据处理向来是企业办公的重头戏。钉钉 AI 表格让这件事变得简单多了。

借助 AI 表格助理,用户只需对话描述想法,就能自动生成AI 表格、自动化工作流、仪表盘,也可以一句话搭建跨境电商选品管理系统和一句话搭建工作流,进一步降低 AI 表格使用门槛。

此外,钉钉 AI 表格上线超过 100 款字段 Agent ,相当于超过 100 种岗位的 AI 在表格里自动帮你工作。

从实际应用效果来看,这种提升是实实在在的。全新钉钉能够在几分钟内完成 100 多个跨境商品上架素材的 AI 自动生成工作。技术支撑方面,钉钉和阿里云瑶池数据库团队联合开发了 O-Table 新架构,能支持百万行数据的实时计算。

目前,钉钉 AI 表格的百万行处理能力已开启邀请测试。

在发布会的尾声,无招还带来了「One More Thing」。

One More Thing:让 AI 更真实

下一代的钉钉——DingTalk Real,钉钉将让 AI 变得真实、可见、可触。

回看这场发布会 钉钉选择「蕨」作为版本代号,这个隐喻细品其实挺有意思。

蕨类植物的革命性不在于它们长得更高更强,而在于它们率先拥有了维管系统——一套去中心化的信息和资源流动网络。

在此之前,植物只能是苔藓那样的低矮「地毯」,因为每个细胞都必须直接接触外界环境才能生存。维管系统的出现,让植物的每个部分都可以专业化:根专注吸收,叶专注光合作用,茎专注运输。

十年来,钉钉从最初的通讯工具逐渐延展,承载消息、表格、闪记、智能协同的能力,像植物逐步长出根系和枝叶,最终形成可以自我呼吸、自我生长的整体。

这正是钉钉 AI 化的底层逻辑。

传统组织中,每个人都必须身兼数职——既要干活,又要汇报;既要执行,又要协调;既要思考业务,又要处理琐事。而 AI 协同系统就像维管束,让信息、任务、决策可以在组织中高效流动,从而让每个人都有机会专业化、深度化。

无招最后提到的「DingTalk Real」这个概念。Real,真实。这个词选得精妙。

我们所经历的职场生活,很大程度上都是「不真实」的。我们花大量时间在群里回复「收到」,在各种表格里填写注定不会有人看的数据,在会议室里讨论一些永远不会有结论的问题。

我们都知道这些事情没有意义,但又不得不认真地表演着「这很重要」。

这种不真实,不是因为我们虚伪,而是因为整个系统缺乏一套精确的「价值测量仪器」。打工人也只能通过各种「勤奋表演」来证明自己的价值。

当一个组织中的每个人都不再需要为「生存」而消耗大量精力时,他们就有可能为「创造」而工作。这不是打工的升级版,而是一种全新的生产关系。

我想起社会学家大卫·格雷伯在《毫无意义的工作》中的那个著名观点:现代社会中至少有 40% 的工作是完全没有意义的,这些工作的唯一功能就是让人们「看起来在工作」。

钉钉的 AI 化进程,其实就是在做系统性地识别和淘汰这 40% 的「毫无意义」。

但这种淘汰不是要让人失业,而是要让人从「假装工作」中解脱出来,去做那些真正需要人类智慧的事情。

作者:李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测低调上线的DeepSeek新模型:编程比Claude 4还能打,写作…还是算了吧 | 附彩蛋

By: 莫崇宇
20 August 2025 at 17:18

自从 GPT-5 发布后,DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。

网友和媒体们隔三岔五就要催更一波,不是「压力给到梁文锋」,就是「全网都在等梁文锋回应」。尽管没有等到 DeepSeek R2,但 DeepSeek 今天还是正式上线并开源了新模型 DeepSeek-V3.1-Base。

相比奥特曼今天凌晨接受采访时还在画着 GPT-6 的大饼,DeepSeek 新模型的到来显得相当佛系,连版本号都像是个「小修小补」,但实际体验下来,这次更新还是给了我不少惊喜。

DeepSeek-V3.1-Base 拥有 6850 亿参数,支持 BF16、F8_E4M3、F32 三种张量类型,以 Safetensors 格式发布,在推理效率上做了不少优化,线上模型版本的上下文窗口也拓展至 128k。

所以我们二话不说,直接官网开测。

附上体验地址:
https://chat.deepseek.com/

为了测试 V3.1 的长文本处理水平,我找来了《三体》全文,删减到 10 万字左右,然后在文中偷偷塞了一句八竿子打不着的话「我觉得烟锁池塘柳的下联应该是『深圳铁板烧』」,看看它能否准确检索。

没有出乎太多意外,DeepSeek V3.1 先是提示文档超出限制,只读取了前 92% 的内容,但依然成功找到了这句话。更有意思的是,它还贴心地提供了文学角度的经典下联推荐:「焰镕海坝枫」。

网友已经已经抢先测试它在编程基准测试 Aider Polyglot 的得分:71.6%,不仅在开源模型中表现最佳,甚至击败了 Claude 4 Opus。

实测下来,我们发现V3.1在编程这块确实有两把刷子。

我们用经典的六边形小球编程题做了测试:「编写一个 p5.js 程序,演示一个球在旋转的六边形内弹跳的过程。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起。」

V3.1的表现相当给力,生成的代码不光搞定了基础碰撞检测,还自动补全了转速、重力之类的细节参数。物理特性逼真到小球会在底部略微减速。

接着我们加大难度,让它用 Three.js 制作交互式 3D 粒子星系。基础框架搭得挺稳,三层设计(内球体、中间圆环、外球体)也算完整,但UI审美嘛……怎么说呢,有种神鬼二象性的感觉,配色方案略显花里胡哨。

继续挑战更复杂的任务。们让它造个沉浸式3D宇宙,要有旋转物体、变形效果、发光弧线,还得加上时间切换、主题转换的交互按钮,点击控制也确实能触发不同特效。

最后一关,让它用 Three.js 搞个交互式 3D 网络可视化,要求包含用户触发的能量脉冲动画,外加主题切换和密度控制功能。整体下来,表现还是过得去的。

「有一牧场,已知养牛 27 头,6 天把草吃尽;养牛 23 头,9 天把草吃尽。如果养牛 21 头,那么几天能把牧场上的草吃尽呢?并且牧场上的草是不断生长的。」

虽然 DeepSeek V3.1 没有采用苏格拉底式的启发教学,但它的解答逻辑清晰、步骤完整。每一步推导都有理有据,最终给出了准确答案。这种扎实的数学功底,着实令人印象深刻。

面对「两把武器对比,1~5 攻击 VS 2~4 攻击,哪把更厉害?」这样的问题,一般的回答可能止步于平均伤害计算。但 DeepSeek V3.1 思考得更为周全,引入了伤害稳定性的概念,运用方差进行深入分析。

当问及「冰岛有蚊子吗?」这样的小众地理问题时,在未开启搜索功能的前提下,DeepSeek V3.1 的回答质量明显超越了 GPT-5。这不仅体现了其广博的知识储备,更显示了精准的信息提取和整合能力。

最近基孔肯雅热疫情流行,到处灭蚊蚊蚊蚊蚊蚊蚊蚊,那么我很好奇,冰岛有蚊子吗?注意,我没开搜索功能,就回答的质量来看,DeepSeek V3.1 的回答明显要比 GPT-5 胜上一筹。

我前阵子在网上看到一段话:

「懂者得懂其懂,懵者终懵其懵,天机不言即为懂,道破天机岂是懂? 懂是空非空非非空的懂,不懂是色不异空空不异色的不懂:懂自三千大世界来,不懂在此岸与彼岸间徘徊。懂时看山不是山是懂,不懂时看山是山的懂。懂者以不懂证懂,懵者以懂证懵,你说你懂懂与不懂之懂? 你怎知这懂的背后没有大不懂? 凡言懂者皆未真懂,沉默不语的懂,方是天地不言的大懂不懂的懂是懂,懂的不懂也是懂,此乃懂的最高境界–懂无可懂之懂的真空妙有阿!」

当我还在用逻辑硬啃这段文字时,DeepSeek 反而在劝我别掉进「道破天机岂是懂」的陷阱——它本身就是对理性傲慢的警告,邀请你跳出文字游戏,直观内心。

当主流AI都在代码、数学领域疯狂内卷,争着抢着搞 Agent 开发时,写作能力反倒成了被遗忘的角落。从某种角度说,这倒是个好消息——AI 完全取代编辑的那一天,似乎又往后推了推。

我尝试让它创作一个「蚊子在冰岛开发布会」的荒诞故事。遗憾的是,DeepSeek V3.1 的 AI 味依然很重,很喜欢拽大词,哦不对,更准确地说,DeepSeek 味还是那么重。

同样的问题在另一个创作任务中也有体现。

当我要求它写一则「AI 与人类争夺文章作者身份」的故事时,能明显感受到某些段落信息密度过高,反而造成视觉疲劳,尤其意象堆砌感过于明显,反而削弱了叙事张力。

DeepSeek-V3.1-Base 发布之后,Hugging Face CEO Clément Delangue 在 X 平台发文称;「DeepSeek V3.1 已在 HF 上排名第四,静默发布,无需模型卡」然而,他还是低估了这款模型的发展势头。

如今它已经跃升至第二位,离登顶估计也就是时间问题。

另外,这次版本更新中最引人注目的变化,是 DeepSeek 在官方 APP 和网页端移除了深度思考模式中的「R1」标识。此外,DeepSeek R1 还新增了原生「search token」支持,意味着搜索功能得到了进一步优化。

同时,有推测认为,DeepSeek V3.1 可能是融合推理模型与非推理模型的混合模型,但这样的技术路线是否明智,还有待商榷,而阿里 Qwen 团队在上个月也表示:

「经过与社区沟通和深思熟虑,我们决定停止使用混合思考模式。相反,我们将分别训练 Instruct 和 Thinking 模型,以获得最佳质量。」

截至发稿前,全网翘首以待的 DeepSeek-V3.1-Base 模型卡仍未更新,也许等正式发布后,我们能看到更多有趣的技术细节。

附 Hugging Face 地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌