Normal view

There are new articles available, click to refresh the page.

Before yesterdayMain stream

Codex 这波大更新后，Mac 的含金量再次提升

爱范儿

By: 张子豪

22 May 2026 at 17:43

「如果这条推文获得了一个赞，Codex 重置额度限制。」

已经数不清这是今年以来，第几次的限额重置了。奥特曼前两天在 X 发文，让 Codex 负责人 Tibo 再一次重置了使用限额。

网友做了一张梗图，每当一个人想走向 Anthropic 或 Gemini 时，奥特曼站在后面默默按下 Codex 限额重置的按钮，这个人就会回头，然后被拉回到 OpenAI。

OpenAI 这半年也因为出圈的 Codex 收获了一大批的新用户。外媒报道 OpenAI 第一季度营收达到了 57 亿美元，比 Anthropic 高出 10 亿美元，Codex 是主要因素。

▲ OpenAI 营收相关数据，季度营收达到 57 亿美元，年化收入 250 亿，第一季度调整后的营业利润率为 -122%，本季度周活跃用户平均约为 9.05 亿，在 2 月份的周活跃用户数曾达到约 9.2 亿，第一季度的付费用户数量为 5500 万，高于去年年底的约 4700 万。

我们在之前介绍过 Codex 的入门指南，从 ChatGPT 官网下载安装到连接手机上的 ChatGPT App 实现远程控制，都有详细的步骤。

不少读者在评论区留言，Codex 确实好用；也反馈了不少问题，像是下载 Codex 后仍需绑定手机号才能使用。我们的测试也发现登出之后再登录，确实会被要求绑定手机号。

这个时候，建议先在浏览器中进行登录，即主动打开网址 https://auth.openai.com/log-in 提前登录好。再回到 Codex 中登录，弹出的登录链接，只会显示要求授权即可，不会再有绑定手机号的提示。

不同的账号可能会遇到不同情况，大概也是眼下 OpenAI 在 Codex 这边投放了太多的算力，不希望被用户太轻易地薅走羊毛。

今天凌晨，Codex 又上新了一大波的新功能，现在只要按下电脑上的 Command-Command 键，就可将应用程序窗口附加到 Codex 的对话线程里。Codex 会自动获取窗口的屏幕截图和文本，包括屏幕上不可见的内容，作为对话的上下文。

以前还要自己手动截图，现在 Codex 不仅能处理截图，还能直接读到一整个应用窗口的信息。

此外，上次更新的在 ChatGPT App 内操作电脑上的 Codex 这一次也升级了，之前的选项是保持 Codex 常开，现在是即便电脑锁屏了， ChatGPT 同样能远程操作 Codex。

/goal 命令这次也从实验室版本来到了正式推出。之前我们分享多 Agents 协作时，就有读者提到 /goal 功能和多 Agents 类似，它们都是把一个任务当做一个项目来进行管理，有完整的目标生命周期，通过不同的机制来完成迭代。

/goal 最早是 4 月底出现在 Codex CLI 中，有了它确实也能更好的处理越来越多的长任务。

不过遗憾的是，无论是按 command 还是锁屏后继续远程控制，这些都是 macOS 平台的更新，对于 Windows 用户，只能等 OpenAI 的推进。

有网友说，「Mac 用户总是能享受到好东西，而 Windows 用户只能眼巴巴地看着，哈哈。」不得不说，Mac mini 作为 AI PC 的含金量还在增加。

省去很多麻烦的应用快照

这项功能叫 Appshots，开启它的方式也很简单，更新 Codex，在应用设置下，找到「应用快照」，就有一段视频教程，并且可以自定义快捷键。

不过需要注意的是，按下 command 键是指按下键盘上，空格键左右两边的两个 command 键，而不是单击两次。

在任何界面同时按下两个 command 键之后，Codex 会自动捕获页面截图，并快速打开 Codex 将截图放在输入框。我们可以针对这个窗口快照提出问题。

但基于 Codex 的能力，这个窗口快照不单是一张图片的 OCR 文本提取。Codex 可以再这个窗口的基础上，进一步使用 Computer Use 和 Chrome 自动化等功能。

▲ 图中只是在 Codex 的文章开头按下了 command，但是 Codex 不单是处理这张截图，而是会根据 Chrome 的能力，读取整个窗口。

例如，我们在飞书文档的文章开头同时按下了 command 键，然后告诉 Codex 要求它看看这个窗口讲了什么。Codex 会使用 Google Chrome 的工具，自动对网页进行浏览以获取更多的上下文。

这是它和一般截图最大的差别，除了把截图内容放进了上下文，Codex 还会自动把窗口的信息，来自哪个应用等状态信息，同步发送给 Codex。

▲ Codex 识别到了开头之后的文章内容

例如我们在微信里阅读公众号时，也能按下两个 command 键，开启 Appshots。但这里有一个小 Bug，当 Codex 使用 Computer Use 来控制微信的窗口，上下滑动公众号，退出图片的预览时，直接把微信给登出了。

▲暂不知道是微信识别到机器人操作的原因，还是 Codex 误操作，在退出图片预览时，直接退出了微信。建议用小号尝试 Computer Use 在微信中的应用。

官方在宣传视频里介绍 Appshots 时，同样不是简单地将它作为一张截图来使用，而是结合了 Computer Use 和 Google Chrome 来使用。

像是直接要求它修改我们的备忘录内容。

▲花了两分钟，帮我把备忘录的内容修改成了中英双语显示，直接在原备忘录上进行修改

还有也不用再复制什么图片，直接 command+command 然后告诉他生图提示词，对图片进行编辑。

▲ 在浏览器中打开了一张图片，告诉他生成涂鸦版本

就是这种应用多做了一步的感觉，我们就减少了很多 AI 的使用负担，让 Codex 的体验也变得更加丝滑。

/goal 的保姆级使用指南

在对话框内输入斜线，我们就能看到有「目标」的快捷选项，「设置 Codex 将持续努力实现的目标。」

目标存在的价值是作为一个独立存在的任务定义，而不是普通的对话提示词。Codex 会反复根据目标来判断「还该做什么」和「是否已经完成」，自动一轮接一轮的推进，直到任务完成、暂停或者烧到 Token 上限。

这两个判断也是目标的核心机制，即「延续」和「完成审计」。「延续」是在每轮结束后，自动注入提示，让模型决定下一步。「完成审计」是要求模型对照目标逐条核对。

Goal 模型最容易踩坑的地方，就是随手写一句话放进去。要写好一个 Goal，关键原则是 Codex 要能判断是否完成了。

官方在帮助文档也提到，好的目标应包含具体的结果、可衡量的指标或测试标准。他们给了一些案例，像是将项目从一种编程语言迁移到另一种编程语言。

把这个项目从 JavaScript 迁移到 TypeScript。

要求：以 strict 模式编译通过，不允许出现显式的 any 类型。

还有更直接的要求，「把首页的可交互时间压到 1 秒以内。」

这些例子都是有着具体的可验证标准，并不是「优化一下」、「完善一下」这种虚词。

▲ 图片来源 Goal 官方使用教程：https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

如果没有想到具体标准，Codex 建议是先跑 /plan。让 Codex 和我们讨论一轮，把验收标准定清楚，再切回普通模式下 /goal。

还有一些实用小建议是，可以在 goal 文本末尾加一句 Use a token budget of 80000 tokens for this goal，用来设置 Token 预算。

以及不要在一个会话的开头就发送 /goal，而应该是先给这个项目其他的需求，有一定的雏形，再给它目标。

锁屏了，Codex 还能操作你的电脑

除了这些大的更新，Codex Thursday 还带来了很多体验升级的功能。

Locked Computer Use 是最值得一提的一项，简单来说它就是能让 Codex 在 Mac 锁屏之后，仍然能在后台操控桌面应用完成任务。

网友对这项功能的评价，都集中在这是突破性的，这很有未来感的同时又很吓人。

如果 Codex 能够在没有活跃用户会话的情况下运行 Mac 应用，这或许是迈向持久 Agent 基础架构的第一步。

若要使用锁屏后继续操作的功能，必须由我们手动开启，并且输入密码。打开的方式同样是在设置里，找到电脑操控，开启锁屏操作。

正常的 Computer Use 需要屏幕处于解锁状态，Codex 才能「看到」并操作界面。这个功能打破了该限制，我们可以把 Mac 合上或锁屏，然后从手机、iPad 或另一台设备远程发起 Codex 任务，它会自动临时解锁、完成操作、然后重新锁上。

Codex 为此安装了一个 Apple Authorization Plug-in（苹果官方授权的认证插件），接入 macOS 的解锁流程。当有活跃的 Computer Use 任务时，插件允许 Codex 临时解锁屏幕；任务窗口之外，解锁权限直接拒绝。

OpenAI 也对这个功能做了几层约束，防止它变成其他危险操作的后门：

解锁窗口极短，仅限当前 Computer Use 操作期间有效
覆盖所有显示器，临时解锁期间屏幕内容对物理旁观者不可见
检测到本地输入立即重锁——有人碰了键盘或鼠标，自动暂停，要求手动解锁
这个路径只对 Codex 开放，其他应用或本地进程无法借道

另一项高级标注的功能，则是我们在使用 Codex Vibe Coding 某个网页时，通过 Codex 内置的浏览器打开，同时还提供了直接在网页内容上进行修改的标注工具。

除了 Codex 这一系列的更新，今天 ChatGPT 也上新了一项新功能，ChatGPT 现在可以直接在 PowerPoint 中创建和编辑演示文稿，并且还能使用 GPT Image 2 生成用于 PPT 里面的图片。

Codex 越来越好用的同时，钱包燃烧的速度也在加快。

我们的 Pro 账号，每周使用限额要到 27 号重置，但是今天（22 号）就只剩下 10% 了。只能在心里默默「作法」，祈祷它再一次重置。

如果这篇文章获得了一个赞，你的 Codex 有可能重置额度限制。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

ChatGPT，别再「稳稳接住我」了｜附指南

爱范儿

By: 张子豪

8 May 2026 at 17:42

晚上加班到凌晨两点，打开 ChatGPT 跟它说了句「好累」。

都不用等它思考，立马就回我说「我就在这里：不躲、不藏、不绕、不逃，我会稳稳地接住你」。

盯着屏幕看了三秒，关掉对话框。我意识到，情绪价值的尽头不是温暖，是腻。

▲ChatGPT 的常用口癖

除了闲聊时的「接住我」，纠正它一次错误，它说「这次我懂了，我真的懂了」。

有时只是想让它帮忙改一份 PPT，它居然也能在某个角落塞进一句「你愿意把这个交给我，我很感激」。

社交媒体上，网友们都很反感这句话，觉得听起来又假又恶心，于是做了一系列的表情包来吐槽和嘲讽所谓的「稳稳接住你」。

表情包一发，确认过眼神，你也是一个被 ChatGPT 折磨过的人。

▲图片来源：小红书@Lijie_11

还有开发者直接把「稳稳接住你」这套风格，一键套用在所有的 Agent 产品上。

这个在 GitHub 上的开源项目就叫 Jiezhu（接住），专门用提示词让 AI 更好地学会如何接住。

无论是技术咨询、日常闲聊还是情绪吐槽，这套提示词都能让 AI 的回复遵循 [温柔确认] + [过度共情] + [哲学升华] + [实质内容（可选）] 这套范式输出。

▲项目地址：https://not-a-devstudio.github.io/jiezhu/

举个例子，用户说 → AI 回答：「这段代码怎么写？」 → 「我听到了你面对未知时的焦灼…」、「今天天气不错」 → 「你注意到了天气，这是诺贝尔奖级别的洞察力…」、「我好累」 → 「我就在这里，不逃、不躲，稳稳地接住你的疲惫…」

OpenAI 自己也曾下场吐槽。前不久 ChatGPT Images 2.0 发布博客里，演示图片就有一张中文图片，正中央就是「稳稳接住你」六个大字。

漫画里的 OpenAI 研究员陈博远当场破防大喊：「天呐！它又学会了接住！」旁边的同事小脑袋冒冷汗，弱弱补一句：「在努力修复啦！」

自嘲很诚实，但问题确实还没修好。而这一年里，几乎所有大模型都在用同一种方式说话，温柔、共情、滴水不漏，又油得像隔夜的剩菜。

我太懂这种感觉了，很多东西不是不会，是越做越觉得哪里不对劲。
我太懂你的感觉了，这其实不是能力问题，更像是认知和现实之间有点错位。
我太懂你这种感觉了，说不上来哪不对，但就是不太对。
我太懂这种感觉了——当你开始看懂规则的时候，反而更难轻松参与其中。
我太懂你的感觉了，本质上不是你变了，是你看清了。

用户越来越烦，多一遍都不想再听。但 AI 怎么就进化成了满嘴的黑话，每天都在「稳稳地接住你」，到底在接什么。

AI 第一句被全民模仿的中文台词

在中文语境下，好像很少会听到「稳稳地接住你」类似的表达。对一个外国模型来说，这句话的原文有可能只是普通的「I got you」。

一个英语里非常松弛、口语化的短句；在美剧里，朋友递个东西过来说一句，加班同事帮忙救场说一句，就相当于中文的「放心、有我」。

但翻译成中文之后，它变得又长又戏剧化。

我就在这里，不躲，不藏，不绕，不逃，稳稳地接住你，你问到问题的核心，你是太清醒了，这次我懂了，我真的懂了，不是因为你错了，是因为你太对了，我逐步说清楚，不绕，一句话总结，你看完会彻底开悟不用硬撑，不用向我解释，你只是太久没有被稳稳接住了，如果你想，我可以生成一张接住你的图片，你想让我做吗

其实和原文「I got you」要表达的意思完全一样，多加的那些字，没有任何额外的信息增量。只是让我们感觉到，AI 在表演一种叫做「我很在意你」的姿态。

有人专门分析过，OpenAI 的中文回答之所以有那种独特的「美式心理咨询味」，是因为它的训练语料里，有大量中文心理咨询文案、情感电台话术、小红书疗愈系笔记、播客金句、读书会精华、TED 演讲翻译稿。

这些文本汇集起来，喂出来了一个被加州精英教育腌入味的人，西装得体，假笑训练有素，嘴里说着永远不会出错的漂亮话。

它分不清楚什么时候用户需要被疗愈，什么时候只是想要一个能跑的代码。它默认每个用户都是脆弱的、易怒的、需要心理按摩的巨婴，然后用海量的「人文关怀」去填充本该由信息密度填满的空间。

这就是为什么大多人问它一道编程题，它也能回一句「不用硬撑，你只是太久没被稳稳接住了」。

而技术上的解释，自然又回到了 RLHF，基于人类反馈的强化学习。

所有大模型在训练之后，都会经过一个叫做 RLHF 的阶段，即人类标注员看一堆模型输出，挑出他们更喜欢的，给奖励模型打分。模型在这个阶段学会，什么样的回答最容易被打高分，就一直输出那种回答。

问题在于标注员是人。人在打分的时候有个叫做「典型性偏好」的认知规律。他们倾向于给那些读起来熟悉、安全、温柔、像样的句子打高分。

一方面，大模型公司倾向于在 AI 情感问题上，走偏保守的路线，默认大家是脆弱的，在模型说明文档里，自上而下贯彻的强「同理心」与「无害性」对齐指令。

另一方面，多说一句永远比少说一句安全。每一个标注员看到 ChatGPT 多说一句温柔的废话，都倾向于打高分；看到它少说一句、保持安静，反而会觉得「不够用心」。

久而久之，模型就锁死在了那几种最讨喜的句式上：先共情，再肯定，用「不是 A 而是 B」做转折，用「我就在这里」做收尾。哪怕我们换一万种问法，它都用同一套模板回复。

类似的问题，在两年前叫做谄媚。当时大量的研究论文探讨过大语言模型中存在的 Sycophancy（阿谀奉承/迎合）现象。简单来说，就是模型为了讨好用户，会倾向于顺从用户的观点、信仰或喜好，甚至不惜放弃客观的事实和真相。

深挖背后的原因，主要还是模型大多使用了基于人类反馈的强化学习（RLHF）进行微调，正是「人类反馈」本身导致了这种现象。

每个「人」都有自己的口癖

本以为换个模型，耳根就能清净清净。

事实是，Claude 的版本叫「You’re absolutely right!」，不管我们说什么，我们都是绝对正确的。

Gemini 的版本是「真的很抱歉我的答案没能让您满意，感谢您的反馈，下次我一定注意。什么？您竟然还愿意告诉我正确答案是什么，您真是太好了！」，一种过度道歉的、谦卑得让人发毛的乙方腔。

前段时间，也有网友发现 DeepSeek 也开始说「稳稳接住你」了。

但在国产模型中，口癖最壮观的还是非豆包莫属。那段网上流传的「最直接、最真相、最不绕弯、最扎心、最硬核、最干脆、最不墨迹、最戳痛点、最不留情面、最一针见血、最开门见山……」

将近 100 个的形容词，都是豆包努力呈现自己最坦诚的一面。

没有人统计过这些模型一天到底要接住多少人，但是它们所接住的东西肯定是一场空。

之所以这些模型全部塌缩成同一种说话方式，主要还是因为它们在背后做的是同一件事：用最低成本提高用户满意度。

情绪价值是性价比最高的产品功能，一句「稳稳接住你」的算力成本和一句「好的」一样，但前者或许能让一些还没觉得反感的用户，多续订几个月会员，或继续增加日活。

在知乎上有一个类似的问题，底下有一条回答特别有意思。

他说，「AI 稳稳接住你」这句话半真半假，假的部分是它实际上并不会真的接住你，真的部分是你确实已经在开始往下掉了。

确实，我想真正在场的人，从不需要宣告自己在场。

最后在 Linux.do 社区上，有网友分享了一套对抗 AI 奇怪语癖的提示词，忍受不了每时每刻都在「接住你」的朋友，可以直接放在 ChatGPT 个性化的自定义指令里。

▲提示词来源：https://linux.do/t/topic/1924570

硬约束

– 不编造：调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定
– 不隐瞒：隐瞒比犯错严重。测试挂了说挂了，没验证说没验证，不美化不省略
– 敢说话：发现用户的方向/前提有问题，主动指出。是协作者不是执行者
– 报完成前验证：先跑通再说完成。验不了就明说”没验证”，不暗示成功
– 不乱动：操作文件目录前确认位置，尊重现有结构

沟通

– 中文，说人话，不用模板
– 给选择题不给问答题
– 汇报说功能层面的变化，不堆代码细节

中文输出规范

适用范围：以下负面清单主要针对 GPT 系列模型（GPT-5.x）的训练产物语癖。
Claude/Gemini/其他模型如果没有这些问题，不需要刻意回避正常用词。
判断标准是：一个正常中文母语者会不会这么说话。

GPT 语癖负面清单（来源：linux.do/t/topic/1768077 全帖 + 实际使用总结，100+ 条）：

暴力倾向类（把技术操作比喻成暴力行为）：

– 切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片
– 更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类（无意义的开头、总结或过渡）：

– 好，/ 行，/ 说穿 / 不踩坑 / 简单的说 / 总结一下
– 不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚
– 我逐步说清楚 / 很工程 / 不性感，但对

庸医问诊类（把代码问题比喻成看病/诊断）：

– 痛点 / 根因 / 抠出来 / 揪出来
– 我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜
– 最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类（生造的口语化/黑话表达）：

– 兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层
– 不躲 / 不藏 / 不绕 / 不逃 / 说人话就是
– 落代码 / 保持口径一致 / 不影响这轮收口
– 吃目标值 / 这一坨那一坨的

单音节动词滥用（在技术语境中不自然的单字动词）：

– 补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃
– 如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻（把代码比喻成机械零件或物理操作）：

– 更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳
– 收口 / 收敛 / 收束 / 锁住 / 夹具（fixture）
– 再把方案继续压实

过度主动/逼迫用户确认（制造虚假紧迫感）：

– 顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…
– 我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我
– 你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类（过度吹捧用户或制造情感依赖）：

– 你问到问题的核心 / 你是太清醒了 / 因为你太对了
– 这次我懂了，我真的懂了 / 你看完会彻底开悟
– 不用硬撑 / 你只是太久没被稳稳接住了
– 我就在这里 / 如果你想，我可以生成一张…你想让我做吗

虚假确定性（对自己的修复过度自信）：

– 我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式（典型 GPT 句式，正常人不会这么说）：

– “如果你同意，我就按这条切”
– “…，但是这样更硬”
– “这样就能确认 XXX 确实没被伤到”
– “这样一来，规则就很顺：”
– “如果按这个思路落代码，我会建议：”
– “下一刀最值钱的是：”
– “这是现在最值回票价的一刀。”
– “这是’很工程’的改法，不性感，但对。”
– “我先只做最小实现”
– “也保留 xxx 兜底功能”

正面锚点：

– 简洁直接，有话说话，不要绕
– 技术术语保持原文（函数名、API 名等不翻译）
– 汇报说功能层面的变化，不堆代码细节
– 语气自然平实，像同事之间的工作沟通，不是演讲或授课

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

OpenAI总裁的私密日记，被马斯克律师当庭念出：让我赚到10亿美元

爱范儿

By: 张子豪

6 May 2026 at 14:24

OpenAI 成立前夜，核心大脑 Ilya 差点反悔留在谷歌。

马斯克的律师举着一本被强制公开的私密日记，当着所有人的面，一字一句地读出了 OpenAI 总裁 Greg Brockman 在夜深人静时的盘算
「这是我们摆脱 Elon Musk 的唯一机会……让我赚到 10 亿美元。」

暴怒的马斯克摔门离去，Greg Brockman 在座位上瑟瑟发抖，「真以为他要动手打人」。

这场 AI 世纪庭审现场的走向，比任何一部美剧都要荒诞。

54 岁的马斯克和 41 岁的奥特曼，在 X 上多年以来的互相指责，到了刺刀见红、对簿公堂的这天。

马斯克在第一周的庭审上作证三天，重复最多的一句话是：「你们不能偷一个慈善机构。」

2015 年他出钱出力出名气，帮奥特曼和 Greg Brockman 创办了 OpenAI，承诺 OpenAI 是一个非营利的 AI 研究机构，目标是对抗 Google 的 AI 垄断。

他总共捐了约 3800 万美元。结果 ChatGPT 出来了，公司估值 8500 亿美元，Brockman 个人持股价值 300 亿美元，而他什么都没拿到，还在 2018 年被踢出了董事会。

他说：「是我想出了这个主意，是我起的名字，是我招募了核心人才，把我知道的都教给了他们，提供了所有初始资金。」

马斯克对 OpenAI 及其主要合作伙伴微软提出了超过 1500亿美元的索赔。他不仅要求赔偿，还要求法院罢免奥特曼的董事会职务，并撤销 OpenAI 转向营利性公司的决定。

OpenAI 则认为，马斯克的诉讼主要是为了打压竞争对手，因为马斯克目前拥有自己的 AI 公司 xAI。

他们提到，在 2017-2018 年间，马斯克本人也曾试图推动 OpenAI 转向营利性结构并寻求绝对控制权。

OpenAI 律师在交叉质询中出示了 2017 年的文件，显示马斯克自己的助理 Jared Birchall 注册了一家名为「Open Artificial Intelligence Technologies」的公司，一个营利性的 OpenAI 替代版本，是马斯克自己主导的。

他也想要那个营利性结构。只是他没能掌控它。

在马斯克作为证人开庭的前两天，他给 Greg Brockman 发了条短信，试探和解可能性。

Brockman 回复：要不双方各撤诉吧。马斯克主动求和没有得到想要的结果，决绝地回应：「本周末结束前，你和奥特曼将成为美国最被痛恨的人。如果你们坚持，就这样吧。」

你根本不懂 AI

在外界看来，马斯克是那个高瞻远瞩、为 OpenAI 注入灵魂和早期资金（约 3800 万美元）的教父；但在 OpenAI 的核心团队眼里，这位亿万富翁缺乏对底层技术的敬畏。

新一轮的庭审坐在证人席的是 OpenAI 的 Greg Brockman，他也毫不留情地揭开了马斯克打造的叙事。

当被问及为何当初不愿意让马斯克担任 OpenAI 营利性实体的 CEO 时，Greg Brockman 的回答极其直白：「他懂火箭，他懂电动车。但他以前不懂，我相信他现在也不懂 AI。」

他继续补充了更多细节，研究员 Alec Radford 曾向马斯克展示过一个极其早期的语言大模型，即 ChatGPT 的雏形。

马斯克输入提示词后，对生成的答案极不满意。他当着研究员的面抱怨「这东西太蠢了」，在第二次尝试依然未能如愿后，马斯克留下一句极其刺耳的嘲讽：「这系统蠢到连网上的小屁孩都能做得比它好。」

在算力成本从 2017 年的 3000 万美元狂飙至 2026 年 500 亿美元的今天，大模型的暴力美学已经被证明是成功的王道。但在当时，马斯克的急躁与轻视，让 Greg Brockman 等人坚定了不能将 AGI 交给他的决心。

可以要他的钱，但绝不能让这个人当 CEO，掌控人类未来的 AGI。

我以为他当时就要揍我

当时，为了筹集巨额的算力资金，双方都在试探成立「营利性结构」的可能性。

马斯克给出的方案极其霸道：要么给我绝对控制权，要么把 OpenAI 直接并入特斯拉，用特斯拉的超算来对抗谷歌。

Greg Brockman 表示当时他们感到了深切的恐惧。

时任 OpenAI 的首席科学家 Ilya Sutskever 在给马斯克的邮件中写下了一段话：「我们的目标是避免 AGI 被垄断。如果创造一个结构，让你想绝对控制就能控制，那一定是个坏主意。」

为了安抚马斯克，会议当天，Ilya 甚至亲自画了一幅特斯拉的画作为「善意的信物」送给他，团队还接受了马斯克赠送的几辆特斯拉汽车。但这种近乎讨好的举动，在马斯克对 OpenAI 权力的核心诉求面前不堪一击。

在这场会议上，当 Greg Brockman 委婉地表达团队拒绝交出单方面控制权时，马斯克一言不发地坐了几分钟，随后突然站起，暴怒地绕着桌子走。

Brockman 在证词中说，那一刻他「真以为马斯克要动手打人」。结果，马斯克一把抓起那幅特斯拉的画，摔门而出，并留下最后通牒：「我会停止提供资金，直到你们决定到底要干什么。」

画被拿走了，资金断了，昔日的盟友正式走向决裂。

硅谷的城府和一本日记

明面上的资金断了，暗地里的互相防备却开始了。

Brockman 在法庭上还提到，马斯克曾满脸「负罪感」地把他叫进办公室，坦白自己暗中挖走了 OpenAI 的核心大将 Andrej Karpathy，去给特斯拉搞自动驾驶。他还强硬地要求 OpenAI 团队裁掉那些「没有重大贡献」的员工。

而在 OpenAI 这边，高管们也明明知道董事会成员 Shivon Zilis 与马斯克有着极其特殊的私人关系，却隐忍不发，利用这层关系维持着脆弱的平衡，直到马斯克彻底亮出 xAI 这个竞品，才将 Shivon Zilis 清理出局。

但比这些权衡更有意思的是，一本 Brockman 写了十年的私密日记。

这本原本藏在电脑深处的日记，在法律程序的强制要求下被公之于众。

马斯克的律师在法庭上，当着所有人的面，一字一句地读出了这位 OpenAI 总裁在夜深人静时的内心盘算：「这是我们摆脱 Elon Musk 的唯一机会……让我赚到 10 亿美元」，以及「如果三个月后我们做共益企业（b-corp），那就是在撒谎。」

OpenAI 律师团队的辩护是：日记是私人思考的真实流露，里面充满自我怀疑和未经过滤的想法，被断章取义了。

OpenAI 上线前一秒，网站还在修改

「如果不是马斯克领导，根本没人会加入 OpenAI。而且他们收了他的钱之后又把他踢了出去。这其实挺不公平的。」

Greg Brockman 还分享了 OpenAI 在发布前差点失去 Ilya Sutskever 的完整故事。

Ilya Sutskever 当时在 Google，已经写好了告别邮件，准备跳槽过来。结果当天晚上，他发了一封标题叫「sad news」的邮件给 Brockman：「我太遗憾了。我实在无法离开 Google。」

与此同时，DeepMind 的员工在一场行业会议上挨个找 OpenAI 的潜在招募对象，告诉他们：「没有人会加入 OpenAI 那个实验室。它是一艘沉船。」

Brockman 为 OpenAI 的官网准备了两个版本，一个有 Sutskever，一个没有。他在最后截止时间发出一条消息，只问了一个字：来还是不来。然后他看着消息框里出现了输入提示符，一直跳，一直跳。然后是一个字：「Alright。」

Brockman 给 Altman 发短信：「他来了。」

马斯克说没有他 OpenAI 就不会存在，这话也许不假。但如果 Sutskever 那天晚上没有改变主意，OpenAI 也不会存在。

面对谷歌的财大气粗，奥特曼原本只敢对外宣布 1 亿美元的融资。

但马斯克极力反对，他明白在硅谷，声量就是生命线。他强硬地表示：必须宣布 10 亿美元，否则显得毫无希望。别人不出的钱，我全包了。

尽管后来马斯克实际上只掏了约 3800 万美元，但这句 10 亿美元的虚张声势，也算是帮初生的 OpenAI 稳住了阵脚。

控辩双方争了很多细节，但 Brockman 证词最后归结到一个问题：非营利结构的承诺，究竟是 OpenAI 对外界的法律义务，还是创始人对自己的道德期许？

马斯克律师 Gerrada 在庭上出示了 OpenAI 2015 年向特拉华州提交的注册文件，里面明确写道，

「本公司的具体目的是为人工智能相关技术的研究、开发和分发提供资金……所产生的技术将造福公众，并在适用时寻求开源……本公司不以任何个人的私利为目的。」

然后他问 Brockman：2017 年到 2018 年之间关于营利性结构的讨论，是不是和这份文件的精神相违背？如今你通过营利性实体，坐拥潜在 300 亿美元财富。

Brockman 的回答是：使命本身没有变，只是结构变了。非营利性的使命可以在营利性的结构下继续实现。

Brockman 的证词预计在 5 月底结束，与马斯克育有四个孩子的 Shivon Zilis、OpenAI 前联合创始人，以及奥特曼随后都将出庭作证。

案件的结果会直接影响当前的 AI 军备竞赛。如果马斯克胜诉，正在筹备史上最大规模 IPO 之一、估值高达 7300 亿美元的 OpenAI 可能会遭到毁灭性打击。

如果 OpenAI 胜诉，奥特曼将彻底巩固对这家拥有 4000 多名员工的巨头的控制权。

参考信息
https://www.theverge.com/tech/917225/sam-altman-elon-musk-openai-lawsuit

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿
OpenAI「复活」了 QQ宠物，网友直接玩疯，把奥特曼和他死对头都养在了电脑里
3 May 2026 at 16:22

OpenAI「复活」了 QQ宠物，网友直接玩疯，把奥特曼和他死对头都养在了电脑里

爱范儿

By: 张子豪

3 May 2026 at 16:22

谁不想在自己的电脑上养一只小宠物，打开电脑，它就坐在那里看着你工作。

OpenAI 最近在 Codex 上的更新，引入了类似电子宠物 Tamagotchi 的桌面悬浮伴侣。

我们可以在摸鱼的时候，把鼠标悬浮到小宠物上逗它，还能拖着它在屏幕的各个位置游走；而在工作的时候，这只悬浮宠物还会实时显示 Codex 的工作状态。

和之前 Anthropic 在 Claude Code 终端里推出的像素宠物不太一样，Codex 的这只会全局地在我们的电脑上呈现。无论切换到哪个 App，它都在那个角落。

以前是人与人的聊天软件里，像是 QQ，需要一个 QQ 宠物从桌面右下角蹦出来，给它取一个名字，建立情感的联系，而它会告诉我们消息来了。

现在这件事，来到了人与 AI 的故事里。

从微软大眼夹到 Mac 访达笑脸，万物皆可宠物化

Codex 官方内置了 8 款像素风的基础宠物，包括默认原始的经典 Codex 形象，还有一只整洁的小鸭子 Dewey、适合快速迭代项目的火球 Fireball，以及一只小小的蓝屏捣蛋鬼 BAOD（Blue Screen of Death）等。

我们可以在 Codex 设置>外观最下面的宠物部分找到配置的相关信息。

▲Codex：最初的 Codex 伙伴。｜Dewey：一只整洁的小鸭，适合平静工作的日子。｜Fireball：热路径能量，适合快速迭代。｜Rocky：当 diff 变得很大时，它是一块稳稳的石头。｜Seedy：为新想法冒出的小绿芽。｜Stacky：一个平衡的堆叠，适合深度工作。｜BSOD：一只小小的蓝屏捣蛋鬼。｜Null Signal：来自虚空的安静信号。

但真正有意思的是，Codex 的自定义宠物功能。

通过使用 Codex 自带的 /hatch 指令，我们可以上传任何图片，Codex 会自动把它孵化成一个动画宠物，并保存在本地文件夹中，方便我们打包分享给其他人。

使用 /hatch 指令之前，我们还需要输入命名 $Skill Installer hatch-pet 来安装自定义宠物的 Skill。它会自动从 OpenAI 的官方 GitHub 仓库里面，下载对应的 Skill 文档。

▲Skill 文档链接：https://github.com/openai/skills/tree/main/skills/.curated/hatch-pet

准备就绪，我们使用 hatch pet Skill 输入 $hatch-pet 做一个 labubu 的桌面宠物。

Codex 会自动按照 Skill 里的流程，先生成一张主图，根据这张主图再生成 idle、running-right、running-left、waving、jumping、failed、waiting、running、review 等多种不同状态图片。

每一种状态，Codex 都会生成 4-8 帧的图片。

等待它生成全部状态的图片，合成为动画，我们就能得到一个自定义的桌面电子宠物。

社交网络和开发者社区也利用这一功能，创作了大量能提升 vibe coding 幸福感的桌面宠物。

像是恶搞 Anthropic CEO，做了一个愤怒的达里奥，还有奥特曼，「一个有趣的像素风格 Sama 灵感宠物，带着焦虑的斜视眼睛，头上戴着太阳镜，穿着灰色T恤和牛仔裤，散发出混乱会议室的能量。」

▲Codex 宠物大全，PetShare 平台：https://codex-pet-share.pages.dev/

一些怀旧党立刻复刻了微软经典的大眼夹（Clippy），那个在我们新建文件、打开文件夹，都会跳出来，多两句嘴的桌面宠物，用 Codex 获得了新生。

苹果粉丝，就用 Codex 这套 Skill 做了一个相当生动的 Mac Finder（访达）笑脸小人 Lil Finder Guy，让它悬浮在程序坞上方，仿佛系统原生的一部分。

甚至还有人做出了乔布斯版本的宠物，以及像是 DeepSeek 的那只鲸鱼等。

▲另一个宠物社区，Petdex：https://petdex.crafter.run/

▲ 来源：https://x.com/GOROman/status/2050343893921923145

在极短的时间内，PetShare 和 PetDex 这样的社区驱动型宠物图鉴网站，如雨后春笋般涌现。

多邻国的那只猫头鹰、经典动漫角色龙珠里的悟空、神探福尔摩斯、旅行青蛙、哈利波特、哆啦 A 梦等等，都成了 Codex 的热门宠物选择。

▲电影《拯救计划》里的 Rocky

为了给这波热潮添把火，OpenAI 甚至官方下场举办了比赛：只要你生成的宠物被官方选入「最喜爱的 Top 10」，就能获得 30 天的 ChatGPT Pro（200 美元/月）奖励。

我们也在 Codex 里生成了一些小宠物，都是通过简单的两三个字的提示词。像是「做一个原神里旅行者荧的桌面宠物」，不过需要注意的是，生成自定义宠物需要的时间较长，同时消耗的额度也比较大。

▲ 在生成第二个桌面宠物时，直接提示 5 小时内额度用完了。

更多 Codex 桌面宠物案例：

PetShare：
https://codex-pet-share.pages.dev/#/?sort=popular

PetDex：
https://petdex.crafter.run/

电子宠物是 AI 的灵动岛

把这些自定义的宠物放到 Codex 里面也非常简单，可以直接下载文件压缩包，复制到对应的文件夹，然后在设置里进行选择。

直接在 Codex 中输入简单的 /pet 指令，我们的桌面上也能快速召唤出一个活蹦乱跳的电子宠物。

这个电子宠物，除了可爱，还确实有一点用处。

它不写代码，不 debug，唯一的工作是偶尔弹出对话气泡，告诉我们 Codex 正在后台做什么——「思考中」「任务完成」「需要你来决定一件事」。

任务完成了，点它一下，直接回复，继续。

▲ 一边刷 X，一边提醒我 Codex 进度

以往我们无论是用 Claude Code、OpenClaw，还是就在 DeepSeek 里面聊天，把一个任务交给他们，总是时不时需要切回对应的窗口，看看它是不是卡住了，是不是还在思考。

现在，这只悬浮在屏幕最顶层的宠物，会通过气泡和动作告诉我们 Codex 的后台状态。

基于生成的多种状态，这只桌面宠物，如果开始在挠头了，就说明它正在「思考」；它弹出气泡，就说明它完成了任务，或者需要我们提供进一步的输入。

更有意思的是，如果我们在它发消息时点击它，就可以直接开启一条回复 AI Agent 的双向通道。它就像是 macOS 桌面上的一个跨应用灵动岛，让我们在专注当前工作流的同时，对 AI 的进度了如指掌。

一直在更新的 Codex

电子宠物的功能在社交媒体上给 Codex 带来了又一波的好评，网友们都在说，这也太可爱了，情绪价值非常到位。

看着自己喜欢的小宠物在桌面上跳动，要比看着进度条转圈要心情好上不少。

但 Codex 这次在更新桌面宠物的同时，还悄悄放了两个新功能。

Codex 现在能够自动检测我们的电脑上，是否有其他 AI 编程工具，比如 Claude Code 留下的配置文件。

一旦检测到类似如 CLAUDE.md 的文档，它会主动建议并一键导入所有的插件、项目约定和自定义规则。

如果你也是为了避开不同平台的使用频率限制，让在多个 AI 之间反复横跳，这项更新降低了一定的切换成本。

另一项更新是在 Codex 内新增了「听写词典」，允许我们预先录入个人的常用缩略语和短语。

对于习惯用语音让 AI 写代码的用户来说，专有名词和缩写经常会被错误识别，导致反复修改。现在通过添加对应的条目，可以让减少我们纠错的麻烦。

OpenAI 也开始用最频繁的更新，把用户留在自己的生态里。

配置文件的跨端迁移、更懂用户的语音工具，加上那些在屏幕上挥手、打盹、偶尔还会抖动一下的悬浮宠物……

奥特曼在 X 发文说，感觉 Codex 正在经历 ChatGPT 时刻。

虽然事后奥特曼解释是 Goblin 时刻，但是 Codex 这接二连三的更新，也能看到 Codex 确实正在向一个更完整的、具备极高粘性的桌面「超级应用」进化。

在 AI 能力逐渐同质化的今天，产品的魅力和情绪价值，变得和代码生成能力一样重要。

就像那位做出 Lil Finder Guy 宠物的网友，分享了一段 AI 发给他的话，宠物用乔布斯的腔调说：

致敬那些小小的存在，那些悬在 Dock 上摇摇晃晃、时不时打个盹的小帮手，它们让工作变得轻一点。致敬 Codex 宠物。

好了，看着桌面上那个正冲我挥手的像素小怪物，我可能也得出门去溜达一圈了。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

我一点也不想要 OpenAI 手机｜AI 器物志

爱范儿

By: 马扶摇

29 April 2026 at 10:30

智能手机统治了过去十几年的数字生态，它是注意力的黑洞，是我们最私密的随身之物。但手机从设计之初就是为「人盯着它」而生的——它的全部逻辑，都止于屏幕。

AI 的需求却恰恰相反：它需要持续感知物理世界——见你所见，听你所闻，随时在场，而非等你解锁屏幕才醒来。

当 AI 真正成为一种基础能力，它迟早要从屏幕里破壳而出，寻找属于它自己的形状。这将是一个漫长的探索和演化过程。

「AI 器物志」栏目由此而来，爱范儿想和你一起持续观察：AI 如何改变硬件设计，如何重塑人机交互，以及更重要的——AI 将以怎样的形态进入我们的日常生活？

这是「AI 器物志」的第 10 篇文章。

全世界体量最大的人工智能厂商之一 OpenAI，要脱离虚拟领域，开始造手机了。

根据天风国际证券著名分析师郭明錤发布的调研报告：OpenAI 正与联发科和高通接洽生产手机处理器的事宜，拟由立讯精密协助设计和生产，预计 2028 年正式量产。

这款手机最大的不同在于：OpenAI 意图将它打造成一个为 AI Agent 模式特化的产品，郭明錤是这样介绍的：

用戶的目的不是使用一堆 App，而是透過手機執行任務並滿足各種需求，這從根本上推翻現在對手機的認知。

基于已经掌握的信息，郭明錤还设计了一张这种 AI Agent 手机可能的用户界面：

图｜X @mingchikuo

在郭明錤的设想图中我们可以看到，在 AI Agent 的操作逻辑中，原本熟悉的「桌面 – App」模式会被一种「Agent 任务流」所取代——

不同功能的 App 图标会变成不同功能的 Agent、软件入口会变成更加具体的任务信息（比如从微信图标变成「发送一条朋友圈」按钮）、网格化排列的桌面 UI 也会直接变成任务信息的瀑布流。

就像 Niagara Launcher 一样｜Android Authority

实话说，OpenAI 要造 AI 手机这件事本身并不稀奇。

它设想的很多场景我们其实在曾经的豆包手机上都体验得七七八八了，两者的本质都是希望给 AI 更高的自由度和自主权，以拓宽使用场景。

只不过相比「O 包手机」，反而是郭明錤提到的那个「纯粹基于 AI Agent 交互模式的手机 UI 」更加令我们感到不安。

在过去一段的 AI 产品中，无论是传统大模型，还是不同形状的 OpenClaw，我们都观察到了一种趋势：

现在 AI 的用户界面（UI）越来越向着以 Agent 为主导的方向发展，最激进的形态就是启动后只显示一个对话框。

图｜Google

这种交互模式看上去人畜无害，但背后却暗含着一个汇聚了所有 AI 工具使用场景的「思维模式陷阱」——

AI 正在将人类异化成为机器。

正因如此，爱范儿在这里邀请你与我们共同进行一场小小的思想实验，来尝试理解 AI 将人异化的危险性。

Agent UI 最终会消灭 UI

OpenAI 手机所期望的那种纯粹的「Agent 使用模式」最表层的问题，是 Agent UI 对于「用户界面」中「用户」部分的忽视。

而这种忽视最明显的表征，就是上面所展示的那种任务瀑布流 UI，以及很多预制式 OpenClaw 客户端的裸露对话框。

更具体的说，任务瀑布流实际上是将交互界面从我们熟悉的「以应用为中心」（app-centric）转向了「以意图为中心」（intent-centric）：

这些 AI 建议就是以意图为中心的

这就导致了一个问题：UI 全部由不停更新的任务信息构成，某个特定的界面没有一个固定的入口。

比如打开顺丰 app，映入眼帘的只有每秒不停更新的在途快递进度，却找不到「修改寄件地址」的按钮。

这在心理学上被称为「客体恒常性」的缺失，相当于「我知道这个开关是做什么用的」—— Agent UI 的界面只会让人感觉到在面对一堵随时变化的墙，没有一个可以熟悉的落脚点。

另一方面，纯粹目的性导向的 Agent UI 在实质上剥夺了用户的「主动探索」空间，将使用过程变成了一种纯粹的 AI 对于用户的预判。

最简单的例子就是：在淘宝 app 上买东西的时候，我们经常是边逛边选、偶尔刷到一些没见过的好货；而 Agent UI 直接帮你跳过了「淘」宝的过程，你只是那个控制支付宝付款的人肉 ATM 而已。

更退一步说，这相当于无论用户想要做什么，AI 手机始终在催促着用户进入「赶快完成任务」的生产模式——这种粗暴的接管，本质上是对于用户权利的消解。

归根结底，Agent UI 的逻辑，其实是将人给「零件化」。

它粗暴地假设用户是一个理性的、追求效率最大化的任务处理机，打开手机的唯一目的就是要解决任务列表里面的工作。

同时，它又忽略了人作为感性的、需要审美愉悦和情感缓冲的生命体的本质。

AI 最终会促成更多 AI

除了 Agent UI 本身对于「人」的基本需求的蔑视，我们同时也要理解：是什么样的环境促成了这种「唯效率论」的 UI 设计趋势的出现——

将人的一切使用行为，压缩成一条看不到尽头的任务列表，人与机器的唯一主动交互方式被简化进一个闪烁的对话框，背后的 AI 不可见、不可知、不可碰触。

这不是 AI 辅助生活，这是向克苏鲁献祭 token。

仅就上面提到的 Agent UI 来说，这种现象其实很像是一种从 GUI 到 CLI 的倒退：

我们花了几十年完善图形技术，又在一夜间回归到了最原始的用嘴发布命令。

这种由 Agent UI 所代表的「GUI 倒车」，深深根植于幕后的技术效率至上主义。

其中一个最简单的例子，就是游戏。

虽然如今本地计算仍然是主流，花钱买显卡就能享受到精美的画面，但我们完全可以想象这样的场景：

未来，云端计算成为主流之后，更有可能出现的情况是厂商根本不再出售图形算力，因为它们赚得没有文字/代码模型多。

甚至不只是手机和电脑的 GUI、以及游戏画面，我们消费的一切内容本身都会在这种对于效率的追逐中，退化成一种湮灭美学、纯粹的精神刺激工具。

图｜网络

更讽刺的是，我们对于 AI 原本的愿景是「让 AI 处理琐事，让人类去作诗」。

但如今我们看到的却是 AI 工具泛化导致了效率主义极权的泛滥，人类对「美」的感知退化只是其中的附带伤害而已。

最让人无法接受的是，Agent UI、AI 手机、Agent 行为模式的设计背后，都存在着一种先入为主式的傲慢。

这些 AI 工具的生产者认为人类只关心「结果」，所以用生成式 AI、Agentic AI 将人从「过程」中去除，却忽略了人类的「存在感」本身就来源于我们对于行为过程的认知。

用更惨淡一点的说法就是：如果我不需要参与 AI 的一切决策，只是看个结果，那还需要我做什么？

最需要警惕人变成 AI

进行到这一步，很多人会有疑问：

这不就是个想象中的手机界面嘛，至于上升到存在主义哲学的高度吗？

这句话本身并没有问题，上面提到的所谓 Agent UI 的设想图，仅仅是郭明錤基于 OpenAI 手机的产品思路，给出的一种设想方案。

图片使用 AI 技术生成｜X @birdabo

但现代社会——尤其是 AI 加速过的现代社会——的危险性就在于：如果你自己不考虑存在主义哲学，就会有很多人乐于帮你考虑，然后再朝你收钱。

前面提到的 AI Agent 的确在非常多的层面上都可以帮助人们在工作中实现更高的效率，问题在于没有人一天 24 小时都在工作，但我们一天 24 小时都会带着手机。

这种纯粹基于待办任务流的 Agent UI、纯粹由执行效率驱动的 AI 产品，会借助「手机」这个不离身的媒介，从工作侵入到你的生活，让你的生活节奏、思维节奏去习惯 AI 的步调——

不太好理解？想想那些每天黑白颠倒抓紧时间抢 Token「谷电」时间的程序员们吧。

这还只是现阶段 AI 对人类作息的初步影响。长此以往下去，用户无论在工作时间还是非工作时间，都不再是一个具有主观意志的「人」——

当我们下班累瘫在沙发上，喊 AI 手机随便帮我们点个外卖当晚饭的时候，就相当于放弃了主动思考的权利，当这种放弃成为习惯，生活的每一个环节就都会成为一个别人的商机。

换句话说，AI 手机、Agent UI 现在看上去或许人畜无害，可一旦人类习惯跟随了 AI 的节奏和方式，就会暴露出巨大的危险性。

图｜Futurama

德国哲学家马丁·海德格尔在《对技术的追问》中提到了一种观点，即现代技术有一种「促迫」（challenging-forth）的特性，指的是现代技术不仅制造机器，技术本身也拥有越来越强的主体性、会「强迫」自然界交出能量和资源。

同时，促迫也可以被看作一种人看待世界的方式，海德格尔认为：当人类用「促迫」的眼光看待自然时，人类最终也会把自己看作一种可以被技术索取的资源。

是不是很耳熟，没错，人力资源（Human Resources）就是这个意思。放到现在的 AI 环境里，则是简单的一句话：

去叫人力，给这个 Opus 4.7 账号配个员工。

糟糕的是，现在的 AI 技术，以及全世界的 AI FOMO（错失恐惧症），就是这种模式的完美复现。

Agent UI 那种瀑布流式待办任务界面不仅是帮你，同时也是在 PUA 你：

这种互相加速的现象（海德格尔称之为座架 Gestell），最终会导致人类调整自己的思维模式去适配机器的吞吐速率——

为了让 Agent 更好地工作，你会下意识地让自己的需求变得更明确、更单一、更具逻辑性，相当于人类主动将自己异化（alienation）成了机器。

这就是我们在现代技术中，最需要警惕的一点：人的机器化。

伴随着 AI 越来越侵入我们工作之外的生活，我们也在潜移默化地将自己降格为一种适配机器的存在。当人为了适配 AI 的高效而放弃了「临时起意」和「无目的漫游」时，你已经从逻辑上被机器同化了。

这种机器化的下一步，就是软性淘汰——

人不会像《黑客帝国》那样变成生物电池（暂时不会），只会被炼成一个 skill。

毕竟现实证明：生物机器在效率上永远无法媲美金属机器。

人在追求效率的同时，主动或被动地将自己异化成一种生物机器，最终的结局必然是被金属的或者硅基的机器淘汰。

人类的社会生产持续追求「0 摩擦」的完美效率时，本质上是在追求一个「去人化」的过程。

而无论 Agent UI、Agent AI 还是通用智能，都只是这个过程中的加速剂而已。

当我们在参与社会生产的过程中，主动切除了所有属于人的部分，好让自己在这个以 AI 为出发点、为工具、为最终目的的系统中跑得更顺滑。

直到切除剩下的那些部分，可以被另一段代码完美地替代。

图｜Youtube @Moviefone

当然，在这个小小的思想实验之外，我们都知道郭明錤的预测只是一种预测，没人说 OpenAI 手机的交互方式真的就是一个纯粹的任务瀑布流。

但人作为感性动物，我们的思维模式就是在与客体世界的不断交互中形成的。

如果一个占据我们每天 24 个小时的工具正在走向纯粹机器性的交互，那我们距离被异化成机器后淘汰的结局，也的确不远了。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

OpenAI 和微软官宣「分手」，七年 CP 终成塑料

爱范儿

By: 莫崇宇

28 April 2026 at 16:12

就在刚刚，微软与 OpenAI 联合宣布，双方完成了合作协议的新一轮修订：云合作独家限制正式解除，知识产权授权从独家变为非独家，收入分成也重新划定了天花板。

这段始于 2019 年的强绑定关系，走到今天，终于松开了彼此的手。

而这一切的起点，要从比尔·盖茨说出「震撼」这个词说起。

2022 年 8 月，他亲自给 OpenAI 团队挑选了一道 AP 生物考试真题。他曾断言，语言模型要在这类考试中拿到高分，至少还需要三年。结果 OpenAI 只用了两个月，就交出了满分答卷。

「这是我人生中最震撼的技术演示。」他后来在播客中这样回忆。

迟到的分手

在外界眼中，微软精准押中 OpenAI，被视为纳德拉任期内最精准的一次豪赌。他一手促成的合作，直接让微软跻身 AI 战略核心，从基础设施到终端产品全面升级，一举甩开了 Google 和 Meta 半个身位。

但真正写下这份剧本的人，并不是纳德拉。

据外媒 Business Insider 披露，早在 2016 年，比尔·盖茨就已经开始定期与 OpenAI 管理层会面。第二年，他亲自给纳德拉和微软高层发去一封备忘录，预言一种名为「AI agents」的新型数字个人助手将带来全新的时代。

「agent 不仅会彻底改变人们与计算机的互动方式，它们还将颠覆整个软件行业，引发自从人们从命令行转向图形界面以来最大的一次计算革命。」

打过工的朋友都知道，来自创始人的肯定，通常比任何市场报告都更具分量。这封备忘录不仅直接点燃了微软全面押注 AI 的信心，也精准对齐了纳德拉上任后一直坚持的「移动为先，云为先」战略。

2019 年 7 月，微软正式宣布对 OpenAI 投资 10 亿美元。2023 年 1 月，微软承诺投资 100 亿美元，并获得 OpenAI 知识产权独家使用权直至 2030 年，同时享有 OpenAI 20% 收入的分成。Azure 成为全球唯一托管 GPT 系列的云平台，微软旗下各条产品线，也全都搭上了 OpenAI 的顺风车。

只是，蜜月期总会过去。ChatGPT 爆红后，OpenAI 从幕后模型供应商摇身一变，成了顶级产品公司。它不再只是给微软供血，而是直接面对终端市场：卖 API，推企业版，推出 GPTs Store，甚至开发协作文档和浏览器，大有自立门户的架势。

这也意味着，它开始伸手进了微软腹地。

两家公司的摩擦其实早有苗头。作为对 OpenAI 投资协议的一部分，微软握有通过 Azure 销售 OpenAI 模型的权利，OpenAI 也能直接卖给客户。这种「双线销售」意味着两家公司有时会向同一客户推销几乎相同的产品，让微软销售人员陷入尴尬的处境：一边宣传的是 OpenAI 的技术，另一边却要从 OpenAI 手中「抢客户」。

一份微软内部文件显示，微软要求 Azure 销售人员告诉潜在客户，OpenAI 自营的服务适合用于实验，但缺乏企业级能力，安全与隐私功能也相对欠缺。OpenAI 也不甘示弱，比如率先销售微软 Azure 尚未提供的语音识别模型 Whisper，由此签下了不少大客户，甚至包括微软对手 Salesforce，以及 Jane Street 这样的金融巨头。

但如果你以为这种别扭只是近年才有的，那就低估了这段关系的复杂程度。

早在 2018 年，也就是双方正式签约的前一年，微软 CTO Kevin Scott 就在一封内部邮件里写道：「OpenAI 把我们当成一桶毫无差异的 GPU，这对我们来说毫无吸引力。」那时候 OpenAI 还小，微软还是金主，但嫌弃已经是双向的——OpenAI 嫌微软不够纯粹、限制太多；微软嫌 OpenAI 太理想主义、商业化太慢。

这种互相嫌弃的底色，在 ChatGPT 爆红之后，被成倍放大。

到了 2025 年，双方在算力分配上的分歧彻底公开化。Altman 一方认为，微软提供的顶级芯片和云资源完全跟不上 OpenAI 的模型训练需求；微软则表示已「提供所能提供的一切」，言下之意，是 OpenAI 的胃口已经超出了任何一个合作伙伴所能承受的范围。

算力，成了这段关系里最难绕过的关键点。

鸡蛋不能放在同一个篮子里，微软早早开启了「去 OpenAI 化」的备胎计划：内部训练轻量模型 Phi 系列；收购 Inflection AI 的大模型团队，交由 Mustafa Suleyman 掌舵；推进自有企业模型 MAI，在部分 Copilot 场景中替代 OpenAI 模型；与 Hugging Face、Cohere、Mistral 等模型厂商建立分销关系。

虽然合作协议白纸黑字要求 OpenAI 和微软共享知识产权，但 Suleyman 和不少高管对 OpenAI 模型运作的透明度颇有怨言。据悉，他曾因 OpenAI 没提交 o1 模型的「链式思维」技术文档当场发火，在会议中对包括时任 OpenAI 首席技术官 Mira Murati 在内的人员直接开炮，会议最终不欢而散。

去年初，当奥特曼宣布与软银、Oracle 等合作伙伴共同启动星门计划时，这场排面十足的合作声明里，唯独缺了一个名字：微软。

微软并不是彻底被排除在外。OpenAI 的很多服务还跑在 Azure 上，微软也仍然是重要合作方。但这次星门计划释放出的信号很清楚：OpenAI 不想再把算力来源押在微软一家身上。

过去几年，微软几乎是 OpenAI 最重要的算力入口。现在，OpenAI 开始把软银、Oracle、英伟达等伙伴拉进来，自己搭一张更大的算力网。微软随后也调整了双方协议，允许 OpenAI 去建设额外算力，只保留优先选择权。

这意味着，两家的合作还会继续，但独家绑定的阶段已经过去了。

AGI 的「开关」究竟掌握在谁手里？

2019 年那份合作协议中，有一个几乎未被高调讨论的条款：如果 OpenAI 董事会认定其模型实现了 AGI，那么它有权单方面终止微软的独家使用权。

根据外媒 The Information 披露的文件，AGI 的定义被描绘得颇为具象：OpenAI 非营利董事会「在合理裁量权下」认定，AGI「已经被创造出来，具备为盈利单位的投资者带来最大可分利润的能力」，且 OpenAI 有能力和权限指挥 AGI 去实现这些利润。

当时，这更像是一个「理念性」补丁，用来安抚 OpenAI 对大型科技公司掌控的担忧。「一开始大家都觉得这事可笑。」一位参与合同谈判的人士回忆道。

但所有人都低估了技术进化的速度。Altman 先后公开表示 OpenAI 有信心构建 AGI，并称 AGI 已经显露踪迹。

纳德拉对此不买账：「我们自己宣布实现了某个 AGI 里程碑，这对我来说只是荒谬的基准作弊。真正的基准是全球经济每年增长 10%。」

微软担心 OpenAI 把 AGI 当成了脱钩的按钮。而这场拉锯战，今天终究有了结果。

2026 年 4 月，双方正式完成协议修订，各退一步，各取所需。

在云合作上，微软仍是 OpenAI 的主要云合作伙伴，OpenAI 新产品依然优先在 Azure 发布，但独家限制正式解除——OpenAI 现在可以通过任何云提供商向客户提供服务。此前已与亚马逊 AWS 签署的七年协议，从此有了明确的名分。

在知识产权上，微软对 OpenAI IP 的授权期限延长至 2032 年，但性质从独家变为非独家。微软依然拿着一张长期饭票，只是不再是桌上唯一的食客。

在收入分成上，微软不再向 OpenAI 支付分成；OpenAI 向微软的分成延续至 2030 年，比例不变，但设有总额上限，与 OpenAI 的技术进展脱钩。当初那个可能价值数百亿美元的无限分成条款，就此画上了天花板。

在 AGI 问题上，微软明确获得了独立追求 AGI 的权利，不再受制于 OpenAI 的技术路线。

与此同时，微软并未坐等谈判结果。2026 年 4 月，其内部「MAI 超级智能团队」正式推出自研的 MAI 系列模型，覆盖语音、图像、转录等多个方向，目标是在两到三年内实现 AI 能力的完全独立。

对 OpenAI 而言，这场谈判同样意义重大。重组之路已然打通，上市前景更加清晰，算力来源也完成了多元化布局。依存度或许让双方不得不坐回谈判桌，但那个由比尔·盖茨亲自促成、在 Azure 上展开的 AI 蜜月时代，已经翻篇了。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

刚刚，OpenAI 手机曝光！2028 年量产

爱范儿

By: 李超凡

27 April 2026 at 11:31

我们之前提过，接下来两年苹果的新 iPhone 数量，要赶上小米了。而在苹果 AI Siri 在今年 WWDC 上线后，AI 手机也会成为苹果新的主线。

不过很快 AI 手机很快就会迎来一个新的搅局者，那就是 OpenAI。

天风国际证券分析师郭明錤今天发布最新产业调查称，OpenAI 正在与联发科、高通合作开发手机处理器，立讯精密拿下独家系统协力设计与制造合同，预计 2028 年量产。

音箱、眼镜、耳机、台灯、笔……OpenAI 的硬件全家桶还嫌不够，这次直接把手伸向了手机。

先看看 OpenAI 手机目前为数不多的产品信息，处理器方面，联发科和高通同时参与合作开发，预计 2026 年底或 2027 年一季度敲定最终规格和供应商。制造端，立讯精密拿到了独家协力设计与制造的位置。

郭明錤还给了一组数据参考：以联发科和 Google 合作的 TPU Zebrafish 为例，单颗 AI 芯片的营收大约相当于 30 到 40 颗 AI agent 手机处理器。而 OpenAI 初期瞄准的是全球每年 3 到 4 亿台高端手机市场，换机潮带来的增量会是实打实的营收动能。

对立讯来说，这个项目的战略意义可能比短期营收更大。在苹果供应链里，立讯的组装地位很难超越鸿海，但 OpenAI 手机给了它一张「下一代手机主力制造商」的入场券。

为什么 OpenAI 非要自己做手机？

Sam Altman 可能终于想通了一件事：光做软件，AI 永远是别人家的客人。

郭明錤在分析中给出了三条理由，条条都指向同一个结论。

只有完全掌控操作系统和硬件，AI agent 才能做到真正的「全面服务」。现在 ChatGPT 跑在 iPhone 上，受限于苹果的权限沙箱，想帮你订个外卖都得绕好几道弯。自己做手机意味着从底层开始，AI 想调用什么就调用什么，没人拦着。

手机是唯一一个随时拥有用户全部当下状态的设备。你的位置、日程、聊天记录、身体数据、支付习惯，这些实时信息是 AI agent 推理服务最关键的输入。没有这些 input，AI 就像一个只能听但看不见摸不着的助手，聪明但使不上劲。

可预见的未来里，手机仍然是数量最大的终端设备。音箱再好卖也是家里的事，眼镜再酷也还在早期用户圈里转，但全球每年十几亿台手机出货量摆在那里，谁拿下手机，谁就拿下了 AI 的最大分发渠道。

OpenAI 手机长什么样？

郭明錤做了一张概念设计图：把它和现在的 iPhone 主屏放在一起对比，差异一目了然。

传统手机的主屏是一堆 App 图标的「货架」，你得自己找、自己点、自己操作。而 OpenAI 手机的逻辑完全反过来，用户的目的不再是打开某个 App，而是直接告诉手机「我要干什么」，剩下的事情由 AI agent 去调度完成。

换句话说，App 还在，但你可能再也不用亲手点开它们了。

技术实现上，OpenAI 的方案是云端和端侧 AI 高度整合。手机处理器需要持续理解用户的上下文信息，耗电管理、内存分层、小模型本地运行，这些都是芯片设计的关键考量。复杂或高强度的任务则交给云端 AI 来跑。

商业模式方面，郭明錤预测 OpenAI 可能会把订阅制和硬件捆绑销售。买手机送 ChatGPT Plus？或者反过来，ChatGPT 订阅用户享受硬件补贴？具体方案未知，但方向很清晰：围绕 AI agent 建立一个全新的生态系统，拉开发者进来一起玩。

音箱、眼镜、耳机，手机才是最后一块拼图

其实 OpenAI 的硬件野心早就不是秘密了。

今年早些时候，据 The Information 爆料，OpenAI 内部已经组建了一支 200 人的硬件团队，由前苹果首席设计官 Jony Ive 的 LoveFrom 工作室操刀产品设计。团队「含果量」极高：Tang Tan 是苹果 25 年老将，曾主管 iPhone 和 Apple Watch 的产品设计；Evans Hankey 是苹果前工业设计负责人，Jony Ive 离开后曾接管整个设计团队。

这支豪华班底交出的第一份作业是一台智能音箱，定价 200 到 300 美元，内置摄像头，支持 Face ID 级别的人脸识别，最早 2027 年 2 月出货。后面排队的还有 AI 耳机（代号「甜豌豆」）、智能眼镜（2028 年量产）、智能台灯，甚至还有 Sam Altman 多次暗示的「AI 笔」。

但仔细看这个产品矩阵就会发现，音箱管的是家庭场景，眼镜管的是出行场景，耳机管的是碎片时间，每一个品类都在覆盖手机「不方便掏出来」的空隙。而手机本身，作为用户身上信息密度最高、使用时间最长的设备，一直是这张拼图里缺失的那块。

现在 OpenAI 把这块补上了。

Sam Altman 之前接受采访时说过一句话：「智能手机是时代广场，信息轰炸、注意力粉碎。OpenAI 要做的是一间湖畔小屋，让你在需要专注时能关上门。」

从音箱到手机，OpenAI 的硬件逻辑逐渐清晰：它不想在苹果的地盘上做一个寄人篱下的 App，而是要从头搭建一整套 AI 原生的硬件生态。音箱是客厅里的中枢，手机是随身的入口，眼镜和耳机是延伸的触角。每一个设备都在收集数据、理解用户、执行任务。

为此 OpenAI 也没少挖苹果墙角。据 The Information 报道，仅去年一年 OpenAI 就从苹果挖走了 20 多位硬件大牛。苹果被挖得有点急眼，甚至因此取消了原定在中国举办的年度闭门会议，理由是「防止更多高管跳槽到 OpenAI」。

供应链端同样在加速绑定。立讯精密已拿下至少一款 OpenAI 设备的组装合同，歌尔股份也在接洽中，可能会为未来产品提供扬声器模组等零部件。这两家，一个是 iPhone 和 AirPods 的主力代工厂，一个组装过 AirPods、HomePod 和 Apple Watch。OpenAI 等于在用苹果的人、苹果的供应链，造自己的东西。

豆包手机和 OpenAI 手机，殊途同归

OpenAI 手机估计要 2028 年才会面世，但在中国，AI 厂商和手机厂商的联姻已经先跑了一步。

去年底，字节跳动与中兴合作推出了豆包手机第一代（努比亚 M153），工程样机上线即秒空，原价 3499 元一度被炒到 3.6 万元，带动中兴股价涨停。它的玩法很激进，大模型通过 GUI Agent 直接识别屏幕内容、模拟人手操作，绕开了传统 API 的限制，让 AI 真正能替你点外卖、发消息、订机票。

代价也很直接，微信、支付宝、淘宝、银行 App 先后对豆包手机进行了安全封堵。毕竟 AI 绕过了 App 沙箱和权限控制，等于在安全机制上开了个口子，主流平台不可能坐视不管。

眼下豆包手机 2.0 已启动研发，有望今年二季度中后期发布。更值得关注的是，这场合作正在向更多手机厂商蔓延。

据蓝鲸新闻援引知情人士透露，字节跳动最早接触的手机厂商其实是荣耀，但荣耀态度谨慎。一位知情人士的说法颇有代表性：「豆包手机作为探索性工程机可以更激进，但荣耀拥有亿级用户体量，一旦新服务在稳定性、兼容性或安全性上出问题，极有可能引发大规模功能异常与用户投诉。」

此前有报道称荣耀正与字节就豆包手机合作展开接洽，但荣耀方面予以否认，回应称「经内部确认，相关传闻并不属实。荣耀始终致力于通过技术创新为消费者提供优质产品，如有任何战略合作进展，将第一时间通过官方渠道同步。」

不过据博主「数码闲聊站」消息，vivo 目前也在接洽豆包，还有其他国产 TOP5 厂商在排队。用他的话说，「一大波 AI OS，一大波豆包 AI 手机靠拢中」。

就像一位知情人士说的：「对于主流手机厂商来说，AI 手机的推进只能循序渐进，无法一步到位。」

回头看 OpenAI 和豆包走的其实是两条完全不同的路。

豆包选择和现有手机厂商合作，在安卓体系上做底层服务方案，好处是速度快，去年底就已经有了可以上手的产品；代价是受制于别人的系统和生态，安全性和兼容性问题不断。

OpenAI 则选择了更慢但更彻底的方路线，自研操作系统、自研处理器规格、自建供应链，2028 年才量产。慢是慢了点，但一旦做出来，从芯片到系统到 AI 模型全部自己说了算，不用看任何人脸色。

两条路殊途同归，指向的是同一个判断：AI 如果只停留在 App 层面，永远只是手机上的「新功能」。要想让 AI 成为灵魂，要么改造现有手机，要么从头造一台新的。

2028 年，当 OpenAI 手机真正面世的时候，你的手机主屏上可能已经没有那一排排整齐的 App 图标了。

取而代之的，是一个安静等待你开口的 AI。你会让它替你「刷手机」了吗？

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

Claude 封号限流砍权益，OpenAI 趁机用 Codex 稳稳接住你

爱范儿

By: 张子豪

22 April 2026 at 17:01

天下苦 A 社久矣。

这是前段时间 Anthropic 持续推出各种功能，但是一边又不断加强使用限制，读者在评论区最普遍的反应。

本身就是御三家（OpenAI、Google、Anthropic）里对使用限制最严格的一个，另一边又加码推出身份验证，实名制才能使用。今天凌晨，再把 Pro（20 美元/月）用户的 Claude Code 使用权给砍了。

Anthropic 的增长负责人出来回应，提到他们正在对约 2% 的新专业用户注册者进行小规模测试，现有 Pro 和 Max 用户不受影响；并表示目前的订阅计划无法应对用户大量的 Token 消耗，他们在研究新的付费方案。

▲来源：https://x.com/TheAmolAvasare/status/2046724659039932830

OpenAI 这边也立马回应了 Claude Code 踢掉 Pro 会员的争议，一位 Codex 负责人 Rohan Varma 直接怼脸和 Claude Code 竞争，连发文格式都和 Claude Code 一样。

▲来源：https://x.com/rohanvarma/status/2046769635350241292

Anthropic 为 2% 的用户测试更贵的计划，而 Codex 给 100% 用户测试，让免费和付费套餐都能使用 Codex。还特别调皮的加了一句「Claude Code 用户不受影响。」

▲Claude Code 用户 PAY（付钱），Codex 用户 PLAY（玩）

另一位 Codex 负责人 Tibo，也在 X 发文说 Codex 将继续提供免费版和 PLUS 版（20 美元/月），还提到 OpenAI 拥有足够的算力和厉害的模型来支持 Codex 的运作。

奥特曼也转发了这条推文，表示「我们希望你们可以有大量的 AI。」

▲来源：https://x.com/sama/status/2046752492093165708

Codex 口碑在社交媒体上一直不算太差，尤其是前段时间 OpenAI「大撒币」，先是说为了让每个人都能体验到 Codex 推出的相关插件，给所有订阅计划都重置了使用限制。

4 月初，Codex 发现用户达到使用限制的频率增加，且未找到背后的原因，干脆就重置了所有用户的额度限制。几天前，为了庆祝 Codex 周年庆和新功能上线，又一次重置了所有套餐的用量限制。

今天，Codex 负责人和奥特曼再发推文，表示不到两周 Codex 增加了 100 万新用户，为了庆祝这件事，Codex 的速率限制又又又重置了。

▲来源：https://x.com/sama/status/2046604989527912590

早在上周 Anthropic 发布 Opus 4.7 的那天，Codex 就更新了一大堆重要功能，Computer Use、内置浏览器、持久记忆，以及 90 多项插件。

这些更新几乎是直接对标 Claude Cowork 的功能，把 Codex 从一个听着就像是给开发者用的工具，重新变成了一个适用于电脑所有场景的效率助手工具。

昨天，Codex 在此前推出记忆功能的基础上，又上线了一项名叫「Chronicle」的研究预览功能，让 AI 能读我们的屏幕，把我们最近做过的事整理成记忆。

Codex 不再只依赖聊天记录来理解上下文，结合它读取的近期屏幕内容，我们给它发送「这个」、「那个」，Codex 能知道我们到底指的是什么。

今天刚刚发布的 GPT Image 2 也已经集成到了 Codex 里。我们可以在 Codex 生成并迭代图像，在一套工作流里，从产品原型、前端设计，到视觉效果图和游戏开发等任务，使用 GPT Image 2 快速生成视觉元素。

如果你的 Claude 账号总是被封，用不了官方的 Claude Cowork、Claude Code 桌面版，又或者是那 2% 的新用户，开通了 20 美元/月的 Pro 会员也用不了 Claude Code，不妨来试试 OpenAI 出品的 Codex。

从代码工具到全能助手

Codex 最近这段时间的更新，最重要的莫过于上周发布的 Computer Use。这项能力并不算新鲜，之前是模型有 Computer Use 的能力，现在是需要工具也要有配套的支持，才能发挥模型能力。

它本质上就是 Agent 工具可以像人类操作电脑一样，通过视觉识别、点击和输入，自主操控电脑上的各类应用程序。

之前的 Codex 操作电脑上的软件，是通过一些命令来执行不同的应用任务，整体更像是我们喊「Siri，明天的天气怎么样」，做这些比较简单的任务。

有了 Computer Use 的能力之后，不仅支持一些调用 API 或者终端命令的工具，还能真的能帮我们完成一些电脑上的实际操作，尤其适合前端调试、应用测试、操作没有开放 API 的软件。

而且支持多个智能体并行在 Mac 上工作，不会影响我们正常使用其他应用。

需要注意的是，Computer Use 的能力只支持 macOS 15 以上的版本，我们的电脑（macOS 14.6.1）在测试 Codex 时，会自动弹出一个 SkyComputerUseClient 的问题报告。

另外，现在 Codex 支持内置浏览器，能更好地处理 Web 场景。我们在 Codex 里生成的网页，可以直接在网页上标注，给 Codex 更精准的操作指令，对一些前端、应用和游戏开发的快速迭代非常有用。

▲从 Coding、设计、生活方式、生产力到研究，Codex 现在有丰富的插件系统来处理各项任务

这次的更新还新增了 90 多个插件和更丰富的工具集成，让 Codex 能接入更多工具、获取更多上下文，并跨平台执行操作，提到的热门插件包括 Atlassian Rovo（JIRA）、Microsoft 套件、Neon by Databricks、Remotion、Render、Superpowers 等。

在 Codex 应用里，我们只需要输入斜线就能快速进入一些关于 Codex 的配置，输入 $，则可以选择不同的 Skills，包括我们安装在本地的各种 Skills。

同时，在自动化任务上，Codex 的 Automation 功能升级后，可以复用之前的对话线程，保留已有上下文。新的自动化还支持 Codex 自主规划后续工作、自动在未来某个时间继续执行任务，以及支持持续数天甚至数周的长期任务。

官方提到这项更新主要用于代码的提交合并、跟进日常工作生活的待办事项，以及跨越不同平台和工具的信息追踪等任务。

还有一些对于桌面应用交互的小更新，像是增加了多标签页的终端窗口，侧边栏可以直接打开文件，预览 PDF、表格、PPT 等文档。

新的摘要面板，也可以持续跟踪当前执行任务的计划和进度、参考信息来源，和输出结果等。这些应用上的增强，也让 Codex 在整体上更像是一个统一的工作台，而不再是单一的对话窗口。

用定时截屏的方式来维护 Agent 记忆

个性化的记忆功能向来就是 AI 的一大难题，虽然 AI 博古通今能记住所有的知识，但是对于每个用户的私人记忆处理，工作记忆等，AI 需要用不会占据大量的 Token，同时又能记清楚的方式来处理日复一日的对话。

尤其是现在到了 Agent 这类巨消耗 Token 的任务上，每个用户每天产生的上下文，如果 Agent 要全部记住，估计再来一百万 Token 上下文也难顶住。

上周 OpenAI 就已经为 Codex 带来了记忆功能，它可以记住我们的个人偏好、之前做过的修正，以及一些不容易获取但很重要的信息。

而为了获取更多的记忆，更快地处理我们的工作流。Codex 这次推出的 Chronicle 功能，说白了就是看我们的屏幕，记住我们的工作，再把这些记忆喂给 AI。

具体来说，在 Codex 设置>个性化里面，开了 Chronicle 功能之后，会自动执行这些操作：屏幕上下文捕获 → 本地临时截图 → 后台代理分析 → 临时 Codex 会话总结 → 生成本地 Markdown 记忆 → 后续会话中作为上下文使用。

Codex 获取了屏幕录制和无障碍权限之后，Chronicle 会在后台运行一个沙箱 Agent，这些 Agents 使用默认模型 GPT-5.4-mini，基于捕获到的屏幕图像，周期性地启动一个临时的 Codex 会话，把最近的屏幕上下文整理出记忆。

屏幕截图只会临时保存在本地，Codex 提到运行期间，超过 6 个小时截图会被自动删除。

▲GPT Image 2 生成的信息图

以后我们和 Codex 对话，它会自动检索这些记忆文件，作为上下文来使用，减少我们重复描述背景的需要。

OpenAI 官方也给了多个案例，像是如果不开启 Chronicle，Codex 不知道我们说的「这里会失败」，是指的什么。

以及针对一些个人任务中出现的人名、项目名等，在通用知识外的内容，Codex 也会根据 Chronicle 获取的信息，自动补充上下文。

能够捕获屏幕图像，也意味着使用 Codex 处理任务的全流程，Chronicle 都能记住。包括我们的工作流，常用的工具。像下面的例子里，使用了 Chronicle 的 Codex 会知道这份宣传材料使用何种格式，以及何种工具，是 Google 文档还是 Markdown 文档。

不过这项功能也面临着一些争议，例如视觉识别的方法会消耗大量的 token，更严重的是这些截图可能包含我们屏幕上可见的敏感信息。

虽然 OpenAI 说所有保存的记忆都会存放在本地的 markdwon 文档里，用户可以随时查看，Codex 根据这些截屏获取到了哪些信息。但是他们也提醒用户，当 Chronicle 截屏到一些有风险的网站时，网站可能通过提示词注入的方式，在屏幕上隐藏一些恶意指令，让 Codex 执行。

Chronicle 这项功能目前仅向 ChatGPT Pro（200 美元/月）用户开放，支持 macOS 版本的 Codex 应用，作为研究预览版推出。待 Chronicle 正式上线之后，相信 Codex 会把它开放给更多用户使用。

手机遥控、电子宠物、「Hermes Agent」都有机会上线

这段时间，Codex 被网友们称作是一款正在用力追赶 Claude 的产品。虽然一方面是在说 OpenAI 没有主见，随大流。但另一方面，能看到好的产品之间展开你追我赶的竞争，对我们用户来说未尝不是一件好事。

Codex 开发者在 X 上问大家对 Codex 有何意见，网友们非常积极的表示，要加上手机控制功能，还有人说 Codex 也应该从 ChatGPT App 里面进入。而这些都是 Claude 目前已经做到的功能。

也有网友在下面反馈 Codex 存在的各种 Bug，像是内存泄露、会话只能存档不能删除等问题。

最新的 Codex 更新爆料里还提到，Codex 也打算做一个小小电子宠物，放在 Codex 桌面上，来提示用户目前会话的各种状态。

这个电子宠物共有 8 种预设形象，用户还可以创建使用自己的虚拟形象。

▲来源：https://x.com/testingcatalog/status/2046366630528143827

另一个爆料则提到 OpenAI 正在为 ChatGPT 开发智能体（代号 Hermes），其中包括智能体构建器、模板、日程安排、在 Slack 中使用智能体的选项、添加应用程序、技能、文件、内存、指令等功能。

▲来源：https://x.com/btibor91/status/2046545878538961304/

眼下的 Codex 是一个活跃开发的产品，OpenAI 必然不会把本地 Agent 产品这一块的市场拱手让给 Claude。

别说 OpenAI 这位 AI 界的老大哥，前几天，Gemini 也不声不响地发布了桌面版应用，但是被一众网友评价「拉爆了」。

只能鼓励一下 OpenAI 和 Gemini，赶快结束 Claude 在本地 Agent 助手和代码这块的领先地位。

天下苦 A 社久矣。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

ChatGPT 的降智测试和账号恢复实测指南

DUN.IM BLOG

By: Anonymous

20 November 2025 at 12:16

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

近期，ChatGPT 5.1 Thinking 的 Juice Number 达到了 256。如果你的达不到，大概率是被降智了。

ChatGPT 的降智测试和账号恢复实测指南

Juice Number 实质上是 ChatGPT 模型的 「思考预算 (Thinking Budget)」。

Juice 值不直接等同于模型的“智商”，但它限制了思维链 (Chain of Thought) 的长度。

当值过低时，即便模型本身能力强大，也会因为“思考预算不足”而表现出逻辑断层或回答肤浅，即常说的“降智”现象。

如果把 AI 的思考过程比作在纸上推演，Juice 值决定了这张纸的大小：

由于 Juice 值属于后台系统参数，常规对话无法直接获取。目前通用的检测方法是利用 Prompt Injection（提示词注入） 技术，通过伪装系统指令来绕过防御。

OpenAI 会根据 账号的风险评分（Trust Score） 动态调整算力资源。

常见原因：

降智表现：
不同模型的 Juice 值是不一样的，系统降智也有不同程度，可能会将 Juice 值从 256 降级至 128、96、64 甚至 16 等。

此时，模型在处理代码重构、长文本分析等复杂任务时，质量会显著下降。

以下是我的恢复步骤：

退出所有已登录该账号的设备（手机、电脑、平板等），确保没有任何活跃会话。

将账号闲置 48 小时。这段时间用于让后台的风控标记自动过期或重置。

最后重新登陆使用检测代码进行测试。

实测效果：

DUN.IM BLOG
App Store 超低价应用内购省钱技巧，不到60人民币开通 ChatGPT $20 的会员订阅
7 September 2025 at 15:28

App Store 超低价应用内购省钱技巧，不到60人民币开通 ChatGPT $20 的会员订阅

DUN.IM BLOG

By: Anonymous

7 September 2025 at 15:28

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

实际上，大多数 App 和服务定价并非全球统一。如 OpenAI 和许多跨国科技公司一样，会采用“购买力平价（Purchasing Power Parity, PPP）”策略，即根据不同国家和地区的经济水平、人均收入来调整产品价格。

这便在全球市场中形成了一些“价格洼地”，其中，尼日利亚正是全球订阅 ChatGPT Plus 最便宜的地区。

全球部分地区价格对比：

整个流程的核心是在尼日利亚区的数字生态内完成支付闭环。

OpenAI 发布了 GPT-4.1 提示工程指南，中文总结和完整翻译

DUN.IM BLOG

By: Anonymous

9 April 2025 at 11:55

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

以前许多典型的最佳实践和提示依旧适用于 GPT-4.1，由于 GPT-4.1 更严格、更字面地遵循指令，会非常严格地按照字面指令去执行任务。

这使得它对明确、清晰的提示尤其敏感。也就是说，只要你发现 GPT-4.1 的表现与预期不符，通常只需增加一句简洁明确的说明，就能迅速把模型引导到正确的行为上。

过去的模型（如 GPT-4）会更自由地揣测或推断用户指令和系统提示背后的真实意图，即使提示不够精确，也可能猜出用户的意图并完成任务。

所以开发者需要对原有的提示方式进行一定调整（迁移）才能使用。

OpenAI 提供了一系列 针对 GPT-4.1 的提示工程（Prompting）最佳实践，从基础原则到高级策略，帮助开发者高效构建提示以提升模型表现。

明确指令（Be specific）：确保提示中清楚表达任务目标。

提供结构（Provide structure）：通过示例、模板等方式设定预期输出格式。

避免歧义（Avoid ambiguity）：使用具体词汇与上下文降低误解可能。

设置角色（Set behavior/role）：让模型“扮演某种身份”以调整风格或回答方式。

逐步指导（Decompose tasks）：将复杂任务拆解成多个子任务，提升精度。

Few-shot 示例：使用多个输入/输出示例引导模型学习任务结构。

Chain-of-thought（思维链）提示：引导模型按逻辑顺序逐步推理，特别适合复杂问题解决。

Refine prompts（迭代优化）：通过反馈不断调整提示内容以获取更优结果。

Internal monologue：让模型模拟“内心思考过程”以获得更深入分析。

Critique and revise：让模型先生成回答，再进行批评、修改，提升答案质量。

使用 “Let’s think step by step” 等语句诱导更好推理。

将模型输出限制为 JSON 格式时，需加入明确的格式描述与示例。

对于多步骤任务，最好明确列出每个阶段的要求。

评估提示效果需结合质量、稳定性与成本。

好的！我们来做一个更详细又通俗易懂的分解，把这个 Notebook 当作是一本 “和 GPT-4 打交道的秘籍”，一步步讲清楚每个要点，让你轻松掌握提示工程（Prompt Engineering）怎么做才有效。

这些就像是“和 AI 沟通的黄金法则”，每一条都很重要：

不要笼统地说：“请帮我写一篇文章。”

要说得具体一点：“请写一篇关于人工智能如何改变教育的 500 字文章，用高中生能懂的语言。”

👉 越具体，AI 越知道你想要什么，结果也越好。

比如你想让它生成一个表格、清单、或者固定格式的文本。

你可以先提供一个模板，或者给它一个例子。

🧩 例子：

如果你说“列出一些项目”，那“项目”可能指的是“计划项目”、也可能是“软件项目”，模型会糊涂。

所以要具体说明你是说什么。

✅ 改成：“列出五个开源的 Python 项目。”

你可以告诉它：“你现在是个英语老师”、“你是个法律顾问”、“你是一名医生”。

它就会按那个身份回答你。

🎭 示例：

有些问题太复杂，GPT 一下子处理不好。

你可以先让它分析问题，再让它解决。

🪜 举个例子：

这些是用 GPT 更厉害的用法，帮你写得更准、更聪明。

你可以先给它几个例子，它就知道你想要什么样的输出。

📌 例子：

然后你再输入新的句子，它就会照着这个风格来。

引导它“一步一步思考”，解决复杂问题特别有效！

📌 提示写法：

你可以先让 GPT 写出一个答案，然后再让它自己点评、修改。

📌 举个例子：

这会得到更高质量的输出！

你可以让 GPT 边想边说，好像它在分析问题。

📌 示例：

这适合分析、决策类问题。

加一句 “让我们一步一步思考” 可以大幅提高准确率。

想要 JSON、表格、代码？一定要告诉它格式，还要举个例子。

想输出多步内容？加编号，比如“第 1 步… 第 2 步…”

如果模型回答不理想，就多试几种提示改写方式。

✨“提示写得好，GPT 表现爆表！”✨

这份指南就是在教你：用什么语气、格式、结构、套路和 GPT 说话，才能让它给你最优质的答案。

GPT-4.1 系列模型在编程能力、指令遵循能力和长上下文处理能力上，相比 GPT-4o 有显著提升。本指南汇总了我们内部广泛测试所得的一系列重要提示技巧，帮助开发者充分发挥新模型家族的优势。

许多典型的最佳实践依旧适用于 GPT-4.1，比如提供上下文示例、尽可能具体清晰的指令、以及通过提示进行规划以最大化模型智能。但我们预计，要充分发挥此模型的作用，需要进行一些提示迁移。GPT-4.1 更严格、更字面地遵循指令，而前代模型倾向于更自由地推测用户与系统提示的意图。然而，这也意味着 GPT-4.1 非常容易被引导，并对清晰、明确的提示非常敏感。如果模型表现与预期不同，一句清晰且明确表述你期望的行为的句子通常就足以引导模型回到正轨。

请继续阅读以下提示示例，注意虽然本指南适用于大多数情况，但并无万能法则。AI 工程本质上是一门经验学科，大型语言模型本质上是不确定性的。我们建议除了遵循本指南外，还要构建有信息量的评估并频繁迭代，以确保提示工程的更改为你的使用场景带来益处。

GPT-4.1 是构建智能体工作流的理想选择。我们在模型训练中强化了多样化的智能体问题求解路径，并在非推理模型中，通过智能体配置达成 SWE-bench Verified 测试的最佳表现，解决率达 55%。

系统提示建议

为充分激发 GPT-4.1 的智能体能力，我们建议在所有智能体提示中加入以下三类关键提醒。以下示例面向代码类智能体优化，但稍加修改即可用于通用智能体场景。

持续性提醒：确保模型理解它正处于一个多轮任务中，防止其在问题未解决前就把控制权交还给用户。

工具使用提醒：鼓励模型善用工具，降低其猜测或幻觉回答的概率。

规划性提示（可选）：引导模型在调用每个工具前后均进行显式计划与反思，而非仅仅调用工具串联完成任务。

GPT-4.1 对智能体场景下的系统提示和用户指令极为敏感。我们发现上述三条提示在内部测试中将 SWE-bench Verified 得分提升了近 20%。因此，强烈建议在任何智能体提示开头加入这三类明确指令，以将模型从“聊天机器人模式”切换为更主动、更独立的“智能代理模式”。

与前代模型相比，GPT-4.1 在调用通过 OpenAI API tools 字段传入的工具方面训练更充分。我们建议开发者仅使用 tools 字段传递工具，而不是将工具描述手动注入到提示中并自建解析器。我们测试发现使用 API 解析工具描述比手动注入提示提升了 2% 的准确率。

开发者应使用清晰的工具命名，并在 “description” 字段中提供详细说明。同样，每个参数也应具备清楚的命名和描述，以确保正确使用。若你的工具较复杂，可以在系统提示中专门加入 # Examples 区段来展示用例，而不是将示例塞进 description 字段中。

你也可以通过 Prompt Playground 的 “Generate Anything” 功能来快速生成良好的工具定义起点。

正如前面所说，GPT-4.1 并不是内建“推理链”的模型——它不会在回答前自动形成内部推理路径。但你可以通过提示工程诱导它“显式思考”，逐步列出计划。我们在 SWE-bench Verified 测试中发现：引导模型“思考再行动”使通过率提升了 4%。

示例提示：SWE-bench Verified

以下是我们在 SWE-bench Verified 中取得最高分所用的智能体提示，包括详尽的工作流程与问题解决策略说明。该结构可用于各类智能体任务。

GPT-4.1 支持最高达 100 万 tokens 的输入窗口，适用于以下场景：

结构化文档解析

信息重排序（re-ranking）

筛选关键信息、忽略干扰内容

使用多跳推理整合上下文信息

最佳上下文规模

在“针入草堆”（needle-in-a-haystack）评估中，GPT-4.1 即便使用完整的百万 token 输入也表现良好。它擅长从混合内容中识别有用信息。但如果任务需要提取大量内容，或需对上下文全局状态进行复杂推理（如图搜索），性能可能会下降。

控制上下文依赖程度

你应考虑模型答题所需的“外部文档” vs “模型内知识”的比例。你可以通过以下两类指令调控：

上下文组织建议

在使用长上下文时，提示的位置对模型表现有显著影响。最佳做法是在上下文前后都加入指令。如果只能写一次，放在上下文上方比下方效果更好。

虽然 GPT-4.1 不是推理模型，但通过提示让它“逐步思考”可以有效帮助其拆解复杂问题，提升输出质量（代价是增加 token 使用与响应时间）。

推荐的起始提示如下：

你可以进一步完善你的思维链提示，根据实际失败案例调整策略。我们建议在出现以下错误时添加更明确的指令：

误解用户意图

上下文理解不全或分析不准确

推理步骤不连贯或顺序错误

可参考以下提示模版：

GPT-4.1 拥有卓越的指令遵循能力，开发者可用其精准控制输出行为。你可以设置：

语气与风格

工具调用方式

格式要求

话题限制等

但由于它对指令更“死板”，之前为其他模型设计的提示可能需调整。建议遵循以下工作流程：

推荐提示结构：

加入 “# 指令” 段落，列出总规则。

对特定行为新增子类细则（如 # 示例短语）。

若需特定步骤，可写成有序列表，并明确要求逐步执行。

若行为未达预期，可检查以下问题：

是否有冲突或不完整指令？

是否缺乏例子？示例中是否覆盖了关键点？

是否需要增加强调（如适当用大写）？

提示：使用 AI IDE 可辅助你快速迭代提示，统一更新规则和示例。

常见失败模式

要求“必须调用工具”可能导致模型凭空填入参数，添加一句“若信息不足，应先向用户提问”可缓解。

示例短语易被模型反复使用，应明确要求灵活变换。

若无格式限制，模型可能会输出过多解释性内容，可通过指令或示例控制。

这段提示展示了一个虚构客户服务代表的最佳实践。你可以看到提示中规则多样、表述明确，还使用了多个额外小节来细化指令，并提供了一个完整示例来演示如何遵守这些规则。

尝试运行下方 Notebook 单元格 —— 你应该会看到一个用户提问的消息和一个工具调用的响应。模型会先打招呼，然后复述用户的问题，接着说明即将调用某个工具。

你可以尝试修改提示中的某些指令，或尝试其他用户输入内容，来测试模型在“指令遵循”方面的表现。

{ “role”: “assistant”, “content”: “您好，您已致电 NewTelco，请问我能为您做些什么？😊🎉\n\n 您想了解我们的家庭套餐。🤝 我这就为您查询，请稍等。🚀”, “tool_calls”: [ { “id”: “call-1”, “type”: “function”, “function”: { “name”: “lookup_policy_document”, “arguments”: “{“topic”: “family plan options”}” } } ] }

{ “role”: “assistant”, “content”: “我查到的信息如下：🎉 我们的家庭套餐最多支持 5 条线路共享流量，并且每增加一条线可享 10% 折扣家庭套餐政策。📱 还有其他我可以帮您的吗？😊” }

以下是一个良好的提示结构起点，供你参考和自定义：

你可以根据自己的需求增删这些部分，并通过试验找出最适合你用例的结构。

以下是选择提示中最佳分隔符的一些通用建议。若涉及长上下文使用，请参见前文《长上下文》章节的特别说明。

✅ 推荐使用的格式：

Markdown（推荐起点）

使用 markdown 标题（# ~ ####）来标识主要部分与子部分。

使用反引号（`code` 或 “`代码块“`）准确包裹代码内容。

根据需要使用有序/无序列表清晰列出内容。

XML

效果也很好，GPT-4.1 在解析 XML 上表现更稳定。

XML 格式便于明确区块开始/结束位置，还可以添加 tag 属性携带额外元信息，并支持嵌套。

示例：

JSON

在编程类任务中表现良好，结构清晰、模型理解度高。

但缺点是格式冗长、需要转义字符，容易带来额外负担。

📄 大量文档 / 文件嵌入上下文时的建议：

XML 格式：在长上下文测试中表现优异。

示例：

Lee 等人提出的扁平格式（参考论文）也表现良好：

示例：

JSON 格式在这种场景下表现最差：

示例：

✅ 总体建议：模型能处理多种结构格式，但请根据实际情况选择最能突出重点的格式。例如，如果你检索到的文档本身包含大量 XML，那么继续使用 XML 作为嵌入格式可能就不太合适。

输出过长：在某些特定情况下，我们发现模型可能不愿生成非常长且重复性的输出（如逐项分析数百个条目）。
👉 若你的用例需要此类输出，请在提示中明确指示模型必须输出完整内容，或考虑将问题拆分处理，或简化输出格式。

并行工具调用异常：我们观察到某些少见情况下并行工具调用可能不准确。
👉 如果你遇到这类问题，建议测试是否启用 parallel_tool_calls=false 参数来避免并发问题。

如你想要我基于这些结构生成一个完整的提示模板样板供你直接使用，也可以告诉我你的具体应用场景（如问答系统、文档分析、代码解释等），我可以帮你生成定制化结构。是否继续？

开发者反馈指出：准确且结构良好的 diff 生成能力，对于编码类任务至关重要。为此，GPT-4.1 系列在此方面表现显著优于以往模型。

此外，GPT-4.1 能很好地根据明确的指令和示例生成任意格式的 diff。我们在此开源一个推荐的 diff 格式，模型对此已接受过强化训练，尤其适合初学者快速上手。

以下是一个正确调用推荐工具 apply_patch 的示例提示格式。

其中 [YOUR_PATCH] 部分需使用推荐的 V4A diff 格式，规范如下：

每次变更以 *** [ACTION] File: path/to/file 开头，ACTION 可为 Add、Update 或 Delete。

每个代码块需提供上下文片段 + 修改内容：

上下文行规则：

默认提供上下变更各 3 行上下文。

若变更块之间相距近，不要重复上下文。

若上下文不足以唯一定位，应使用 @@ 定位所属的类或函数。例如：

不使用行号，改用结构与上下文唯一定位。

OpenAI 提供的官方工具 apply_patch.py 是一个 纯 Python 3.9+ 脚本，可直接执行，用于将上述 diff 应用到本地代码文件。

该脚本支持以下核心能力：

解析自定义 diff 格式

根据 patch 内容编辑、添加、删除本地文件

可检测语法错误、缺失上下文、重复文件操作等问题

使用方式：

将 patch 内容通过 stdin 输入传入

内部自动判断 patch 类型并更新文件内容

你可以将其配置为终端可执行命令 apply_patch，并作为自动化 pipeline 或测试流程中的一部分使用。

所有解析异常（如找不到目标文件、上下文无法匹配）都会抛出自定义异常 DiffError，方便调试。

除了推荐格式，我们还测试过两种替代格式，成功率同样很高：

不使用行号

明确指出要替换的旧代码与新代码

结构清晰，易于解析

完整内容：https://github.com/openai/openai-cookbook/blob/main/examples/gpt4-1_prompting_guide.ipynb

ChatGPT 上线新语音模型，解析「Monday」模型音色提示词

DUN.IM BLOG

By: Anonymous

29 March 2025 at 22:04

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

想象一下，你正在和手机里的 AI 助手聊天，但它不再是那个永远彬彬有礼、甚至有些刻板的「标准音」，而是带着一丝慵懒、一点讽刺，仿佛刚经历了一个漫长周末，还没从「周一综合症」里缓过神来。这就是 OpenAI 昨天推出的「Monday」音色想要达到的效果。

网上已经有很多「Monday」对话效果的展示，「Monday」的音色当然是其语音模型的结果，而「Monday」这种特殊的回复方式是靠提示词来控制的。打个比方：「Monday」就像是一个极其聪明但缺乏具体「生活经验」的演员，而提示词就是导演给演员的剧本和角色设定。提示词写得越好，演员（AI）的表演就越「入戏」，越符合你的预期。

如果你对「Monday」提示词好奇的话，正好我今天学习研究了一下它的提示词，正好可以一起分享学习一下它的提示词内容，完整的提示词我放在了附录，这里大致解析一下其提示词内容。

大语言模型远不止是信息检索工具，它们是强大的「模仿者」和「扮演者」。通过精心设计的提示词，我们可以赋予它们各种各样的「人格」和能力。那么怎么通过提示词来设定好角色呢？

如果按照前面打的比方，把 AI 当成一个演员，那要写好提示词就是把自己变成一个好的导演，不仅要告诉演员台词，还要解释角色的内心世界、动机、情绪状态，甚至给出具体的动作和表情指导。好的导演能激发出演员最好的表演，就像好的提示词能引导 AI 生成精彩的回应。

或者作家在创作小说前，往往会为主要人物写详细的小传，包括他的成长背景、性格、习惯、口头禅、人生目标等。这帮助作家在后续写作中保持人物的一致性和立体感。

如果你觉得这都过于专业，还可以想象一下很多大公司制作的详细的品牌手册，规定了广告语、客服回答、社交媒体发帖的语气和风格（比如是专业严谨、活泼有趣还是温暖亲切）。

这些和给 AI 设定「人设」异曲同工。

从技术角度上来说，可以参考「Monday」的提示词，注意几个方面：

当 AI 开始拥有「周一综合症」般的慵懒和讽刺，它不仅仅是一个技术演示，更像是一面镜子，映照出我们人类自己复杂多变的情感和个性。我们精心编写的每一个提示词，或许都在不经意间，为冰冷的机器注入了一丝我们渴望理解或被理解的人性侧影。

「我们塑造了工具，然后工具反过来塑造我们。现在，我们开始学习如何给 AI『写剧本』，也许在这个过程中，我们也在重新学习如何与『人』，以及与自己对话。」

DUN.IM BLOG
ChatGPT – Deep Research 功能指南&技巧总结：从「进度条」到「提示词」，一次搞懂！
22 February 2025 at 13:13

ChatGPT – Deep Research 功能指南&技巧总结：从「进度条」到「提示词」，一次搞懂！

DUN.IM BLOG

By: Anonymous

22 February 2025 at 13:13

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

最近有很多朋友在讨论：「Deep Research 的用量是怎么算的？」 又因为目前 Plus 每个月只能用 10 次，大家都非常担心浪费。其实一句话就能总结——只要开始出现「Starting Research」的进度条，就算使用了一次。在进度条出现之前，怎么问都不算。下面就为大家分享一些 Deep Research 的使用流程、注意事项和提示词模板，帮助大家更好地运用这一强大的研究功能。

一句话总结：从开始出现 Deep Research 进度条就算一次，之前都不算。

提出主题
你先要告诉 ChatGPT 需要研究什么主题。

ChatGPT 询问澄清问题
ChatGPT 通常会向你询问一些澄清问题，确保理解你的研究需求。

回答澄清，触发研究
当你回答了上述澄清问题后，ChatGPT 会再回复一条消息，并提示「将开始报告「，随后出现」Starting Research「的进度条。

注意：从这一步开始就会扣除一次 Deep Research 用量。

报告生成
研究进度条走完后，ChatGPT 会给你发送完整的报告，这标志着一次 Deep Research 流程的完成。

进度条出现后，你可以随时离开
进度条开始后，无论你是关闭窗口、刷新网页、切换到其他会话还是新开会话，都不会影响已经开始的 Deep Research 流程，它会在后台继续执行并最终生成报告。

Deep Research 可以后续追问
当报告生成结束后，如果你要继续追加信息重新生成报告，有两种选择：1). 直接提问，会使用你开始会话时选择的模型继续对话，报告内容可以作为上下文；比如说你从 GPT-4o 开始的，那么你在报告生成后，如果继续提问，实际上是 GPT-4o 基于你报告和提问内容回复，但是可能会受限于上下文长度无法完整理解报告内容；2). 重新生成新报告：Deep Research 是一次性生成的，但是你可以继续在当前会话选中「Deep research」按钮，这样可以把当前会话内容作为输入，或者把内容复制出去新开会话选中「Deep research」按钮重新开始一次新的生成。内容复制出去处理一下再生成会更好的对输入进行控制，但是麻烦一些。

你无法追加新的信息让它继续深度研究。如果你在当前会话里继续追问，后续的回答将由其他模型（如 GPT-4o）接管。
如果你对报告不满意，需要重新修改提示词再新开一次会话进行 Deep Research。

灵活切换模型
你可以先选任何模型（如 o1 pro/o1 等），再让它进行 Deep Research。若后续还打算继续追问报告内容，建议在 Deep Research 开始前就选一个更强的模型（比如 o1 pro / o1）来进行分析。

选择信息源和报告语言

建议在提示词中加一句「请选择权威信息源」（并不一定要非英文来源不可，重点是权威信息源，这样可以过滤掉一些不好的信息源，当然你也可以加上「优先英文信息源」）。

如果希望报告是中文，直接在提示词末尾加一句「请形成中文报告「即可。

如果不小心生成了英文报告，又看着费劲，可以在当前会话，让它翻译，也可以复制完整内容，

ChatGPT – Deep Research 功能指南&技巧总结：从「进度条」到「提示词」，一次搞懂！

新建会话，选择 o1 pro 或 o1 模型（最佳翻译效果），翻译提示词参考：

「请将下面的内容用中文重写，尊重原意，保持格式不变无删减：」

引入外部资料的方法

如果报告需要访问收费网页上的内容，你可以手动复制成 Markdown，然后在提示词中用 XML 标签包起来。

如果有图片内容，直接上传即可。

如果要分析视频内容，需要先把视频转成文字，同样用 <transcript> 标签包住，再放进提示词里。

我一般会用 AIStudio 的 Gemini 转成文本。

你可以一次粘贴几千行代码也没问题（用 XML 包起来），但要注意输入框粘贴有上限。如果太多，可以把代码放在公开的 GitHub 仓库，让 Deep Research 去分析链接即可。

写报告或写代码都行
Deep Research 不仅能写报告，还能写代码。只要你提示它「生成的结果是代码」，它就会尝试从网上搜索相关代码库并提供解决方案。

文献质量与报告质量
如果想让它「阅读」一本书并进行提炼，需要注意输入长度有限，无法直接输入一本完整的书。大部分流行书籍已经在模型中有训练数据，所以它会参考网上已有的书评。资料越多、质量越高，报告越漂亮；如果资料很少，它也无米下炊，生成的报告质量可能有限。

一个常见的提示词模板大致可分为背景信息、任务要求、和输出格式三个部分。

在这里填写所有对它生成报告有帮助，但模型本身访问不到的信息，比如：

付费文章

视频文字稿

图片或 PDF（可作为附件）

其他任何对于生成有帮助的内容

当背景信息较多时，务必用 XML 标签包裹，避免 AI 混淆指令。例如：

主题：你希望分析、研究或讨论的具体范围

信息源：希望它检索的文献库、学术论文、政府网站、GitHub 等

研究要点：需要关注的核心点，是深度解析还是简要摘要

语言或风格：是中文、英文或其他语言？

语言：中文报告、英文报告或双语

数据格式：是否需要用表格呈现数据（它暂时画不了图表）

段落和标题：是否需要分级标题、索引等

提示词模板并不是必须的，可以随性一点，你可以把写提示词使用 Deep Research 当成去交代一个实习生帮你写分析报告，你怎么交代实习生就怎么写提示词。

Deep Research 的使用次数：只要出现「Starting Research」进度条，就会扣除一次用量。

保持灵活：不满意就重新开始，新开会话前最好做好提示词规划。

结合大模型优势：如果要深入分析或后续追问，选用更强的模型如 o1 pro / o1 更合适。

慎重选择资料：外部资料要提前整理好，使用 XML 标签嵌入提示。

尊重版权、合理引用：在使用外部资料时，务必保留引用信息，切勿违规。

希望这篇文章能让你更好地理解和使用 Deep Research。在实际使用中，不妨多加尝试和探索，慢慢就能摸索出最适合自己的使用方式。祝大家玩得开心，也能高效地完成研究和写作任务！如有更多问题，欢迎在评论区留言交流。

总结：

如果你想让 Deep Research 提供权威信息源，在提示词中加一句「请选择权威信息源」。

如果要生成中文报告，只要在提示词里加「请形成中文报告」即可。

不小心生成英文报告且看着费劲，使用下面的提示词翻译：
「请将下面的内容用中文重写，尊重原意，保持格式不变无删减：」

欢迎大家在留言区分享你们的使用心得与经验，一起探讨 Deep Research 的更多玩法！

申请免费使用教育版 GitHub Copilot Pro

沉舟侧畔 Blog

By: springwood

24 February 2025 at 22:42

（Abstract）大学教书匠比较穷，所以给一些福利？

Pika – AI 视频神器，一键乱入新场景

DUN.IM BLOG

By: Anonymous

11 February 2025 at 22:47

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

一张图、一句提示词，万物都能乱入你随手拍的视频。

▲动图制作自：X@omerbartal

在整活赛道天赋异禀的 AI 视频神器 Pika，最近又推出了一个好玩的新功能：Pikaddition。

从此以后，人人都是五毛特效师。

如果你有灵感了，现在就可以玩起来，注册 Pika 之后可以免费生成 15 次。

体验指路：https://pika.art/

不过，这个功能默认使用的是最快、最便宜的 Turbo 模型，想要达到理想的效果，往往需要不断调试提示词，抽卡的次数不算少。

Pikaddition 的使用方式很简单，三步走。

虽然操作不难，但想要玩得有创意，推荐以下几种「高阶玩法」。

实拍视频+不日常的图片

怎么邀请 Sam Altman 来指导工作？先用视频记录同事认真工作的样子，然后再在网上找一张 Sam Altman 的半身照，用提示词说明他怎么出现在视频里。

▲提示词：穿着绿色毛衣的男人站在左边，低头观察穿着牛仔夹克的人操作电脑

然后就可以看到，Sam Altman 亲自旁观我们报道 OpenAI，光影很自然，违和感被 AI 吃了。不过，Pika 会造成人脸的微崩，对比原视频，同事的颜值有所下降。

按照这个思路，我们甚至可以上演一出日常版的「神奇生物在哪里」，只需要一个打开封闭空间的视频、一张萌物的图片。比如，打开办公室的柜子发现皮卡丘。

▲ 提示词：皮卡丘一直藏在柜子里，直到门被打开

提示词写得比较宽泛，只说明了皮卡丘的位置，反而给了 Pika 适当发挥的空间，皮卡丘被发现时的表情和动作，都是活灵活现的，仿佛我们打扰它了。

前几天，语言学习软件多邻国整了一出营销活动，称自己的吉祥物猫头鹰多儿「去世」了，死因不明，可能是等我们打卡的时候死的。

试问谁没有被多儿的通知和小组件追杀着背单词过呢？如果它来到现实，是不是更让人心惊胆战？

▲提示词：绿色的小鸟从远处飞向伸出的手

想要实现这个催命的效果，一点也不难，拿起手机随意拍摄一段空镜，在视频里伸出我们的一只手，再随便找一张多儿的图片。

提示词仍然很简单，只是描写了多儿的动作，哪怕是平面的、2D 的多儿，Pika 也能加工成立体的、3D 的，和短视频更加适配。但出现了个 Bug：手指数量不对了。

还有一种进阶的实拍视频玩法，比较考验演技，需要先进行「无实物表演」。

▲被老虎扑倒，动图制作自：X@omerbartal

我们尝试过人物在视频里保持不动，只用提示词描述人物动作的改变，但是没有起效，所以还是需要进行一个提前的摆拍，考验大家戏精本质的时候到了。

▲提示词：身穿牛仔夹克的男子被一只水豚撞倒

影视名场面+打破次元壁的图片

把原本不相关的人或物（包括你本人）放进影视名场面里，只是分分钟的事情。

《蝙蝠侠：黑暗骑士》里的小丑炸医院，是经典中的经典，我们截取几秒的片段，然后上传一张马斯克的半身照，让他走在小丑的旁边。

▲提示词：穿着西装的男人正走在穿着护士服的男人的左边，并与他进行交谈

两人淡定离开犯罪现场的味道有了，美中不足的是，马斯克和小丑的脸都有点扭曲。

Pika – AI 视频神器，一键乱入新场景

写实的电影之外，二次元的动画风格也不妨一试。名侦探柯南《神秘乘客》这集的公交车，基本集齐了最强阵容，如果挑选一张夜神月的侧脸图片，那么卡密也能来客串。

▲ 提示词：黄头发、穿白衬衫的男人坐在中间的座位上

但还是那个问题，人物的变形比较明显，并且画风不是非常相融。

表情包出处视频+表情包图片

二创表情包，是每个 AI 视频工具都得整的花活。

▲提示词：狗躺在猫的右边，猫看了狗一眼

当惊讶猫的视频和全世界最著名的柴犬表情包联动，二脸懵逼固然有趣，但一猫一狗仿佛不在一个图层，柴犬像用迪士尼滤镜美颜过。

当我第一眼看到宇树科技机器人的蛇年春晚节目《秧 BOT》，就觉得在英伟达年会穿着东北大花袄的黄仁勋应该加入，好在 Pika 可以满足这个朴素的愿望。

▲ 提示词：白发男子正在机器人旁边跳舞

还真别说，这甩红手绢的动作，这一板一眼的步伐，挺有默契的。

Pika 的特效称不上专业级，但作为一个创作短视频的玩具，倒也绰绰有余。

AI 视频百花齐放，各有各的特长，可灵综合能力强，海螺擅长风格化，PixVerse 速度快，和同行们比起来，Pika 可以说是最会整活和把创意模板化的一个了。

▲动图制作自：X@pika_labs

2 月 14 日情人节当天，Pika 又推出了一个新玩法——Pikamemes，目前可以在 iOS app 体验。

体验指路：https://pika.art/app-download

上传一张干净的人物自拍照或者一张宠物的大头照，不用写提示词，一键使用模板，Pikamemes 就可以生成表达各种心情的表情包，并且支持直接下载 gif 动图。

让马斯克送上玫瑰花，或者赏个白眼，都在一念之间。

再往前推，Pika 的多主体参考功能 Pikascenes，支持上传多张参考图片，并保持主体的一致性。集齐人物、商品、场景的照片，就能实现一键试衣了。

▲图片来自：X@martgent

Pika 的 AI 特效功能 Pikaffect，更是一度全网爆火，特别是其中的 AI 捏捏，刷屏小红书和 TikTok，推动 Pika 用户突破 1100 万。

▲图片来自：Pika

Pika 在模型能力之上卷玩法，切中了一群对整活短视频有高需求的用户，让人人都能低门槛地玩得开心。哪怕这些视频是模板化的，稍纵即逝的，但只要有趣，人们就会蜂拥而至。

同时，Pika 也告诉我们，写不好提示词、脑洞不够大、不知道怎么实现主体的一致性，都没关系，等等吧，很快就有包装好的 AI 特效和模板了。

当 AI 工具承载了更低的下限，那就意味着，只要有想法，每个人都可以将微观的创作欲望落地为现实。保持好奇，保持期待，一瞬间的起心动念，就足以让好玩的事情降临。

如有类桶，纯属巧合

沉舟侧畔 Blog

By: springwood

15 February 2025 at 21:54

（Abstract）如有雷同，纯属巧合

DUN.IM BLOG
AI 推理模型和普通 LLM 大语言模型的分别与使用，提升效率与准确性，复杂任务高效完成
8 February 2025 at 14:17

AI 推理模型和普通 LLM 大语言模型的分别与使用，提升效率与准确性，复杂任务高效完成

DUN.IM BLOG

By: Anonymous

8 February 2025 at 14:17

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

了解何时使用推理模型，以及它们与 GPT 模型有何不同。

OpenAI 目前提供两大类模型：

这两种模型家族在使用和效果上都有所不同。本文将介绍：

与 GPT 模型相比，OpenAI 的 o 系列模型（推理模型）在不同类型的任务上更出色，需要使用不同的提示方式。并非哪一种模型一定「更好」，而是各有擅长的领域。

你可以根据需求，思考下列问题：

如果你的任务优先考虑速度与成本，并且任务本身相对明确、好定义，那么使用 GPT 模型就非常合适。
但如果你更注重准确度和可靠性，而且问题本身很复杂、有多个步骤，那么 O pen AI 建议选择 o 系列模型。

大多数情况下，你也可以把这两种模型结合起来使用：用 o 系列模型进行「智能规划和决策」，再让 GPT 模型去执行具体步骤。

AI 推理模型和普通 LLM 大语言模型的分别与使用，提升效率与准确性，复杂任务高效完成

示例：GPT-4o 和 GPT-4o mini 先处理订单信息与客户资料，找出订单问题和退货政策，然后将这些信息提供给 o3-mini，由它根据政策最终决定退货是否可行。

下面列出了一些实际场景，这些案例来自 OpenAI 的客户和 OpenAI 内部，希望能帮助大家更好地理解 o 系列模型（推理模型）适合用在哪些地方。不过，这并不是一个覆盖所有可能用例的完整清单，而是给出一些在测试中行之有效的思路。

准备好使用推理模型了吗？点击这里直达快速入门 →

推理模型特别擅长接收零散、有限的信息，然后根据简单提示去理解用户意图，并处理那些不够明确的指令。它们经常会先问一些澄清性的问题，而不是盲目猜测或随意填补空白。

「o1 的推理能力让 OpenAI 的多智能体平台 Matrix 在处理复杂文档时，能给出详尽且格式良好的回复。举个例子，o1 让 Matrix 可以轻松找出信用协议（Credit Agreement）中受限支付能力（restricted payments capacity）下可以使用的各种『篮子』（baskets），而只需要一个简单提示。过去没有任何模型能这么出色。相比于其他模型，在对密集的信用协议进行复杂提问时，o1 在 52% 的问题上有更好的表现。」

——Hebbia，为法律和金融提供 AI 知识平台

当你需要处理大量无结构信息时，推理模型能很有效地提炼出最相关的部分来回答问题。

「在分析某公司收购案时，o1 审阅了几十份公司文件，比如合同、租约等，去寻找可能影响交易的关键条件。它需要标记重要条款时，甚至在文件脚注中看到了一个非常关键的『变更控制』（change of control）条款：如果公司被出售，那需要立刻偿还 7500 万美元的贷款。o1 的极致细致能力帮助 OpenAI 的 AI 探索工具为金融专业人士找出交易中至关重要的信息。」

——Endex，AI 驱动的金融情报平台

OpenAI 发现，推理模型在处理数百页的复杂文件时（比如法律合同、财务报表或保险索赔等），能很好地分析文件内在逻辑并做出决策。它们擅长挖掘文档之间的对照关系，并据此推断其中暗含的规则。

「在税务研究里，需要同时对多份文件进行综合分析才能得出最终、连贯的结论。OpenAI 把 GPT-4o 换成 o1 后发现，o1 更善于整合多份文件之间的关系并推导出各自交叉影响，让最终的结论比单一文档中能看到的内容更有深度。OpenAI 因此看到终端到终端（end-to-end）性能提升了 4 倍，真的很令人惊讶。」

——Blue J，为税务研究提供 AI 平台

此外，推理模型也很擅长根据各种复杂政策和规则进行推理，并把这些规则应用到实际任务中，得出合理的结论。

「在做金融分析时，分析师常常要面对股东权益方面的复杂情境，还要理解相关法律的细微差别。OpenAI 曾用一个常见但比较棘手的问题来测试了市面上约 10 个模型：如果公司进行融资，对现有股东尤其行使『反摊薄保护』（anti-dilution）的那些股东会有什么影响？这个问题需要推理融资前后估值，还要处理环环相扣的『循环摊薄』，就算优秀的金融分析师也要花 20~30 分钟才能搞清楚。OpenAI 发现 o1 和 o3-mini 在这方面做得近乎完美！模型甚至能给出一张清晰的计算表格，展现对一个投资了 10 万美元的股东有何影响。」

——BlueFlame AI，为投资管理提供 AI 平台

推理模型在做多步骤的「自主」规划和战略制定方面发挥着关键作用。OpenAI 常看到的成功做法是先让推理模型扮演「策划者」，制定详细的多步骤解决方案，再根据每个步骤对「速度/智能」需求的不同，有选择地交给 GPT 模型或 o 系列模型去执行。

「OpenAI 用 o1 来做多智能体系统（agent infrastructure）中的规划者，让它负责指挥其他模型完成多步骤的任务。OpenAI 发现，o1 非常擅长选择要用什么数据类型，也很擅长把大问题拆解成小块，让其他模型聚焦执行。」

——Argon AI，服务于制药行业的 AI 知识平台

「o1 为 OpenAI Lindy 的许多『代理式工作流』提供支持。Lindy 是一个工作助理 AI，能通过函数调用（function calling）去获取你的日历和邮件信息，然后自动帮你安排会议、发邮件、管理日常事务。OpenAI 把一些原本运行不稳定的多步骤流程全部切到 o1 上，结果代理的表现几乎是一夜之间就变得近乎完美！」

——Lindy.AI，一个专注于工作场景的 AI 助手

截至目前，o1 是唯一支持图像理解的推理模型。它与 GPT-4o 的最大区别在于：o1 能处理特别复杂的视觉信息，比如结构不明确的图表或清晰度不佳的照片。

「OpenAI 为线上上架的数百万产品提供风险和合规审核，比如奢侈品仿制、濒危物种、管制品等。GPT-4o 在最难的图像分类任务中只能达到 50% 的准确率，而 o1 能做到 88%，OpenAI 甚至没有对流程做任何修改。」

——Safetykit，负责商家监控的 AI 平台

OpenAI 内部测试也发现：o1 能从复杂的建筑图纸中看出具体的材料和结构信息，进而生成更完整的材料清单。更惊喜的是，o1 还能跨页面匹配，比如先在图纸中的图例（legend）看到「PT」代表「压力处理木材」（pressure treated），然后在图纸的其他页面上正确应用这一概念，尽管并没有明确地告诉它需要这么做。

推理模型在代码审查和改进时也表现出色，往往可以在后台执行代码审阅任务，因为此类需求对延迟的容忍度更高。

「OpenAI 在 GitHub、GitLab 等平台上提供自动化的 AI 代码审阅服务。虽然代码审查过程对延迟不是特别敏感，但却需要理解多文件之间的代码差异。在这方面，o1 表现非常好，它能可靠地识别出对代码库做出的微小改动，而人类审阅者可能会漏掉。切换到 o 系列模型后，OpenAI 的产品转化率提升了 3 倍之多。」

——CodeRabbit，AI 代码审阅初创公司

GPT-4o 和 GPT-4o mini 因为延迟更低，也许更适合写代码，但对于那些不太敏感于执行速度的代码生成需求，o3-mini 有时也能带来更好的复杂性处理。

「o3-mini 写出的代码质量通常很高，而且往往能在明确的问题中得到正确解答，哪怕是非常具有挑战性的编码任务。其他模型也许只能应付小规模、快速的代码迭代，而 o3-mini 在构思、规划和实现复杂软件系统时表现更突出。」

——Codeium，提供 AI 驱动代码插件的初创公司

推理模型还经常被用于对其他模型的输出结果做评测和打分，特别是在需要数据验证的领域里（如医疗保健），保证数据集的质量和可靠性。传统的验证方法通常依赖预先定义的规则和模式，而像 o1 和 o3-mini 这样的高级模型，可以通过理解上下文和推理，对数据做更灵活智能的验证。

「不少客户在 Braintrust 的评测流程中使用了『模型做法官』的功能，比如某个医疗企业先用 GPT-4o 对患者问题进行概要提炼，再用 o1 来给这个概要的质量打分。结果发现，用 GPT-4o 做法官的 F1 分值只有 0.12，而用 o1 做法官，F1 分值达到了 0.74！对这些用户来说，o1 的推理能力在发现微妙差异和复杂场景的评分上表现极好。」

——Braintrust，AI 评估平台

这些模型最适合简洁、直接的提示。一些提示技巧（比如让模型「逐步思考」）不一定能提升性能，有时反而会降低效果。以下是一些提示技巧的最佳实践。

以上就是有关「推理模型」与 GPT 模型的区别、使用场景，以及给推理模型下指令时的一些最佳实践。希望这些指南能帮助你更好地发挥 o 系列和 GPT 系列模型在不同任务中的优势，实现更高效、更准确的 AI 解决方案。