试用 codex 感想:不说 You are absolutely right 是 GPT-5 最好的编程特性之一
如题,从 Claude Code / Cursor 的 Claude Opus 4.1 thinking (带 ultrathink.)迁移到 GPT-5-high 的 Cursor 和 Codex 之后最明显的感想主要有这些:
-
相比于 Claude 系怎么都改不好,无论上多少 prompt 都没办法完全修复的 You are absolutely right 来说,GPT-5 是真的知道什么时候该捧着几个方案和自己的思考去找用户确认一下再动笔写,也知道什么时候去和用户犟嘴,这种讨论能力带来的体验真的很舒适。
-
GPT-5 是真的省 token 。可能和 OpenAI 的 tokenizer 有关,并且 GPT-5 的回答非常简练,在一个 context 里可以完成非常复杂的工作。实际体验下来,同样在 Cursor 里,GPT-5-high-fast 在上下文爆炸之前可以多做三分之一到一半的工作,这使得我可以让它在同一个上下文里做很多代码优化和 bug 修复,而不需要重新去构造新的上下文。
-
GPT-5 会主动反思自己可能漏掉的东西,包括别扭的 tool call ,遗漏的 linting 等等,它几乎从没在我面前主动声称代码质量达到了生产水准。而 Claude Opus 4.1 thinking + ultrathink 虽然也可以搞定问题,但它经常带着 bug 和冗余写法就声称生产水准实在是很掉好感。
-
GPT-5 是明显更信任自己的知识而不是用户的,它的讨论特性会让它可能停下来问我,但我真的需要给它配一个好用的 RAG 才能避免和它反复犟嘴或者去搬一个文档链接出来给它停止争论。在用 GPT-5 的时候,context7 就是完完全全的标配。
-
更大的思考预算。即使是加上 ultrathink ,Claude 系的平均思考长度也是低于 GPT-5-high 的,而且很多时候会像一个复读机一样反复思考一模一样的东西。而 GPT-5-high 的思考就能结结实实向很多方向去探索,即便最后二者都能解决问题,GPT-5-high 的思考也会让我觉得它是更不经验主义的。