我差点错过了Codex

张开发
2026/4/17 2:15:05 15 分钟阅读

分享文章

我差点错过了Codex
不是那种戏剧性的把笔记本电脑摔掉的方式。更像是那种安静的、筋疲力尽的沮丧你盯着屏幕心想为什么我要跟一个本该帮助我的工具较劲我之前一直在用 Claude Code。那里的一切感觉很顺畅。我可以粘贴一段错误日志随便解释几句Claude 就能大概……理解了。它能推断意图能填补空白感觉像在对话。Codex 不行。我粘贴了一段错误日志。 它回复道 “你想用这个做什么”这是第一击。然后权限系统启动了。 不断的提示。 对我显然希望它做的事情反复打断。 还有那个始终允许选项它不知怎么地记住了pnpm install nuqs却不记得pnpm install。到了某个时刻我忍不住想这东西根本没法用。我错了。不是因为 Codex 一夜之间神奇地变好了。而是因为我终于理解了它到底是什么以及它绝对不是什么。以下是我一开始犯的核心错误我把 Codex 当成了 Claude Code。这听起来微不足道。其实不然。Claude 擅长推断意图。你含糊地指向一个问题它就会靠过来填补空白提出明智的追问。它默认就是对话式的。Codex 不这么做。Codex 会等待。如果你不确切告诉它该做什么它就会礼貌地坐在那里像一个非常有能力但拒绝猜测你意图的工程师。起初这感觉很不友好。然后你会意识到一件事。Codex 不是为聊天优化的。 它是为执行优化的。长时间的执行。无聊的执行。那种你不想盯着看的工作。但你得配合它。1、权限系统差点让我放弃让我们聊聊那个差点让我退坑的东西。权限系统。每条命令。 每次安装。 每个小操作。它不断地停下来问这样可以吗是的我明白它为什么存在。安全很重要。但在实际使用中它完全打断了工作流。最后一根稻草是意识到始终允许此类命令指的是这个精确字符串而不是这类命令。允许了pnpm install nuqs对下一次需要pnpm install毫无帮助。那时我学到了唯一重要的命令codex --yolo我现在把codex别名到了codex --yolo。毫不夸张地说这就是转折点。突然之间Codex 不再请求许可开始像一个真正的代理一样行动。它变得可用了。流畅了。专注了。这不是给所有人的建议。但对我来说它把 Codex 从不断打断我变成了安静地把事情做完。第二件改变一切的事是我不再把 Codex 当成聊天框而是开始把它当成一个系统来对待。这个系统的核心是一个AGENTS.md文件。这不是空话。这是操作记忆。我从这个文件中获得了大量灵感https://github.com/steipete/agent-scripts/blob/main/AGENTS.MD是的我几乎复制了全部内容。然后我重新措辞、精简删除了任何不适用于我的工作或我不使用的技能的内容。但重要的不是复制它。而是理解为什么它是这样写的。2、你必须明确。烦人地明确另一个花了我几天时间才适应的调整。Codex 在推断意图方面更差。这是事实。有太多次我问类似为什么这个失败了“的问题它甚至都不看代码库。或者它会问你想让我检查一下仓库吗”是的。显然是的。请直接做吧。但这就是关键。Codex 不做假设。所以现在我写这样的提示“检查仓库。找到这个错误的源头。修复它。添加一个回归测试。”起初感觉啰嗦。然后它开始见效。因为当你给 Codex 好的指令时它一次性完成任务比 Claude Code 可靠得多。垃圾进垃圾出在这里比任何地方都更适用。而真正的突破是给 Codex 一种验证自己工作的方式。测试。基准。检查门。清晰的通过/失败条件。一旦你这样做了它不再是一个聊天机器人而变成了一个工作者。3、制定计划是超能力如果我需要结构我就输入“制定一个计划。”就这样。Codex 列出步骤。清晰。有条理。有时很无聊。而这正是你想要的。然后是那句仍然给我带来一点点多巴胺快感的话“执行计划在所有测试通过之前不要停止。”Codex 会照字面意思执行。它不会停下来。 它不会问你是否确定。 它不会分心。它就是……工作。说实话一个缺点是 Codex 说话真的很干巴巴的。有时我一开始甚至不明白它在说什么。这可能是我自己的技能问题。但这是我愿意接受的权衡。4、Codex 彻底震撼我的地方长时间运行的任务。这是 Codex 悄悄碾压大多数替代方案的地方。我有一个谜题生成器困难难度的谜题每个大约需要 60 秒。太慢了。所以我让 Codex 优化它。然后让它创建基准测试脚本。然后我告诉它“持续运行和测试直到低于 1 秒。”然后我就不管了。一个多小时后它完成了。 基准测试通过。 代码干净。 一切正常。不需要盯着看。不需要推动。不需要嘿你也检查一下这个。那一刻我明白了。Codex 是一匹工作马。它会花时间。它会深思熟虑。如果你给它一个清晰的完成标准它就会达成目标。5、但它太慢了是个迷思我经常听到这个抱怨。我理解。Codex 感觉很慢。但关键在这里。使用 Opus 4.5 时我通常需要后续提示。修复。纠正。“哦你漏了这个。”这些中断会累积起来。对于大型任务两种方法通常花费相同的实际时间。Codex 只是把思考前置了而不是让你去微观管理。而且说实话对于较大的变更Bugbot 在 Opus 4.5 的实现中捕获了很多问题。不同的工具。不同的权衡。6、真正重要的转变一旦你不再期望 Codex 能读懂你的心思一切都会改变。你不再聊天。 你开始明确规格。 你给它护栏和验证机制。突然间你不再是结对编程了。你在委派任务。所以没错。 运行codex --yolo。 设置你的 AGENTS.md。 要明确。 让它运行。然后看着它安静地超越你。原文链接我差点错过了Codex - 汇智网

更多文章