134. 如何用好 Codex

2026.05.21

·codex

134-infographic-v3.webp|368

134-infographic-v2.webp|344

本篇文章持续更新中,总结自己使用 Codex 的新理解。

1. 重点

134-infographic.webp|448

  • Codex 不是更聪明的聊天框,而是一个工程化执行线程。
    • 它能把模型、上下文、文件、命令、权限、外部系统和验收串起来。
  • 我需要控制四件事:
    • 给它地图。
    • 管住权限。
    • 中途纠偏。
    • 用结果验收。

2. 先给它地图

832 是 Codex 的工作地图。

  • README.md / AGENTS.md:告诉它 workspace 边界。
  • os/notes:承接长期笔记。
  • whoami:承接自我判断。
  • skills:承接稳定动作。
  • auto/:承接本机自动化。
  • general-agent-lab:承接主线实验。

每次进入任务,先判断它属于哪里。

3. 地基先铺好

Git 、Nodejs、Zed 等

4. 沙箱和权限

权限上,最佳平衡是“自动审查”:低风险动作尽量顺,高风险动作停下来确认。

codex-source-02.webp|568

codex-source-03.webp|568

20260524_1.webp|424

5. Plan 和 Steer

  • 复杂任务先 Plan,但 Plan 不要变成仪式。
    • 小修小改,直接做。
    • 复杂任务,先计划。
    • 计划必须带验收方式。
    • 没有验收器的 Goal,很容易变成许愿。
  • 跑偏时立刻 Steer
    • 这不是我要的口气。
    • 太像说明书了。
    • 再短一点。
    • 回到 832 的真实用法。
    • 给我一个能验收的结果。
    • 不要继续扩范围。

快捷键得换一下,当前的个人快捷键不太好

6. Git、回滚和并行

  • Git 很重要
  • worktree 是并行能力,但不要乱开

7. 验收台

Codex 说“完成了”不算完成。你是业务方,一定要 “验收”

要看的东西是:

  • 文件改了什么、git diff 是否符合预期、测试/构建/lint 有没有跑、前端页面有没有实际打开、截图能不能证明结果、发布链路有没有污染公开内容。

8. 工具怎么接

Codex 强在可以接工具,但工具不是越多越好。

codex-source-05.webp|536

  • $browser
    • 看本地页面。
    • 验收前端效果。
    • 截图比听总结可靠。
  • @chrome
    • 需要真实登录态时再用。
    • 不要为了“完整”随便接。
  • @computer
    • 只能点 GUI 的事情再用。
    • 能用文件和命令解决的,不先走桌面操作。
  • MCP / CLI
    • 适合稳定外部系统。
    • 写入外部服务前要确认边界。
  • plugins
    • 接上之前先问:这是不是我的真实工作流?
  • skills
    • 只沉淀反复出现的流程。
    • 一次性偏好不要过度工程化

9. 自动化和 Skill

自动化只适合已经想清楚的事

  • 可以自动化:
    • 固定检查、固定生成、固定同步、有失败日志、有人工确认点。
  • 不要自动化:
    • 方向不清楚、需要我做价值判断、可能污染公开内容、只是为了让我感觉系统很完整的事。

自动化的基本闭环应该是:

text
检查 -> 处理 -> 验证 -> 留痕 -> 等我确认

Skill 也是一样。它不是把所有偏好都写成 SOP,而是把反复出现、输入输出稳定、能节省真实时间的流程沉淀下来。

这类流程值得写成 Skill。一次性口味、临时偏好、还没跑通的流程,先留在 thread 或 note

10. 记忆和规则

thread 不是最终记忆库。

codex-source-04.webp|568

  • 项目边界,写进 AGENTS.md
  • 长期自我判断,写进 whoami
  • 稳定流程,写进 skills
  • 固定执行,写进 auto/

全局安全规则也要落文件,尤其是危险动作。

  • 不要批量删除文件或目录。
  • 必须删除时逐个确认。
  • 不确定就停下来,让我手动确认。

真正重要的不是 Codex 记住了多少,而是关键规则有没有进入可复用的工作系统。

11. 提醒

codex-source-06.webp|568

  • 不要为了追新功能,把 Codex 用复杂。
  • 不要只关心别人的功能清单。
  • 不要用“研究工具”代替真实产出。
  • 参考资料有价值,但要翻译成自己的工作流。
  • 文章有没有写出来、代码有没有跑通、原型有没有成形、判断有没有沉淀、下一步有没有变清楚,比“功能知道多少”更重要。

Codex 的核心不是聊天,是把模型、上下文、文件、工具、权限、外部系统和验收串起来。

12. 其他

  • Goals 是否适合个人项目里的长任务?
  • thread automation 是否能做轻量回访。
    • 不能变成新的噪音源。
  • Memory / Chronicle 哪些适合作辅助。
    • 哪些必须落到 whoamiAGENTS.md
  • browser / computer-use 在前端验收里到底能省多少事。
  • 什么流程值得写成 skill
    • 什么只是一次性任务。

13. 相关来源

Codex为什么叫超级Agent:本篇教你学会它的12 个进阶玩法!

https://x.com/0xshimei/status/2055532962993815608

Getting the most out of Codex

https://x.com/jxnlco/status/2057153744630890620