134. 如何用好 Codex

2026.05.21

·codex

1. 一图甚千言

134-infographic-v2.webp|344

持续更新自己使用 Codex 的新登

2. 总结

  • Codex 对我最大的价值,不是“更会写代码”。
    • 而是能把上下文、文件、工具、命令和验收接到一起。
  • 832 是 Codex 的工作地图
    • README.md / AGENTS.md 告诉它边界。
    • os/notes 承接长期笔记。
    • whoami 承接自我判断。
    • skills 承接稳定动作。
    • auto/ 承接本机自动化。
    • general-agent-lab 承接主线实验。
  • 用好 Codex 的标准很简单:
    • 有没有减少上下文搬运 ?
    • 有没有产出真实文件 ?
    • 有没有可验收结果 ?

3. 当前判断

  • Codex 不是一个更聪明的聊天框。
    • 它更像一个可以持续工作的执行线程。
  • thread 不是最终记忆库。
    • 它只是工作现场
    • 真正需要长期保留的东西,还是要中途纠偏
  • memory 不是偷懒入口。
    • 重要规则要落到 AGENTS.md
    • 稳定流程要落到 skills
    • 自我判断要落到 whoami
  • automation 不能用来包装我还没想清楚的事。
    • 有固定输入、固定输出、明确验收,才值得自动化。
  • Goals 的关键不是目标大。
    • 是有没有验证器。
    • 没有验证器,长任务很容易变成许愿

4. 我的用法

  • workspace 任务:
    • 先读 README.md / AGENTS.md
    • 确认这件事属于根目录,还是某个子工程。
    • 不要把 osskillsauto、发布工具混在一起改。
  • 写作任务:
    • 先读原文、草稿和相关上下文。
    • 输出大纲笔记,不写教程合集
    • 重点保留我的判断、用法和下一步
  • 代码任务:
    • 先读真实链路。
    • 改完看 diff。
    • 能跑测试就跑测试。
    • 前端必须尽量截图或浏览器验收
  • 研究任务:现在只聚焦到 general-agent-lab
    • 不只总结源码。
    • 要沉淀到 general-agent-labnotes
    • 最好能指向一个 mini 原型产品判断

5. 中途纠偏:一直 steering,你才是掌舵者

  • Codex 很容易顺着材料写成长文。
    • 及时打断。
  • Codex 很容易把任务做大。
    • 把它拉回最小可用版本。
  • Codex 很容易说“已完成”。
    • 我要看文件、diff、截图、测试结果。

我不能只给 Codex 一个大方向,然后等它自己悟。

我应该在过程中不断补充:

  • 这不是我要的口气。
  • 太像说明书了。
  • 再短一点。
  • 回到 832 的真实用法。
  • 给我一个能验收的结果。

6. 工具怎么选

  • $browser
    • 看本地页面。
    • 验收前端效果。
    • 截图比听总结可靠。
  • @chrome
    • 需要真实登录态时再用。
    • 不要为了“完整”随便接。
  • @computer
    • 只能点 GUI 的事情再用
    • 能用文件和命令解决的,不先走桌面操作。
  • MCP / CLI
    • 适合稳定外部系统。
    • 但写入外部服务前要确认边界。
  • skills
    • 只沉淀反复出现的流程。
    • 一次性偏好不要过度工程化。

7. 自动化的边界

  • 可以自动化:
    • 固定检查。
    • 固定生成。
    • 固定同步。
    • 有失败日志。
    • 有人工确认点。
  • 不要自动化:
    • 方向不清楚的事。
    • 需要我做价值判断的事。
    • 可能污染公开内容的事。
    • 只是为了让我感觉系统很完整的事。

自动化的基本闭环应该是:

text
检查 -> 处理 -> 验证 -> 留痕 -> 等我确认

缺一个,就先别急着自动化。

8. 继续观察

  • Goals 是否适合个人项目里的长任务。
    • 尤其是 general-agent-lab 这种持续研究。
  • thread automation 是否能做轻量回访。
    • 不能变成新的噪音源。
  • Memory / Chronicle 哪些适合作辅助。
    • 哪些必须落到 whoamiAGENTS.md
  • browser / computer-use 在前端验收里到底能省多少事。
  • 什么流程值得写成 skill
    • 什么只是一次性任务。

9. 提醒

  • 不要为了追新功能,把 Codex 用复杂。
  • 自己总结自己的,不要关心别人的功能清单
  • 不要再用“研究工具”代替真实产出。
  • 真正重要的是:
    • 文章有没有写出来。
    • 代码有没有跑通。
    • 原型有没有成形。
    • 判断有没有沉淀。
    • 下一步有没有变清楚。

Codex 用得好不好,最后只看它有没有帮我把真实材料变成真实产出。

10. 相关来源

飞书剪存:https://beike.feishu.cn/docx/NKgzdukaqo5NWdxpuBgccYkwnuh

原文:Getting the most out of Codex
https://x.com/jxnlco/status/2057153744630890620