Skip to content

跨模型工作流将 Claude Code 和 Codex CLI 在同一个代码库上协作:Claude Code Opus 在 Plan Mode 生成分阶段实现计划,Codex CLI 审查计划并插入补充阶段,Claude Code 按计划实现,Codex 最终验证。两个模型互为 QA,弥补各自的盲点。

跨模型工作流:Claude Code + Codex 协作的完整实践

为什么需要跨模型工作流

单一模型在大型功能开发中存在一个固有盲点:规划者和实现者是同一个模型,它不会质疑自己的计划,也不会从"陌生视角"发现遗漏的边界情况。

引入第二个独立模型(Codex CLI)作为 QA 审查员,可以:

  • 用不同的训练数据和推理方式审视计划
  • 发现原模型可能忽略的边界情况
  • 在不与原计划冲突的前提下添加补充内容

四阶段工作流

┌──────────────────────────────────────────────────────────┐
│            CROSS-MODEL WORKFLOW                          │
│          Claude Code + Codex CLI                         │
├──────────────────────────────────────────────────────────┤
│                                                          │
│  STEP 1: PLAN                          Claude Code       │
│  在 Plan Mode 中开启 Claude Code         Opus 4.6        │
│  Claude 通过 AskUserQuestion 采访你     Plan Mode        │
│  生成带测试门控的分阶段计划                              │
│  → 输出: plans/{feature-name}.md                         │
│                                                          │
│                        ▼                                 │
│                                                          │
│  STEP 2: QA REVIEW                     Codex CLI         │
│  在第二个终端打开 Codex CLI               GPT-5.4        │
│  Codex 对照真实代码库审查计划                            │
│  插入中间阶段("Phase 2.5")                              │
│  标注为 "Codex Finding"                                  │
│  只添加,不改写原有阶段                                  │
│  → 输出: plans/{feature-name}.md(更新)                  │
│                                                          │
│                        ▼                                 │
│                                                          │
│  STEP 3: IMPLEMENT                     Claude Code       │
│  新建 Claude Code 会话(终端 1)          Opus 4.6       │
│  按阶段实现,每个阶段通过测试门控                        │
│                                                          │
│                        ▼                                 │
│                                                          │
│  STEP 4: VERIFY                        Codex CLI         │
│  新建 Codex CLI 会话(终端 2)            GPT-5.4        │
│  Codex 对照计划验证实现                                  │
│                                                          │
└──────────────────────────────────────────────────────────┘

各阶段详解

阶段 1:Plan(Claude Code + Opus + Plan Mode)

工具:Claude Code,切换到 Opus,启用 Plan Mode
操作

  1. Shift+Tab 切换到 Plan Mode(或 --permission-mode plan
  2. 描述你要实现的功能,Claude 会主动提问澄清需求
  3. Claude 生成带测试门控的分阶段实现计划

输出格式plans/{feature-name}.md,包含:

  • 每个阶段的目标和完成标准
  • 每个阶段结束后的测试门控
  • 风险和注意事项

阶段 2:QA Review(Codex CLI + GPT-5.4)

工具:Codex CLI(codex),在独立终端中打开
关键行为

  • Codex 读取计划文件,并扫描实际代码库
  • 发现潜在问题时,插入 "Phase X.5" 中间阶段
  • 用 "Codex Finding" 标题标注所有补充内容
  • 原则:只添加,不改写原有阶段(保留 Claude 的规划意图)

这一步利用 Codex 对代码库的独立扫描,捕捉 Claude 在规划时可能忽略的:

  • 依赖关系和副作用
  • 已有代码中的冲突
  • 缺失的迁移或数据处理步骤

阶段 3:Implement(Claude Code + Opus)

工具:新建 Claude Code 会话
操作

  1. 切换回 default 或 acceptEdits 模式
  2. 按更新后的计划逐阶段实现
  3. 每个阶段完成后运行测试门控,通过后再继续下一阶段

阶段 4:Verify(Codex CLI)

工具:新建 Codex CLI 会话
操作:提供计划文件和已完成的代码,让 Codex 验证:

  • 实现是否覆盖了计划的所有要点
  • 测试是否通过
  • 是否有遗漏的边界情况

为什么这个工作流有效

规划者 ≠ 验证者:Claude 规划后由 Codex 审查,Codex 审查后由 Claude 实现,Claude 实现后由 Codex 验证。两个模型互为对方的盲点审视员。

Plan Mode 的价值:Claude Code 的 Plan Mode 强制只读模式,Claude 不能执行任何操作,只能探索和规划。这确保规划阶段的思考深度,而不是立即开始写代码。

测试门控:每个阶段结束都有明确的测试通过标准,防止"建立在失败基础上的实现"——如果阶段 2 的测试没通过就开始阶段 3,最终的错误会更难诊断。


实践注意事项

不需要总是用四阶段:对于小功能,直接 Claude Code 实现就够了。这个工作流针对的是:复杂的、影响面大的、有多个依赖的功能。

模型选择:规划阶段用 Opus(最深推理),实现阶段根据任务复杂度选 Sonnet 或 Opus。Codex 的 GPT-5.4 提供不同厂商的独立视角。

终端组织:两个终端(Terminal 1 = Claude Code,Terminal 2 = Codex CLI)在同一代码库下工作,通过计划文件传递信息。


FAQ

Q: 这个工作流对所有功能都值得用吗? A: 不是。对于简单的 bug 修复或小型功能,这四个阶段的开销大于收益。推荐用于:影响多个模块的大功能、有数据迁移需求的修改、团队协作的关键路径功能。

Q: 如果没有 Codex CLI,可以用别的工具替代 QA 阶段吗? A: 可以用任何其他能读代码库的 AI 工具(如 Cursor、GitHub Copilot Chat)来做 QA 审查,核心是"第二个独立的眼睛"。即使用同一个 Claude,在新会话中作为审查者(而非规划者)也比完全不审查好。

Q: Codex 的 "只添加,不改写" 原则怎么强制执行? A: 这是在给 Codex 的提示词中明确的约束。提示词示例:"审查这个计划文件,如果发现问题,插入 Phase X.5 标注 Codex Finding,不要修改原有阶段内容。"