Santa Method Skill 是 Everything Claude Code 插件体系中的多 Agent 对抗验证方案，核心机制是“生成→双独立审查→全部通过才输出”。相比单 Agent 自我审查易受偏见和盲点影响，Santa Method 强制两个互不知情的 Reviewer 并行评审，只有全部通过才允许交付结果。适用于生产发布、合规要求高、内容准确性关键等场景，可与 Verification Loop、Eval Harness 等 Skill 组合，显著提升自动化输出的安全性和一致性。

Everything Claude Code Santa Method Skill：两个独立审查代理全部通过才输出的多 Agent 对抗验证

Santa Method Skill 是 Everything Claude Code 插件体系中专为高风险输出场景设计的对抗式多 Agent 验证机制。它通过“Make a list, check it twice”的流程，要求每次输出都必须经过两名完全独立的审查 Agent（Reviewer B 和 Reviewer C）并且全部通过，才能正式交付。该方法有效解决了单一 Agent 审查自身输出时的偏见、知识盲区和系统性错误问题，是 AI 编程助手落地生产环境时的关键安全防线。

相比传统的“生成-自审-发布”流程，Santa Method Skill 的多 Agent 对抗验证能极大降低幻觉、遗漏、合规风险和潜在 Bug 的漏检概率。它适用于代码自动发布、技术文档、客户可见内容、批量生成等场景，尤其在无人工复核或对准确性有严格要求时表现突出。Santa Method Skill 也是 Everything Claude Code 高级自动化体系（如 Verification Loop、Eval Harness）的重要组成部分。

适用场景与触发条件

Santa Method Skill 主要在以下场景下激活：

输出将被直接发布、部署或面向终端用户消费
必须强制执行合规、品牌或监管约束（如金融、医疗、法律等领域）
代码自动上线且缺乏人工复核环节
内容准确性极为重要（如技术文档、教学材料、客户沟通文案）
大规模批量生成，人工抽查难以发现系统性问题
幻觉风险高（涉及事实、数据、API、法律声明等）

不建议在内部草稿、探索性研究或可用确定性自动验证（如 build/test/lint pipeline）任务中使用 Santa Method，避免资源浪费。

Step by Step：Santa Method Skill 实战流程

Santa Method Skill 的完整流程分为四个阶段，推荐结合 Claude Code 快速上手指南理解整体 Agent/Skill/Hooks 体系。

阶段 1：生成（Make a List）

由主生成 Agent（如代码生成、文档写作 Agent）正常完成任务，无需改变原有生成逻辑。
Santa Method Skill 作为后置验证层，不干预生成策略。

python

# 生成阶段
output = generate(task_spec)

阶段 2：双独立审查（Check It Twice）

并行启动两名 Reviewer Agent（B、C），完全隔离上下文，互不知晓对方评审结果。
两者收到相同的任务说明、生成输出和客观 Rubric（评审标准）。
每位 Reviewer 必须输出结构化 JSON，包括总判定（PASS/FAIL）、每项细则检查、关键问题、改进建议。

python

REVIEWER_PROMPT = """
你是独立的质量审查员，未见过其他人的评审。请严格按 Rubric 检查输出，每项都给出 PASS/FAIL 及具体问题，输出结构化 JSON。
"""
# 并行启动
review_b = Agent(prompt=REVIEWER_PROMPT.format(...), description="Santa Reviewer B")
review_c = Agent(prompt=REVIEWER_PROMPT.format(...), description="Santa Reviewer C")

Rubric 设计要点：每项标准必须有明确的通过条件和失败信号。例如：

标准	通过条件	失败信号
事实准确性	所有声明可查证	虚构数据、错误 API、版本号错误
幻觉防控	无伪造实体/引用/链接	不存在的页面、假引言
完整性	全部需求均被覆盖	缺漏、跳过边界情况
合规性	满足项目/法规/品牌约束	使用禁用词、语气不符、合规缺失
技术正确性	代码可编译/运行、算法正确	语法错误、逻辑 Bug、复杂度错误

可根据领域扩展（如内容/SEO、代码安全、金融合规等）。

阶段 3：判定门控（Naughty or Nice）

只有 Reviewer B 和 C 全部 PASS 才允许输出，否则进入修复循环。
合并两位 Reviewer 的所有关键问题和建议，去重后作为修复输入。

python

def santa_verdict(review_b, review_c):
    if review_b.verdict == "PASS" and review_c.verdict == "PASS":
        return "NICE"  # 允许发布
    all_issues = dedupe(review_b.critical_issues + review_c.critical_issues)
    all_suggestions = dedupe(review_b.suggestions + review_c.suggestions)
    return "NAUGHTY", all_issues, all_suggestions

为什么必须两者全过？
如果只有一方发现问题，说明该问题真实存在，另一方的盲区正是 Santa Method 要消除的系统性风险。

阶段 4：修复循环（Fix Until Nice）

由修复 Agent 针对所有关键问题进行最小化修正（只修问题，不做无关重构）。
修复后重新并行启动全新 Reviewer B、C，保证每轮审查无历史记忆，防止锚定偏见。
最多循环 3 轮，仍未全部通过则自动升级为人工介入。

python

MAX_ITERATIONS = 3
for iteration in range(MAX_ITERATIONS):
    verdict, issues, suggestions = santa_verdict(review_b, review_c)
    if verdict == "NICE":
        return ship(output)
    # 修复所有关键问题
    output = fix_agent.execute(output=output, issues=issues, instruction="只修正标记问题")
    # 启动全新 Reviewer
    review_b = Agent(prompt=REVIEWER_PROMPT.format(output=output, ...))
    review_c = Agent(prompt=REVIEWER_PROMPT.format(output=output, ...))
# 超过最大轮次，升级为人工复核
escalate_to_human(output, issues)

批量场景下的采样优化

如需批量处理（如 100+ 输出），可采用分层采样：对 10-15% 随机样本全量跑 Santa，归纳共性问题后批量修正，再抽样复核，直到样本全过，大幅降低成本。

输出示例

以代码自动发布为例，Santa Method Skill 的 Reviewer 输出结构如下：

json

{
  "verdict": "FAIL",
  "checks": [
    {"criterion": "事实准确性", "result": "PASS", "detail": ""},
    {"criterion": "安全合规", "result": "FAIL", "detail": "代码中发现明文 API 密钥"},
    {"criterion": "完整性", "result": "PASS", "detail": ""}
  ],
  "critical_issues": ["代码中发现明文 API 密钥"],
  "suggestions": ["增加单元测试覆盖边界情况"]
}

只有当所有 Reviewer 均为 "verdict": "PASS" 时，才会进入最终发布。

常见配套 Agent 与 Skill 协作关系

推荐搭配：Verification Loop（用于构建/测试/Lint 的确定性验证，Santa 主要处理语义/合规/准确性等主观问题）
与 Eval Harness 联动：Santa Method 的通过率、问题类型可作为评估指标，反向优化生成 Agent 质量
与 Continuous Learning v2 协作：Santa 检查出的重复性问题可转化为“本能”，推动 Agent 行为进化
与 Strategic Compact 配合：应在上下文压缩前先运行 Santa，避免验证信息丢失

关键指标与成本分析

首轮通过率：70% 以上为佳，过低说明生成 Agent 或 Rubric 需优化
平均收敛轮次：建议 <1.5，过高需关注 Reviewer 质量或 Rubric 明确性
问题类型分布：可追踪幻觉、遗漏、合规等不同风险点
Reviewer 一致性：两者都发现的问题比例，低说明 Rubric 需更客观
后验漏检率：上线后仍被发现的问题，需尽量趋近于 0

成本通常为单次生成的 2~3 倍 token 消耗，但对高风险场景而言极具性价比。批量采样模式可将成本降至 15~20%，但仍能捕捉 90% 以上系统性问题。

常见问题与注意事项

Q: Santa Method Skill 适合所有输出场景吗？ A: 不适合。仅推荐在高风险、需强合规或无人工复核的场景。内部草稿、探索性任务无需使用。

Q: 两个 Reviewer 仍然一致漏掉同一问题怎么办？ A: 虽然完全消除不可能，但 Reviewer 独立性已极大降低风险。对于极关键输出，可增加第三 Reviewer 或人工 spot-check。

Q: 如何设计高效的 Rubric？ A: 每项标准需有客观、可操作的通过条件和失败信号，避免主观化描述。Rubric 越明确，Reviewer 结果越一致。

通过 Santa Method Skill，AI 编程助手的自动化输出获得了类似“多重签字”般的安全保障，大幅提升了代码、文档、内容等关键交付物的可靠性和合规性。结合 Everything Claude Code 体系的其他 Agent 与 Skill，可实现端到端的生产级 AI 编程自动化闭环。

Everything Claude Code Santa Method Skill：两个独立审查代理全部通过才输出的多 Agent 对抗验证 ​

适用场景与触发条件 ​

Step by Step：Santa Method Skill 实战流程 ​

阶段 1：生成（Make a List） ​

阶段 2：双独立审查（Check It Twice） ​

阶段 3：判定门控（Naughty or Nice） ​

阶段 4：修复循环（Fix Until Nice） ​

批量场景下的采样优化 ​

输出示例 ​

常见配套 Agent 与 Skill 协作关系 ​

关键指标与成本分析 ​

常见问题与注意事项 ​

Everything Claude Code Santa Method Skill：两个独立审查代理全部通过才输出的多 Agent 对抗验证

适用场景与触发条件

Step by Step：Santa Method Skill 实战流程

阶段 1：生成（Make a List）

阶段 2：双独立审查（Check It Twice）

阶段 3：判定门控（Naughty or Nice）

阶段 4：修复循环（Fix Until Nice）

批量场景下的采样优化

输出示例

常见配套 Agent 与 Skill 协作关系

关键指标与成本分析

常见问题与注意事项