Code Review 技能解决的是“AI 说完成了，但代码能不能合并没人知道”的问题。审查时不要只看功能表面，要按正确性、可读性、架构、安全和性能五个角度检查，并把问题分成必须修和可以后续优化。

AI 写完代码怎么审：Code Review 技能怎么用

下载 code-review-and-quality 中文版 Skill ZIP

Claude Code 回了一句：“完成了。”

它确实改了文件，也可能跑了测试。

但“完成了”不等于“可以合并”。

code-review-and-quality 这个技能的目标，是把 AI 生成的代码重新拉回工程审查流程。不要把 Agent 的自我总结当成结论，要看 diff、看测试、看风险。

先看测试，再看实现

很多人 review AI 代码，会直接从实现文件开始看。

更稳的顺序是先看测试或验证证据。

因为测试能告诉你：AI 以为自己解决了什么问题。

如果测试写偏了，代码写得再漂亮也可能没意义。比如需求是“未登录用户不能访问设置页”，AI 却只测了“设置页能正常渲染”。这类测试不能证明权限逻辑正确。

如果没有测试，也要看它有没有真实验证：跑了哪个命令、打开了哪个页面、覆盖了哪个用户路径。

没有证据的“完成”，只能算待确认。

五个角度审 AI 代码

agent-skills 里的代码审查强调五个角度。你不需要写很长报告，但这五件事最好都过一遍。

正确性

它真的解决了原问题吗？

要检查：

核心需求是否满足。
边界条件是否覆盖。
旧行为是否被破坏。
错误路径是否合理。

AI 常见问题是只修 happy path。表面路径能跑，异常输入、空状态、权限边界都没管。

可读性

代码以后人能不能维护？

要检查：

命名是否清楚。
函数是否过长。
条件分支是否绕。
是否出现为了过测试写出的奇怪代码。

AI 有时会写出“能跑但不像人写的代码”。这种代码短期没问题，后面会拖慢维护。

架构

改动是否放在合适位置？

要检查：

是否绕过现有模式。
是否新增了不必要抽象。
是否把业务逻辑塞进 UI。
是否为了一个场景破坏公共接口。

AI 很容易因为没看全项目模式，写出一套局部自洽但和项目不搭的方案。

安全

有没有引入明显风险？

要检查：

用户输入是否被信任。
是否暴露 token、密钥、错误细节。
是否有权限绕过。
是否把敏感数据写进前端或日志。

只要涉及登录、权限、用户输入、文件系统、数据库、外部 API，就不能只看功能能不能跑。

性能

有没有明显浪费？

要检查：

是否在循环里重复请求。
是否引入无界查询。
是否让页面重复渲染。
是否把大对象塞进不必要的状态。

不需要提前优化一切，但明显的低级性能问题要拦住。

把问题分级，而不是全都重写

审查 AI 代码时，容易走两个极端：要么全盘接受，要么看不顺眼就重写。

更好的做法是分级：

必须修：功能错误、安全风险、数据丢失、测试失败。
应该修：明显可维护性问题、架构位置不对、边界遗漏。
可后续：命名小瑕疵、局部风格不统一、非关键优化。

这样 review 不会变成无限重构。

AI 写的代码不需要完美，但必须安全、正确、可维护。

给 AI 做自审也要有规则

你可以让 AI 自己先审一遍，但不要问“有没有问题”。

它大概率会说没有。

更好的 prompt 是：

请按下面五个角度审查刚才的 diff：
1. 正确性：是否满足需求，有没有边界遗漏。
2. 可读性：命名、函数长度、分支复杂度。
3. 架构：是否符合项目现有模式。
4. 安全：是否涉及用户输入、权限、敏感数据。
5. 性能：是否有明显重复计算、重复请求或无界操作。

只列出真实问题，不要为了凑数量编问题。
把问题分成：必须修、应该修、可后续。

这比“帮我 review 一下”有效得多。

古法编程里的代码审查

古法编程不把“测试通过”当终点。

测试能证明一部分行为，review 负责看测试没覆盖的地方：设计是否合理，边界是否清楚，风险是否可控。

AI Agent 可以写代码，也可以帮你审代码。可最终判断要在人手里。

AI 写完代码怎么审：Code Review 技能怎么用 #

先看测试，再看实现 #

五个角度审 AI 代码 #

正确性 #

可读性 #

架构 #

安全 #

性能 #

把问题分级，而不是全都重写 #

给 AI 做自审也要有规则 #

古法编程里的代码审查 #

你可能还需要 #

AI 写完代码怎么审：Code Review 技能怎么用

先看测试，再看实现

五个角度审 AI 代码

正确性

可读性

架构

安全

性能

把问题分级，而不是全都重写

给 AI 做自审也要有规则

古法编程里的代码审查

你可能还需要