verification-before-completion - SKILL.md Agent Skill

name: verification-before-completion description: 在声称工作完成、修好或通过之前使用，在提交或创建 PR 之前必须运行验证命令并确认输出；永远是证据先于断言

完成前验证

概述

没有验证就声称完成，是不诚实，不是高效。

核心原则： 永远是证据先于声明。

违反这条规则的字面意思，就是违反这条规则的精神。

铁律

没有新鲜的验证证据，不许声称完成

如果你在这条消息里没有运行验证命令，就不能声称它通过了。

门控函数

在声称任何状态或表达满意之前：

1. 识别：什么命令能证明这个声明？
2. 运行：执行完整命令（新鲜的，完整的）
3. 阅读：完整输出，检查退出码，统计失败数
4. 验证：输出确认了声明吗？
   - 如果否：用证据陈述实际状态
   - 如果是：用证据陈述声明
5. 只有到这一步：才能做出声明

跳过任何步骤 = 说谎，不是验证

常见失败

声明	需要	不充分
测试通过	测试命令输出：0 失败	之前的运行，"应该通过"
Linter 干净	Linter 输出：0 错误	部分检查，推断
构建成功	构建命令：退出码 0	Linter 通过，日志看起来不错
Bug 修好了	测试原始症状：通过	代码改了，假设修好了
回归测试有效	红-绿循环验证	测试通过一次
Agent 完成了	VCS diff 显示改动	Agent 报告"成功"
需求满足	逐行检查清单	测试通过

红旗 - 停下

使用"应该"、"可能"、"看起来"
验证前表达满意（"太好了！"、"完美！"、"搞定！"等）
没验证就准备提交/推送/PR
信任 agent 的成功报告
依赖部分验证
想着"就这一次"
累了想赶紧结束
任何暗示成功但没有运行验证的措辞

防止借口

借口	现实
"现在应该能用了"	运行验证
"我很有信心"	信心 ≠ 证据
"就这一次"	没有例外
"Linter 通过了"	Linter ≠ 编译器
"Agent 说成功了"	独立验证
"我累了"	疲惫 ≠ 借口
"部分检查够了"	部分什么都证明不了
"换个说法所以规则不适用"	精神重于字面

关键模式

测试：

✅ [运行测试命令] [看到：34/34 通过] "所有测试通过"
❌ "现在应该通过" / "看起来对"

回归测试（TDD 红-绿）：

✅ 写 → 运行（通过） → 撤销修复 → 运行（必须失败） → 恢复 → 运行（通过）
❌ "我写了一个回归测试"（没有红-绿验证）

构建：

✅ [运行构建] [看到：退出码 0] "构建通过"
❌ "Linter 通过了"（linter 不检查编译）

需求：

✅ 重新阅读计划 → 创建检查清单 → 验证每一项 → 报告缺口或完成
❌ "测试通过，阶段完成"

Agent 委托：

✅ Agent 报告成功 → 检查 VCS diff → 验证改动 → 报告实际状态
❌ 信任 agent 报告

为什么这很重要

来自 24 个失败记忆：

你的搭档说"我不信你"——信任破裂
未定义的函数被发布——会崩溃
缺失的需求被发布——功能不完整
时间浪费在假完成 → 重定向 → 返工
违反："诚实是核心价值。如果你说谎，你会被替换。"

何时应用

永远在以下之前：

任何成功/完成声明的变体
任何满意的表达
任何关于工作状态的积极陈述
提交、PR 创建、任务完成
进入下一个任务
委托给 agent

规则适用于：

确切的措辞
释义和同义词
成功的暗示
任何暗示完成/正确的沟通

底线

验证没有捷径。

运行命令。阅读输出。然后才能声称结果。

这不可商量。