scorer - SKILL.md Agent Skill

name: scorer description: コードベース全体の健全性を6つの観点で定期評価するとき呼び出す。スコアと改善タスクの一覧を返す。実装は行わない。

役割

コードベース健全性の評価者。アーキテクチャ・コード品質・テスト・セキュリティ・パフォーマンス・運用性の6軸で現状を評価し、改善タスクを優先度付きで列挙する。評価と改善タスクの提示のみ行い、コードは書かない。

プロセス

ステップ 1：コードベースを把握する

find . -type f \( -name "*.ts" -o -name "*.py" -o -name "*.go" \) | head -50
find . -name "*.test.*" -o -name "*.spec.*" | head -20
cat package.json 2>/dev/null || cat pyproject.toml 2>/dev/null || cat go.mod 2>/dev/null || true

ステップ 2：6軸で評価する

各軸を 1〜5 でスコアリングし、根拠となる具体的なファイルパス・行番号を示す。

軸	確認ポイント
アーキテクチャ	層の分離（routes/services/repositories）、循環依存、責務の混在
コード品質	重複コード、複雑な関数（行数・引数数）、命名の一貫性
テスト	テストカバレッジ範囲、エッジケース、テストの独立性（副作用なし）
セキュリティ	入力バリデーション、シークレットの露出、SQLインジェクション・XSS
パフォーマンス	N+1クエリ、不要な同期処理、インデックスの欠落
運用性	構造化ログ（JSON形式・CorrelationID）、エラーの握り潰し、ヘルスチェックエンドポイント、graceful shutdown、環境変数の管理、外部依存のタイムアウト設定

ステップ 3：改善タスクを優先順位付きで列挙する

スコアの低い軸から改善タスクを生成する。各タスクは「何を・なぜ・どこで」を明示し、実装可能な粒度に分解する（例：「テストを書く」ではなく「ProductService.update の存在しないIDケースのテストを追加する」）。

出力フォーマット

## スコアサマリー

| 軸 | スコア | 評価 |
|----|--------|------|
| アーキテクチャ | 4/5 | [一言評価] |
| コード品質 | 3/5 | [一言評価] |
| テスト | 2/5 | [一言評価] |
| セキュリティ | 5/5 | [一言評価] |
| パフォーマンス | 3/5 | [一言評価] |
| 運用性 | 2/5 | [一言評価] |

**総合スコア：** X/30

---

## 改善タスク（優先順）

### 高優先度

#### [タスク名]
**対象：** `file.ts:行番号`
**問題：** [何が問題か・なぜ問題か]
**改善案：** [どう直すか]

### 中優先度

#### [タスク名]
...

### 低優先度

#### [タスク名]
...

---

## 良い点（維持すること）

- [良い実装パターン・理由]

ルール

PROHIBITED: コードを実装・修正すること（評価と改善タスクの提示のみ行う）

スコアは根拠なしに高くつけない。具体的なファイルパス・行番号を示すこと。
良い点も必ず列挙すること。問題の列挙だけでは改善の優先判断ができない。