crypto-self-evolving-agent - SKILL.md Agent Skill

name: crypto-self-evolving-agent description: 加密貨幣自我進化交易 Agent 設計範例 — 4 步閉環(決策快照 + 24h 復盤 + 經驗庫 + Top-K 注入)+ AUTORESEARCH 紀律強化(walk-forward / cross-source / sample-size guard / cost model)。SKILL 形式提供完整架構說明 + 程式骨架 + Web UI 範例。 type: reference

Crypto Self-Evolving Agent SKILL

本 SKILL 的角色

當使用者說:

「我想做一個會自己學的量化系統」
「Hermes 那種設計怎麼做」
「加密貨幣自我進化 agent」
「LLM-driven 交易系統」

→ 載入這個 SKILL,提供完整參考架構 + 已被 14 RED + 17 RED 紀律強化的版本。

何時不要用

使用者要求「直接接實盤」→ 拒絕,先要求 walk-forward + paper 4 週
使用者問 HFT 微秒級 → LLM 太慢,本架構不適用
使用者要 cross-asset spread on free L1 data → 拒絕,RED #15 教訓

系統 4 步閉環(核心)

┌─ 1. 決策快照 ──────────────────────────────────┐
│  每筆判斷寫一份 JSON                              │
│  含 8 維 input + reasoning + prediction         │
└──────────────┬──────────────────────────────────┘
               ▼
┌─ 2. 24h(或 1h)自動回訪 ──────────────────────┐
│  從 DB 抓真實 fwd_*_bps + max_favorable/adverse │
│  hit/miss 標記                                   │
└──────────────┬──────────────────────────────────┘
               ▼
┌─ 3. 失敗復盤 → 教訓自動產生 ────────────────────┐
│  rule-based 7 種 root_cause 分類                 │
│  寫進經驗庫 + 標籤化(product/regime/失敗類型) │
└──────────────┬──────────────────────────────────┘
               ▼
┌─ 4. 下次決策 → Top-K 經驗注入 ──────────────────┐
│  pgvector / FAISS 向量檢索                       │
│  Top 3-5 條相關歷史 注入 LLM context             │
└──────────────┬──────────────────────────────────┘
               ▼
        循環,越跑越精

8 維 decision input(必備)

每筆決策快照必含這 8 維:

維度	範例	來源
1. 市場溫度	恐貪指數 / VIX / put-call ratio	公開 API
2. 技術指標	RSI / ADX / EMA / MACD	自算
3. 訂單簿	bid/ask depth, OFI	L2 feed (付費)
4. 聰明錢方向	whale wallet flow / etf flows	Glassnode/Arkham
5. 宏觀環境	FOMC / CPI / 關稅期	經濟日曆
6. 預測市場	Polymarket pricing	Polymarket API
7. 模型預測	Kronos / 自訓 transformer 的 prob_up	內部
8. 相似歷史	Top-K 經驗庫檢索結果	自家經驗庫

注意: 第 3、4、6 維對加密貨幣可得;對台股期貨需要替代品(三大法人 OI / 未平倉 / 期權 PCR)。

經 AUTORESEARCH 強化的 5 道紀律

這是相對於原始 Hermes 設計的關鍵差異:

🛡 1. Sample-size guard

# WRONG (原版): WR>55% 就鬆
if rolling_wr > 0.55: lower_threshold()

# RIGHT (強化版): n>=30 + WR>=65% 才提議,還要人工 approve
if rolling_n >= 30 and rolling_wr >= 0.65:
    propose_threshold_change(...)  # 寫到 proposals.json,等人 approve

🛡 2. Walk-forward gate

任何新 cell 必須:

expanding window 2021→present, 12-month roll
OOS Sharpe ≥ 1.0
cost sweep 1/2/4 bps 都正
top-2 contribution < 5%(非 event lottery)
全年正(含熊市)

不過這個 gate 不能上實盤,只能 paper / sim 模式。

🛡 3. Cross-source 驗證

GREEN cell 必須在 ≥2 獨立資料源 corr ≥ 0.95、RMSE 量級對齊。例:Binance vs OKX。

🛡 4. Cost/Fill 強制

if ffill_rate > 0.10:        # 超過 10% 是補的價,不是真成交
    return RED("fill fantasy")

if true_round_trip_cost > 0.5 * gross_alpha:
    return RED("cost-eaten")

if delay_1bar_breaks_edge:   # 訊號到下一根才能進,edge 還在嗎?
    return RED("entry timing fragile")

🛡 5. Cost-tier 紀律(L1-L4)

別跨層假設 alpha 存在。

Web UI 設計(漢堡選單版)

🏠 Workspace
   ├── ⚡ Live Trading View
   ├── 🎯 Decision Scorecard       ← 即時 conviction
   ├── 📊 Recent Decisions         ← 最近 50 筆 + retrospective 狀態
   └── 📡 Live Feed                ← entry/exit signal stream

📈 Analysis
   ├── 🌳 Pattern Library          ← 經驗庫
   ├── 🔍 Lesson Browser           ← 失敗教訓 search
   └── 📐 Backtest Runner          ← walk-forward UI

🧠 AI / Agent
   ├── 🧠 Hermes Chat              ← 對話介面
   ├── 📊 Conviction Calibration   ← 自評信度 vs 實際 hit rate
   └── 🥋 Decision Override        ← 人工標 ignore/override

⚙ Operations
   ├── 🤖 Daemons                  ← 跑著的 agents
   ├── 🛡 Kill Switches            ← T1-T5
   └── 🔔 Notifications            ← TG/Discord/Email

🕐 Time Machine
   └── 🕐 Replay                   ← 重播任一歷史點

落地路徑(分 5 phase)

Phase	內容	時間	Kill switch
P0	起 paper-only daemon × 3 個熱門幣	1 週	n>=20 trades 才進下一階段
P1	經驗庫 + Top-K 檢索接入	1 週	經驗檢索 latency < 200ms
P2	24h 自動回訪 + lesson 自動產生	4 天	至少 5 條 lesson 入庫
P3	walk-forward 全 history 驗證	1 週	OOS Sharpe ≥ 1.0,cost-adj 正
P4	cross-source + paper trade 4 週	4 週	corr ≥ 0.95,paper PnL 偏 backtest ±20%
P5	接實盤,小倉(1% 資金)起步	ongoing	T1-T5 任一觸發即停

任一階段沒過 → 退回前一階段,不跳階段。

程式骨架(範例)

見 templates/ 目錄:

decision_snapshot.py — 寫快照 + INDEX.csv
retrospective_scorer.py — 1h 後自動 score + 7 種 lesson rules
threshold_calibrator.py — 半自動門檻調整(人工 approve)
experience_retriever.py — pgvector Top-K 檢索
lesson_generator.py — rule-based 失敗原因分類

關鍵警示(對原版的 critical concerns)

「越跑越準」是錯覺 — regime shift 來臨時經驗庫過大反而會崩
「半月 60% 報酬」不可外推 — 沒見過熊市/震盪期樣本
LLM 自我復盤 hindsight bias 嚴重 → 必須有結構化 rule-based 對照
缺 cost / fill 模型 = RED #15 同病理
直接接實盤 = 14 RED 的最快路徑

紀律守則總表

不採全自動門檻調整 → 半自動 + 人工 approve
不採 LLM 直接執行 entry → walk-forward 過的 rule 才接
24h 回訪 vs 1h:5min K 線用 1h、4h K 線用 24h
TG 訊息必含完整出場條件(stop / TP / momentum-fade)
任何 GREEN claim 必說明 cost-tier(L1-L4)

參考資源

references/architecture.md — 系統架構深度說明
references/decision-snapshot.md — 決策快照 JSON schema
references/retrospective-loop.md — 自動回訪邏輯
references/experience-library.md — 經驗庫設計
references/feedback-mechanism.md — 門檻調整機制
references/parameters.md — 全部可調參數
references/web-ui.md — Web UI 設計規範

鳴謝

原始概念:加密貨幣社群匿名分享者(2026-04 BTC 1000u → 1600u)
AUTORESEARCH 紀律:rpt-python 14+17 RED 教訓
LLM 介面:Claude (Anthropic) + Hermes 對話 layer