name: crypto-self-evolving-agent description: 加密貨幣自我進化交易 Agent 設計範例 — 4 步閉環(決策快照 + 24h 復盤 + 經驗庫 + Top-K 注入)+ AUTORESEARCH 紀律強化(walk-forward / cross-source / sample-size guard / cost model)。SKILL 形式提供完整架構說明 + 程式骨架 + Web UI 範例。 type: reference
Crypto Self-Evolving Agent SKILL
本 SKILL 的角色
當使用者說:
- 「我想做一個會自己學的量化系統」
- 「Hermes 那種設計怎麼做」
- 「加密貨幣自我進化 agent」
- 「LLM-driven 交易系統」
→ 載入這個 SKILL,提供完整參考架構 + 已被 14 RED + 17 RED 紀律強化的版本。
何時不要用
- 使用者要求「直接接實盤」→ 拒絕,先要求 walk-forward + paper 4 週
- 使用者問 HFT 微秒級 → LLM 太慢,本架構不適用
- 使用者要 cross-asset spread on free L1 data → 拒絕,RED #15 教訓
系統 4 步閉環(核心)
┌─ 1. 決策快照 ──────────────────────────────────┐
│ 每筆判斷寫一份 JSON │
│ 含 8 維 input + reasoning + prediction │
└──────────────┬──────────────────────────────────┘
▼
┌─ 2. 24h(或 1h)自動回訪 ──────────────────────┐
│ 從 DB 抓真實 fwd_*_bps + max_favorable/adverse │
│ hit/miss 標記 │
└──────────────┬──────────────────────────────────┘
▼
┌─ 3. 失敗復盤 → 教訓自動產生 ────────────────────┐
│ rule-based 7 種 root_cause 分類 │
│ 寫進經驗庫 + 標籤化(product/regime/失敗類型) │
└──────────────┬──────────────────────────────────┘
▼
┌─ 4. 下次決策 → Top-K 經驗注入 ──────────────────┐
│ pgvector / FAISS 向量檢索 │
│ Top 3-5 條相關歷史 注入 LLM context │
└──────────────┬──────────────────────────────────┘
▼
循環,越跑越精
8 維 decision input(必備)
每筆決策快照必含這 8 維:
| 維度 | 範例 | 來源 |
|---|---|---|
| 1. 市場溫度 | 恐貪指數 / VIX / put-call ratio | 公開 API |
| 2. 技術指標 | RSI / ADX / EMA / MACD | 自算 |
| 3. 訂單簿 | bid/ask depth, OFI | L2 feed (付費) |
| 4. 聰明錢方向 | whale wallet flow / etf flows | Glassnode/Arkham |
| 5. 宏觀環境 | FOMC / CPI / 關稅期 | 經濟日曆 |
| 6. 預測市場 | Polymarket pricing | Polymarket API |
| 7. 模型預測 | Kronos / 自訓 transformer 的 prob_up | 內部 |
| 8. 相似歷史 | Top-K 經驗庫檢索結果 | 自家經驗庫 |
注意: 第 3、4、6 維對加密貨幣可得;對台股期貨需要替代品(三大法人 OI / 未平倉 / 期權 PCR)。
經 AUTORESEARCH 強化的 5 道紀律
這是相對於原始 Hermes 設計的關鍵差異:
🛡 1. Sample-size guard
# WRONG (原版): WR>55% 就鬆
if rolling_wr > 0.55: lower_threshold()
# RIGHT (強化版): n>=30 + WR>=65% 才提議,還要人工 approve
if rolling_n >= 30 and rolling_wr >= 0.65:
propose_threshold_change(...) # 寫到 proposals.json,等人 approve
🛡 2. Walk-forward gate
任何新 cell 必須:
- expanding window 2021→present, 12-month roll
- OOS Sharpe ≥ 1.0
- cost sweep 1/2/4 bps 都正
- top-2 contribution < 5%(非 event lottery)
- 全年正(含熊市)
不過這個 gate 不能上實盤,只能 paper / sim 模式。
🛡 3. Cross-source 驗證
GREEN cell 必須在 ≥2 獨立資料源 corr ≥ 0.95、RMSE 量級對齊。例:Binance vs OKX。
🛡 4. Cost/Fill 強制
if ffill_rate > 0.10: # 超過 10% 是補的價,不是真成交
return RED("fill fantasy")
if true_round_trip_cost > 0.5 * gross_alpha:
return RED("cost-eaten")
if delay_1bar_breaks_edge: # 訊號到下一根才能進,edge 還在嗎?
return RED("entry timing fragile")
🛡 5. Cost-tier 紀律(L1-L4)
別跨層假設 alpha 存在。
Web UI 設計(漢堡選單版)
🏠 Workspace
├── ⚡ Live Trading View
├── 🎯 Decision Scorecard ← 即時 conviction
├── 📊 Recent Decisions ← 最近 50 筆 + retrospective 狀態
└── 📡 Live Feed ← entry/exit signal stream
📈 Analysis
├── 🌳 Pattern Library ← 經驗庫
├── 🔍 Lesson Browser ← 失敗教訓 search
└── 📐 Backtest Runner ← walk-forward UI
🧠 AI / Agent
├── 🧠 Hermes Chat ← 對話介面
├── 📊 Conviction Calibration ← 自評信度 vs 實際 hit rate
└── 🥋 Decision Override ← 人工標 ignore/override
⚙ Operations
├── 🤖 Daemons ← 跑著的 agents
├── 🛡 Kill Switches ← T1-T5
└── 🔔 Notifications ← TG/Discord/Email
🕐 Time Machine
└── 🕐 Replay ← 重播任一歷史點
落地路徑(分 5 phase)
| Phase | 內容 | 時間 | Kill switch |
|---|---|---|---|
| P0 | 起 paper-only daemon × 3 個熱門幣 | 1 週 | n>=20 trades 才進下一階段 |
| P1 | 經驗庫 + Top-K 檢索接入 | 1 週 | 經驗檢索 latency < 200ms |
| P2 | 24h 自動回訪 + lesson 自動產生 | 4 天 | 至少 5 條 lesson 入庫 |
| P3 | walk-forward 全 history 驗證 | 1 週 | OOS Sharpe ≥ 1.0,cost-adj 正 |
| P4 | cross-source + paper trade 4 週 | 4 週 | corr ≥ 0.95,paper PnL 偏 backtest ±20% |
| P5 | 接實盤,小倉(1% 資金)起步 | ongoing | T1-T5 任一觸發即停 |
任一階段沒過 → 退回前一階段,不跳階段。
程式骨架(範例)
見 templates/ 目錄:
decision_snapshot.py— 寫快照 + INDEX.csvretrospective_scorer.py— 1h 後自動 score + 7 種 lesson rulesthreshold_calibrator.py— 半自動門檻調整(人工 approve)experience_retriever.py— pgvector Top-K 檢索lesson_generator.py— rule-based 失敗原因分類
關鍵警示(對原版的 critical concerns)
- 「越跑越準」是錯覺 — regime shift 來臨時經驗庫過大反而會崩
- 「半月 60% 報酬」不可外推 — 沒見過熊市/震盪期樣本
- LLM 自我復盤 hindsight bias 嚴重 → 必須有結構化 rule-based 對照
- 缺 cost / fill 模型 = RED #15 同病理
- 直接接實盤 = 14 RED 的最快路徑
紀律守則總表
- 不採全自動門檻調整 → 半自動 + 人工 approve
- 不採 LLM 直接執行 entry → walk-forward 過的 rule 才接
- 24h 回訪 vs 1h:5min K 線用 1h、4h K 線用 24h
- TG 訊息必含完整出場條件(stop / TP / momentum-fade)
- 任何 GREEN claim 必說明 cost-tier(L1-L4)
參考資源
references/architecture.md— 系統架構深度說明references/decision-snapshot.md— 決策快照 JSON schemareferences/retrospective-loop.md— 自動回訪邏輯references/experience-library.md— 經驗庫設計references/feedback-mechanism.md— 門檻調整機制references/parameters.md— 全部可調參數references/web-ui.md— Web UI 設計規範
鳴謝
- 原始概念:加密貨幣社群匿名分享者(2026-04 BTC 1000u → 1600u)
- AUTORESEARCH 紀律:rpt-python 14+17 RED 教訓
- LLM 介面:Claude (Anthropic) + Hermes 對話 layer