crypto-self-evolving-agent

star 1

加密貨幣自我進化交易 Agent 設計範例 — 4 步閉環(決策快照 + 24h 復盤 + 經驗庫 + Top-K 注入)+ AUTORESEARCH 紀律強化(walk-forward / cross-source / sample-size guard / cost model)。SKILL 形式提供完整架構說明 + 程式骨架 + Web UI 範例。

Simon-Copilot-Studio By Simon-Copilot-Studio schedule Updated 4/29/2026

name: crypto-self-evolving-agent description: 加密貨幣自我進化交易 Agent 設計範例 — 4 步閉環(決策快照 + 24h 復盤 + 經驗庫 + Top-K 注入)+ AUTORESEARCH 紀律強化(walk-forward / cross-source / sample-size guard / cost model)。SKILL 形式提供完整架構說明 + 程式骨架 + Web UI 範例。 type: reference

Crypto Self-Evolving Agent SKILL

本 SKILL 的角色

當使用者說:

  • 「我想做一個會自己學的量化系統」
  • 「Hermes 那種設計怎麼做」
  • 「加密貨幣自我進化 agent」
  • 「LLM-driven 交易系統」

→ 載入這個 SKILL,提供完整參考架構 + 已被 14 RED + 17 RED 紀律強化的版本。

何時不要用

  • 使用者要求「直接接實盤」→ 拒絕,先要求 walk-forward + paper 4 週
  • 使用者問 HFT 微秒級 → LLM 太慢,本架構不適用
  • 使用者要 cross-asset spread on free L1 data → 拒絕,RED #15 教訓

系統 4 步閉環(核心)

┌─ 1. 決策快照 ──────────────────────────────────┐
│  每筆判斷寫一份 JSON                              │
│  含 8 維 input + reasoning + prediction         │
└──────────────┬──────────────────────────────────┘
               ▼
┌─ 2. 24h(或 1h)自動回訪 ──────────────────────┐
│  從 DB 抓真實 fwd_*_bps + max_favorable/adverse │
│  hit/miss 標記                                   │
└──────────────┬──────────────────────────────────┘
               ▼
┌─ 3. 失敗復盤 → 教訓自動產生 ────────────────────┐
│  rule-based 7 種 root_cause 分類                 │
│  寫進經驗庫 + 標籤化(product/regime/失敗類型) │
└──────────────┬──────────────────────────────────┘
               ▼
┌─ 4. 下次決策 → Top-K 經驗注入 ──────────────────┐
│  pgvector / FAISS 向量檢索                       │
│  Top 3-5 條相關歷史 注入 LLM context             │
└──────────────┬──────────────────────────────────┘
               ▼
        循環,越跑越精

8 維 decision input(必備)

每筆決策快照必含這 8 維:

維度 範例 來源
1. 市場溫度 恐貪指數 / VIX / put-call ratio 公開 API
2. 技術指標 RSI / ADX / EMA / MACD 自算
3. 訂單簿 bid/ask depth, OFI L2 feed (付費)
4. 聰明錢方向 whale wallet flow / etf flows Glassnode/Arkham
5. 宏觀環境 FOMC / CPI / 關稅期 經濟日曆
6. 預測市場 Polymarket pricing Polymarket API
7. 模型預測 Kronos / 自訓 transformer 的 prob_up 內部
8. 相似歷史 Top-K 經驗庫檢索結果 自家經驗庫

注意: 第 3、4、6 維對加密貨幣可得;對台股期貨需要替代品(三大法人 OI / 未平倉 / 期權 PCR)。

經 AUTORESEARCH 強化的 5 道紀律

這是相對於原始 Hermes 設計的關鍵差異:

🛡 1. Sample-size guard

# WRONG (原版): WR>55% 就鬆
if rolling_wr > 0.55: lower_threshold()

# RIGHT (強化版): n>=30 + WR>=65% 才提議,還要人工 approve
if rolling_n >= 30 and rolling_wr >= 0.65:
    propose_threshold_change(...)  # 寫到 proposals.json,等人 approve

🛡 2. Walk-forward gate

任何新 cell 必須:

  • expanding window 2021→present, 12-month roll
  • OOS Sharpe ≥ 1.0
  • cost sweep 1/2/4 bps 都正
  • top-2 contribution < 5%(非 event lottery)
  • 全年正(含熊市)

不過這個 gate 不能上實盤,只能 paper / sim 模式。

🛡 3. Cross-source 驗證

GREEN cell 必須在 ≥2 獨立資料源 corr ≥ 0.95、RMSE 量級對齊。例:Binance vs OKX。

🛡 4. Cost/Fill 強制

if ffill_rate > 0.10:        # 超過 10% 是補的價,不是真成交
    return RED("fill fantasy")

if true_round_trip_cost > 0.5 * gross_alpha:
    return RED("cost-eaten")

if delay_1bar_breaks_edge:   # 訊號到下一根才能進,edge 還在嗎?
    return RED("entry timing fragile")

🛡 5. Cost-tier 紀律(L1-L4)

別跨層假設 alpha 存在。

Web UI 設計(漢堡選單版)

🏠 Workspace
   ├── ⚡ Live Trading View
   ├── 🎯 Decision Scorecard       ← 即時 conviction
   ├── 📊 Recent Decisions         ← 最近 50 筆 + retrospective 狀態
   └── 📡 Live Feed                ← entry/exit signal stream

📈 Analysis
   ├── 🌳 Pattern Library          ← 經驗庫
   ├── 🔍 Lesson Browser           ← 失敗教訓 search
   └── 📐 Backtest Runner          ← walk-forward UI

🧠 AI / Agent
   ├── 🧠 Hermes Chat              ← 對話介面
   ├── 📊 Conviction Calibration   ← 自評信度 vs 實際 hit rate
   └── 🥋 Decision Override        ← 人工標 ignore/override

⚙ Operations
   ├── 🤖 Daemons                  ← 跑著的 agents
   ├── 🛡 Kill Switches            ← T1-T5
   └── 🔔 Notifications            ← TG/Discord/Email

🕐 Time Machine
   └── 🕐 Replay                   ← 重播任一歷史點

落地路徑(分 5 phase)

Phase 內容 時間 Kill switch
P0 起 paper-only daemon × 3 個熱門幣 1 週 n>=20 trades 才進下一階段
P1 經驗庫 + Top-K 檢索接入 1 週 經驗檢索 latency < 200ms
P2 24h 自動回訪 + lesson 自動產生 4 天 至少 5 條 lesson 入庫
P3 walk-forward 全 history 驗證 1 週 OOS Sharpe ≥ 1.0,cost-adj 正
P4 cross-source + paper trade 4 週 4 週 corr ≥ 0.95,paper PnL 偏 backtest ±20%
P5 接實盤,小倉(1% 資金)起步 ongoing T1-T5 任一觸發即停

任一階段沒過 → 退回前一階段,不跳階段

程式骨架(範例)

templates/ 目錄:

  • decision_snapshot.py — 寫快照 + INDEX.csv
  • retrospective_scorer.py — 1h 後自動 score + 7 種 lesson rules
  • threshold_calibrator.py — 半自動門檻調整(人工 approve)
  • experience_retriever.py — pgvector Top-K 檢索
  • lesson_generator.py — rule-based 失敗原因分類

關鍵警示(對原版的 critical concerns)

  1. 「越跑越準」是錯覺 — regime shift 來臨時經驗庫過大反而會崩
  2. 「半月 60% 報酬」不可外推 — 沒見過熊市/震盪期樣本
  3. LLM 自我復盤 hindsight bias 嚴重 → 必須有結構化 rule-based 對照
  4. 缺 cost / fill 模型 = RED #15 同病理
  5. 直接接實盤 = 14 RED 的最快路徑

紀律守則總表

  • 不採全自動門檻調整 → 半自動 + 人工 approve
  • 不採 LLM 直接執行 entry → walk-forward 過的 rule 才接
  • 24h 回訪 vs 1h:5min K 線用 1h、4h K 線用 24h
  • TG 訊息必含完整出場條件(stop / TP / momentum-fade)
  • 任何 GREEN claim 必說明 cost-tier(L1-L4)

參考資源

鳴謝

  • 原始概念:加密貨幣社群匿名分享者(2026-04 BTC 1000u → 1600u)
  • AUTORESEARCH 紀律:rpt-python 14+17 RED 教訓
  • LLM 介面:Claude (Anthropic) + Hermes 對話 layer
Install via CLI
npx skills add https://github.com/Simon-Copilot-Studio/crypto-self-evolving-agent --skill crypto-self-evolving-agent
Repository Details
star Stars 1
call_split Forks 0
navigation Branch main
article Path SKILL.md
More from Creator
Simon-Copilot-Studio
Simon-Copilot-Studio Explore all skills →