cheat-learn-from - SKILL.md Agent Skill

name: cheat-learn-from description: 从对标账号导入 script + 数据 → 拆 pattern + 派生 base rubric 信号 → 写到 benchmark.md / script_patterns.md / rubric_notes.md。这是工具最早期信号的来源——cold-start 用户没自己历史时全靠对标，发过历史的用户也建议至少 1 个对标做 sanity check。触发词："学这个账号"/"拆这几个对标视频"/"learn from"/"导入对标账号"/"找对标"。 argument-hint: <账号名> [— way: a (default) | b] [— append | --replace] allowed-tools: Bash(*), Read, Write, Edit, Glob, WebFetch, Skill

/cheat-learn-from — 对标账号导入

工具早期最重要的信号源是对标账号——你 init 完没数据，rubric 等权 v0 等于占星。但如果你能找一个你想做成那样的账号，导入 5-10 条它的高/中/低样本，工具就有了 anchor。

后期当你自己 calibration_samples ≥ 10 时，benchmark 影响自然减弱——你的真实数据成为主要信号源。但 benchmark.md 不删，仍是 cheat-seed brainstorm 的 reference frame。

Overview

[用户：学这个账号 / 启动 cheat-learn-from]
  ↓
[Phase 0: 检查 benchmark 状态]
  ↓
[Phase 1: 选 input 方式（Way a 默认）]
  ↓
[Phase 2: 收集材料]
  Way a: 用户粘 N 条 script 文本 + 数据
  Way b: 用 whisper 转录 samples/ 目录里的视频
  ↓
[Phase 3: 询问每条样本的"印象判断"（高/中/低 + 为啥）]
  ↓
[Phase 4: Claude 拆 pattern + 派生 rubric 信号]
  ↓
[Phase 5: 用户 review → 改 → 落盘]
  ↓
[Phase 6: 写 benchmark.md / script_patterns.md / rubric_notes.md]
  ↓
[Phase 7: 更新 state.benchmark_status]

Constants

MIN_SAMPLES = 3 — 最少 3 条样本（少于拆不出 pattern）
RECOMMENDED_SAMPLES = 5-10 — 推荐区间，平衡信号量 vs 用户工作量
MAX_SAMPLES_PER_RUN = 15 — 单次导入上限——再多 Claude context 不够 + 用户也累
DEFAULT_WAY = a — Way a 简单 + 准确，是 default

Inputs

必填	来源
`<账号名>`	用户参数；缺失则询问
`.cheat-state.json`	状态文件
Way a: 用户粘的 script 文本 + 数据	对话
Way b: `samples/<账号名>/*.mp4` 等视频文件	用户提前下载好放进去

Workflow

Phase 0: 检查 benchmark 状态

读 .cheat-state.json 的 benchmark_status：

状态	处理
`none`	首次导入——继续 Phase 1
`pending`	用户之前答应等下找——继续 Phase 1
`imported` 已有 benchmark	询问"你已有 benchmark [当前名]，N 条样本。要做什么？ a) 追加新视频到当前 benchmark b) 替换为新 benchmark c) 只看不改"

参数解析：

--append → 追加到现有 benchmark
--replace <new-name> → 用新 benchmark 替换（旧的归档到 benchmark.archived/）
没标志 + 已有 benchmark → 走上面询问

Phase 1: 选 input 方式（两个独立维度）

每条样本 = script + 数据。两者怎么拿是独立的——你可以混搭。

Phase 1a: script source（怎么拿稿子）

script 怎么拿？

a) **粘文本（最简单，推荐）**
   - 你自己整理过 / 用工具提取过——直接粘进对话
   - 工具推荐（按方便程度排）：
   
     抖音 / 小红书：
     - 微信小程序「轻抖」—— 粘视频链接 → 自动提取文案 + 评论。最快
     - 类似工具："视频解析助手" / "短视频文案提取" 等小程序
     - 通常有免费额度，重度使用收费
     
     B 站 / YouTube：
     - 视频页面有"显示字幕/文字记录"按钮（如果 UP 主开了）
     - 第三方：DownSub / SaveSubs / yt-dlp --write-auto-sub
     
     公众号 / Substack：
     - 直接复制网页文字
   
b) **whisper 转录视频文件**
   - 你下载了视频到 samples/<账号名>/<video>/source.mp4
   - 需要装 whisper-cpp + ffmpeg（见 adapters/script-extraction/whisper/README.md）
   - 转录可能有错别字 / 漏字 / 标点不准——准确度比 a 差

c) **跳过 script，只用元数据 + 印象**
   - 你拿不到稿子也懒得用工具
   - 后果：pattern 拆不深（只能看标题 / 数据 / 你的印象），但 rubric 信号还行
   - 适合"先快速搭起来，将来补"

回 a / b / c。

Phase 1b: data source（怎么拿播放/点赞/评论）

数据（播放 / 点赞 / 评论 / 转发）怎么拿？

a) **手填数字（最简单）**
   - 你查一下账号后台或视频页面，告诉我数字
   - 不需要装任何工具

b) **adapter 自动抓（如已配置）**
   - 你已经装了 perf-data adapter（如 douyin-session）
   - 给我视频 URL，工具自己抓数据 + top 评论
   - 评论数据更全（手填只能告诉我数字，adapter 能拿到具体评论文本）

回 a / b。

最常见的组合：

完全零依赖路径：1a + 1b（粘文本 + 手填）—— 5 分钟搞定
评论质量优先：1a + 2b（粘文本 + adapter 抓）—— 装了 adapter 就走这个
拿不到稿子兜底：1b + 1b（whisper + 手填）

Phase 2: 收集材料

按 Phase 1a + 1b 的组合走对应路径。

通用纪律：每条样本最少要有 (script 或 transcript 或 N/A标记) + 数据 (4 项基础：播放/点赞/评论/转发)。

Path A: 粘文本（Phase 1a=a）

好。我们一条一条来。最少 3 条，推荐 5-10 条。

第 1 条 script，把整段粘下面（段落版，不要字幕格式）：

收到 script → 算 video_id（sha256(script_content)[:12]）→ 进 Phase 2 数据采集。

Path B: whisper 转录（Phase 1a=b）

先确认 whisper 装了：

[运行 `command -v whisper-cpp` 或 `command -v whisper` 检测]

如果没装：
  ❌ whisper 没装。三选一：
  - brew install whisper-cpp（推荐——快）
  - pip install openai-whisper（Python 慢些）
  - 切回 Path A 自己粘文本（推荐用轻抖等小程序）

装好后：把视频文件放到 samples/<账号名>/<video-name>/source.mp4
（一个视频一个子目录）

放好后告诉我"放好了 N 条"，我转录。

用户放好后：

Glob samples/<账号名>/*/source.* 找视频文件
对每个视频跑 bash adapters/script-extraction/whisper/run.sh <video> samples/<账号名>/<id>/
失败项报告但继续其他
进 Phase 2 数据采集

Path C: 跳过 script（Phase 1a=c）

直接进 Phase 2 数据采集——告诉用户"没 script 我能拆的 pattern 仅限标题级别 / 你的印象，rubric 信号正常拆"。

Phase 2 数据采集（Phase 1b=a 手填 / b adapter）

如 Phase 1b=a（手填）：

第 1 条数据：告诉我
- 标题
- 播放量
- 点赞
- 评论数（不是评论内容，是数字）
- 转发 / 分享数

格式随意，能识别就行。例如：
  "标题：怎么停止期待
   播放：71w / 点赞 2.4w / 评论 899 / 转发 1.8w"

如果你能再粘 top 5-10 条评论（带赞数）更好——pattern 拆能挖到模因层。

如 Phase 1b=b（adapter）：

你说装了 adapter（如 douyin-session）。给我每条视频的 URL，
我跑 adapter 自动抓数据 + top 评论。

第 1 条 URL：

收到 URL → 调对应 adapter → 写数据 + 评论到 samples/<账号名>//meta.md。

通用：继续问第 2 条 / 第 3 条 / ... 用户说"够了"或达到 MAX_SAMPLES_PER_RUN 时进 Phase 3。

Phase 3: 询问"印象判断"

对每条样本（不管 Way a 或 b），收完数据后追加问印象：

你看完 / 听完这条视频的印象，算这个账号的：
  a) 高表现样本（代表作 / 你想做成这样的）
  b) 中表现样本（普通水准 / 不上不下）
  c) 低表现样本（不算这个账号的代表 / 你不想做成这样）

为什么？（一句话——这个判断比数据更能告诉我你想做什么风格）

记录 (impression_label, impression_reason) 到内存。

注意：印象可以和数据冲突——比如某条数据高但用户觉得"不算代表作"。这种冲突本身是有用信号，记录下来。

Phase 4: Claude 拆 pattern + 派生 rubric 信号

阅读所有 (script, 数据, 印象) → 自己分析：

4a. Script patterns

按 script_patterns.md 的 cheat sheet 框架拆：

开头钩子：3 种类型分布（场景代入 / IS 戏仿 / 数据反转）
主体结构：几段 / 怎么切
句式 / 句长 / 节奏：短句还是长句、有没有标志性句式
emotional 标记 / 双声道
致谢段 / 收尾
高频词汇 / 词汇风格

输出 N 个具体 pattern（每个引用具体样本作证据）。

4b. Rubric 信号（仅定性，不给数值权重）

对每条样本打 7 维分（用通用维度），然后看：

高表现样本（按用户印象）共有哪些维度高？
低表现样本共有哪些维度低？
哪些维度在高/低样本之间无差异（说明不是关键维度）？

输出定性方向（不是数值权重）：

"ER 看起来重要"（3/3 高样本 ER ≥4）
"SR 看起来不显著"（高低样本 SR 分布无差异）
"MS 高的样本评论区有明显模因爆发"

Phase 5: 用户 review

一次性展示所有结果给用户：

我从你给的 N 条对标视频拆出：

📝 N 个 script pattern：
  1. **[Pattern 1 名称]**：[一句话描述] → 证据：[样本 X / Y]
  2. ...
  
🎯 Rubric 定性信号：
  - 看起来重要的维度：ER / QL / MS（每个有 N 条高样本支持）
  - 看起来不显著的维度：SR / NA
  - 给的初始建议：你的对标账号是 [情感+金句驱动型] / [数据驱动型] / [类比讲解型] / ...
  - **不直接给数值权重**——5-10 样本拟合容易过拟合，先用作 tier-2 信号
  
🎨 选题方向感：
  - 主题分布大概：[主题 A 40% / 主题 B 30% / ...]
  - 调性：[一句话]

回 "ok" 我落盘，
或指出哪些 pattern / 信号你不认同（"Pattern X 我觉得不准" / "Rubric 信号 Y 错了"）。

用户反馈循环：

"ok" → Phase 6 落盘
用户挑刺 → Claude 改 → 重新展示 → 直至确认

Phase 6: 落盘

6a. benchmark.md

按 [templates/benchmark.template.md] 格式写到 <user-channel>/benchmark.md：

账号信息（账号名、URL、调性、粉丝量级——用户提供）
导入的样本表
基础 rubric 派生（仅定性）
选题方向感

如 --append → 在现有 benchmark.md 的样本表追加新行 + 重新拆 pattern；不重写整个文件。如 --replace → 把现有 benchmark.md 移到 benchmark.archived/<旧账号名>_<日期>.md，写新的。

6b. samples/<账号名>/

为每条样本建子目录：

samples/<账号名>/<video-id>/
├── source.mp4 (Way b 才有，Way a 没有)
├── transcript.md (从粘文本写 / whisper 转出来)
└── meta.md (标题 / 数据 / 印象 / 印象理由)

6c. script_patterns.md

在 <user-channel>/script_patterns.md 加新段：

## 对标 [账号名] 借鉴（imported on YYYY-MM-DD，N 条样本）

> 这些 pattern 来自对标账号——**Imported, untested on my channel**。
> 实拍验证后（≥2 次跑出 + 复盘确认有效）再去掉这个标记，升入正式 pattern。

### Pattern A: [一句话名]
**来自**: [样本 X]
**描述**: [详细]

### Pattern B: ...

6d. rubric_notes.md

在 <user-channel>/rubric_notes.md 加 / 更新"benchmark-derived initial signals"段：

## Benchmark-derived initial signals

> 来自 benchmark.md 的对标账号 [账号名]（N=N 样本，import on YYYY-MM-DD）。
> **仅定性方向，不直接采纳为数值权重**——5-10 样本拟合容易过拟合。
> 等你自己 N≥5 校准样本后正式 bump 时**再决定**是否调权重。

- 看起来重要的维度: ER / QL / ...
- 看起来不显著的维度: SR / NA / ...
- Claude 给的初始建议: [一句话定性]

Phase 7: 更新 state file

{
  "benchmark_status": "imported",
  "benchmark_name": "<账号名>",
  "benchmark_sample_count": <N>
}

Key Rules

Way a 默认——简单 + 准确。Way b 仅给"找不到 script 只有视频"的兜底
必须问印象——纯看 transcript 拆 pattern 容易抓表面，加用户印象才挖到深层
Rubric 信号仅定性——不直接给数值权重。5-10 样本拟合过拟合
pattern 默认标 untested——避免污染用户自己的 pattern 库
不直接抓视频——下载是用户的事，避免 TOS + 反爬
可重复跑——--append 加新视频，--replace 换账号
MIN_SAMPLES = 3：少于 3 拆不出 pattern，拒绝继续

Refusals

「跳过印象判断，直接拆」 → 拒绝。印象是关键 input
「我只能给 1 条样本」 → 拒绝。最少 3 条
「直接给我数值权重」 → 拒绝。Phase 4 只给定性信号
「能不能不写 transcript 文件，只在内存里拆」 → 不行。transcript 持久化是后续 cheat-retro Phase 4b diff 的依据
「帮我下载对标视频」 → 拒绝。引导用户用 yt-dlp / BBDown 等工具自己下

Integration

上游：/cheat-init Phase 2.5 在 cold-start 用户时强烈建议跑 /cheat-learn-from；calibration 用户可选
上游：/cheat-status 在 benchmark_status=pending + 距 init >24h 时持续提醒
下游：/cheat-seed brainstorm 时读 benchmark.md → 知道用户对标方向
下游：script_patterns.md 加新段，cheat-seed 写 draft 时按 pattern 选结构
下游：rubric_notes.md 加 benchmark-derived signals 段，cheat-bump 时作为参考之一
N≥10 提示：cheat-status 在用户 calibration_samples ≥10 时提示"你已有足够自己数据，benchmark 影响淡出（保留作 sanity check）"

benchmark 何时淡出

不是死磕样本数，是 Claude 判断"用户数据信号是否已超过 benchmark"：

默认参考：calibration_samples ≥ 10 → benchmark 影响淡出
可以更早：N=5 但用户的 (打分, 实绩) 配对里出现 ≥3 条与 benchmark pattern 不一致的——说明你账号已经走出对标的路径
可以更晚：N=15 但用户的样本都很相似（都做同一类内容），benchmark 仍有信号价值

判断条件 + 默认值都在 cheat-status 触发器 #19 / cheat-seed Phase 0 里实现。

淡出后：

cheat-seed brainstorm 仍读 benchmark.md，但优先级低于用户自己的 predictions/
rubric_notes 的 benchmark signals 段标 **Status: superseded by user data**，不删但不再主导
benchmark.md 不删——保留作 sanity check（看你账号是否真的偏离对标方向太远）

任何时候用户主动：跑 /cheat-learn-from --replace none 完全解除 benchmark 影响

与其他 skill 的区别

Skill	用途
`/cheat-learn-from`	从对标账号导入 pattern / rubric 信号（一次性 / 偶尔追加）
`/cheat-seed`	brainstorm 选题 + 写 draft（读 benchmark.md 作参考）
`/cheat-trends`	抓今天的热点（与 benchmark 无关）
`/cheat-bump`	升级 rubric（用户自己 N≥5 后用真实数据，不直接用 benchmark signals）