name: cheat-trends
description: 从配置的热点源(HN / Reddit / YouTube trending / B 站热门 / 等)抓今天的热门话题,去重 + 粗打分 + 写入 candidates.md。绝大部分人没有候选池——这是让"我没素材"问题在 onboarding 第二步就消失的钥匙。触发词:"抓热点"/"fetch trends"/"今天有什么可做的"/"trending now"/"找选题"。
argument-hint: [— sources: ] [— max-per: 20]
allowed-tools: Bash(*), Read, Write, Edit, Glob, WebFetch, Skill
/cheat-trends — 热点抓取
多 adapter 模式:读各 trend-sources adapter 的输出 → 去重 → 粗打分 → 写入 candidates.md。
Overview
[用户:抓热点]
↓
[Phase 0: 读 .cheat-state.json 拿 enabled adapters]
↓
[Phase 1: 对每个 adapter 调 fetch]
↓
[Phase 2: normalize 到 candidate-schema]
↓
[Phase 3: 去重(vs candidates / predictions / trends-history)]
↓
[Phase 4: 对每个新 item 粗打分(调 cheat-score 内联逻辑)]
↓
[Phase 5: 排序 + 询问用户哪些加入 candidates.md]
↓
[Phase 6: 写入 + 更新 trends-history.jsonl 缓存]
Constants
- TREND_SOURCES = ["manual-paste"] — 启用的 adapter 列表(默认仅 manual-paste,最稳)
- LOOKBACK_HOURS = 24 — 抓最近 N 小时的热点
- MAX_PER_SOURCE = 20 — 每个 adapter 最多 N 条
- DEDUPE = true — 去重开关
- AUTO_SCORE = true — 抓回来后自动调 cheat-score 粗打分
- MIN_COMPOSITE_TO_SUGGEST = 6.0 — 低于此分的不推荐用户加入候选池(仍写入 trends-history 避免下次重复推)
💡 调用时覆盖:
/cheat-trends — sources: manual-paste,hackernews,bilibili-popular — max-per: 10
Inputs
| 必填 | 来源 |
|---|---|
.cheat-state.json |
默认 sources |
adapters/trend-sources/<name>.md |
各 adapter 的实现描述 |
candidates.md |
去重对照 |
predictions/*.md |
去重对照(已发的不再推) |
.cheat-cache/trends-history.jsonl |
历史抓取去重缓存 |
Workflow
Phase 0: 读启用的 adapters
# 伪代码
state = read('.cheat-state.json')
enabled_adapters = args.sources or state.get('enabled_trend_sources', ['manual-paste'])
如 enabled_adapters 为空 → 输出引导:
你目前没有启用任何热点源。
最快配法:
- 临时跑:/cheat-trends — sources: manual-paste,hackernews
- 永久启用:编辑 .cheat-state.json 的 enabled_trend_sources 数组
可用 adapter(详见 adapters/trend-sources/):
- manual-paste(默认,永远能用)
- hackernews(HN Algolia API,无需 key)
- reddit-rising(公开 .json 端点)
- youtube-trending(需 YouTube Data API key)
- bilibili-popular(公开端点,偶有变动)
- xhs-explore / douyin-hot(fragile,需 cookie)
- thirdparty-paid(新榜 / 飞瓜,需自己接 API)
Phase 1-2: 对每个 adapter 调 fetch + normalize
对每个 adapter,读其 adapters/trend-sources/<name>.md 中描述的 fetch 接口(实际是 Bash 调底层 Python / shell / WebFetch):
| Adapter | 实现机制 |
|---|---|
manual-paste |
询问用户:"粘贴你今天的候选 URL/标题列表(每行一条)" → 解析每行,对 URL 做 WebFetch 拓展 snippet |
hackernews |
WebFetch HN Algolia API:https://hn.algolia.com/api/v1/search?tags=front_page&hitsPerPage={N} → 提取 title/url/snippet |
reddit-rising |
WebFetch Reddit JSON:https://www.reddit.com/r/<subreddit>/rising.json?limit={N} |
youtube-trending |
需 API key 配置在 .env 或 .cheat-state.json,调 YouTube Data API v3 videos?chart=mostPopular |
bilibili-popular |
WebFetch B 站 popular 接口 |
xhs-explore / douyin-hot |
需用户提供 cookie 路径,调对应 platform-stub 描述的接口;缺 cookie → skip 该 adapter |
thirdparty-paid |
schema only——读 adapters/trend-sources/thirdparty-paid.md,让用户自己接 |
每个 adapter 输出符合 candidate-schema.md 的 items。
优雅降级:单 adapter 失败(API key 缺失 / 端点 503 / cookie 失效)→ skip 该 adapter,不抛异常,在汇总里说明:
✅ hackernews: 拉到 18 条
⚠️ youtube-trending: 跳过(缺 API key——配置见 adapters/trend-sources/youtube-trending.md)
✅ bilibili-popular: 拉到 15 条
❌ douyin-hot: 跳过(cookie 文件不存在)
Phase 3: 去重
按 candidate-schema.md 的"去重协议":
- 对每个 item 算 id(
sha256(source_type + normalized_title + url_path)[:12]) - 检查
candidates.md已含此 id → 跳过 - 检查
predictions/*.md已含此 id → 跳过 - 检查
.cheat-cache/trends-history.jsonl已含此 id 且rejected_at != null→ 跳过
去重统计写到汇总报告里。
Phase 4: 粗打分
AUTO_SCORE=true 时,对每条新 item:
- 用 item 的
snapshot_text作为输入 - 按当前 rubric 给 7 维打分(不调
/cheat-score子 skill 走 IO;inline 复用打分逻辑) - 算 composite
- 给一句 rationale
注意:粗打分 ≠ 正式预测。预测必须基于最终稿(用户改过的),这里的打分只是"是否值得展开写"的粗筛。
AUTO_SCORE=false 时,items 写入 candidates.md 时 composite=null,需要后续手动 /cheat-score。
Phase 5: 排序 + 询问
按 composite 降序,过滤掉 composite < MIN_COMPOSITE_TO_SUGGEST 的:
🔥 抓热点完成。各源拉取统计:
- manual-paste: 5 条(用户输入)
- hackernews: 18 条
- bilibili-popular: 15 条
跳过 douyin-hot(缺 cookie)
去重后剩 27 条新 item。
粗打分后 12 条 composite ≥ 6.0:
| # | 标题 | source | composite | bucket | rationale |
|---|---|---|---|---|---|
| 1 | 为什么我们都讨厌主动联系朋友 | hackernews | 8.4 | 30-100w | ER+QL 双 5,AB 普适 |
| 2 | "她不一样"的一千种变体 | bilibili-popular | 8.1 | 30-100w | MS 候选维度高 |
| 3 | ...... |
哪些加入 candidates.md?
- 全部加 → 回 "all"
- 选几个 → 回 "1, 3, 5"
- 都不要 → 回 "none"(这些会被记到 trends-history 避免下次重复推)
Phase 6: 落盘
用户响应后:
- 选中的 items → 按 candidate-schema.md 的"Markdown 表示"格式追加到
candidates.md - 所有抓回来的 items(不管选中与否)→ append 到
.cheat-cache/trends-history.jsonl:{"id": "...", "title": "...", "source": "...", "snapshot_at": "...", "rejected_at": null|"<ISO>", "fetched_at": "<ISO>"}
Phase 7: 状态更新
{
"last_trends_run_at": "<ISO>",
"last_trends_added_count": 5
}
Key Rules
- 不抛异常。单 adapter 失败 → skip + 报告。多 adapter 全失败 → 报错"所有源都失败",附排查指引
- manual-paste 永远在。即使其他所有 adapter 都坏了,manual-paste 模式必须能跑——它是兜底
- 去重是硬约束。同 id 不重复推;用户拒绝过的 6 个月内不再推
- 粗打分要诚实标注。在 candidates.md 的 entry 里标
composite (rough, snapshot-based),避免与 prediction 的精打分混淆 - 不直接进 predictions/。trends 只产 candidates,predict 是另一个动作
Refusals
- 「直接抓抖音热门 feed,不用 cookie」 → 拒绝。抖音反爬极严,无 cookie 必失败;引导到 douyin-session adapter 配置文档
- 「跳过去重,把所有抓到的都写进去」 → 拒绝。会污染候选池,下次 recommend 时排序失效
- 「跳过粗打分,直接写 raw 标题」 → 允许(
AUTO_SCORE=false),但提示用户后续需要/cheat-score才能进 recommend 池
Integration
- 上游:用户配置
.cheat-state.json的enabled_trend_sources数组 - 下游:
/cheat-recommend直接读candidates.md排序——trends 写完,recommend 立刻看到 - 与
/cheat-init:onboarding Q4 选"没有候选池"的用户被引导到这里 - 与
/cheat-status:status 看板显示"上次抓热点:X 天前 / 待清理候选池:Y 条"
Adapter 实现注意事项
每个 adapters/trend-sources/<name>.md 必须文档化以下:
- 依赖:API key / cookie / package
- fetch 接口:调用方式(python script path / shell command / API endpoint)
- 输出 schema:必须符合 candidate-schema.md
- 失败模式:常见错误 + 优雅降级行为
- 稳定性等级:★ 1-5 颗星
详见 adapters/HOWTO.md(待批次 3 实现)。