dasheng-daily-intake

star 3

Use when running the canonical Dasheng intake stage for the current day and producing real-title, real-link source radar outputs for Brief handoff.

leecyno1 By leecyno1 schedule Updated 6/7/2026

name: dasheng-daily-intake description: Use when running the canonical Dasheng intake stage for the current day and producing real-title, real-link source radar outputs for Brief handoff.

dasheng-daily-intake

定位

这是 大圣工作流的 Intake 单环节 Skill,但执行口径以本地 canonical Stage 1 为准。

它吸收并替代历史上 dasheng-caiji 的采集职责,不再并行维护两套采集定义。

职责:

  • 执行当天 canonical intake 采集
  • 生成真实标题、真实链接的报告 / 底稿
  • 输出交给 Brief 的标准 JSON 接口
  • 如当前链路要求,再交给飞书同步层做共享文档与群通知

不负责:

  • 聚类
  • Brief
  • 大纲
  • 初稿
  • 强化版

数据源

默认执行模式为 DASHENG_INTAKE_MODE=simple,数据源采用 本地 8001 优先 + 公开免登录热点捕捉。旧的 5173 / reports / 8000 远程链路只作为显式 legacy 回滚口,不再作为日常默认采集方式。

1)本地 8001

用途:优先读取本地聊天记录、公众号/自媒体/会议线索和本地新闻流。

固定要求:

  • 健康检查:GET /api/health
  • 聊天会话:GET /api/chats
  • 聊天消息:GET /api/messages
  • 新闻流:GET /api/newsfeed/items
  • 本地消息必须生成可追溯锚点:dasheng-local://messages/<id>
  • 本地新闻没有原始 URL 时,必须生成:dasheng-local://news/<id>
  • 每条进入标准化池的样本都要保留标题、来源、摘要、时间和原始 payload

2)公开热点捕捉模块

用途:作为独立 hotspot_radar 模块捕捉公开新闻与热榜动态。本模块不硬过滤新闻内容,只做来源健康、热度、宏观/时政/市场倾向评分,供 intake 和其它 Agent 复用。

独立执行:

  • python3 scripts/run_hotspot_radar.py
  • 项目 skill:skills/dasheng-hotspot-radar

输出:

  • hotspot_radar.json
  • hotspot_radar_manifest.json
  • raw/hotspot_radar.json

3)公开新闻池

固定要求:

  • 数据源至少包括:同花顺华尔街见闻彭博市场
  • 每条必须保留 heat_scoretonecategoryheat_cluster
  • 输出渠道为 public_news,并写入 raw/public_news_fallback_items.json
  • AI热点 可从该新闻池派生,但不能替代原始 public_news 全量记录

4)公开热榜池

用途:当本地 8001 不足或不可用时,补充不依赖 API key、不依赖登录态的公开热点池。

固定要求:

  • RSS 源至少包括:Reddit RSSHacker News RSS新浪财经 RSSWSJ RSS
  • 热榜源至少包括:微博热搜知乎热榜抖音热榜虎扑热榜头条热榜
  • 所有公开源必须写入 raw/public_fallback_items.json
  • 每条都要带原链接

5)AI 热点汇总

用途:从本地新闻流、公开新闻兜底与公开热榜中派生 AI / Agent / Skill / Workflow 方向的高时效证据池。

固定要求:

  • 固定输出最多 10AI热点 汇总
  • 这些样本进入 intake 分析池与 brief handoff 时使用更高权重
  • 但不替代全量原始采集底稿

6)Legacy 远程链路

用途:仅在需要回滚或对比旧采集结果时显式启用。

固定要求:

  • 启用方式:DASHENG_INTAKE_MODE=legacy python3 scripts/run_stage1_intake.py
  • legacy 保留 5173 / reports / 8000 public wechat / B站 AI 聚合逻辑
  • legacy 异常不能影响 simple 默认路径

Intake 必须交付的内容

  1. notes/01_内容采集_报告.md
  2. notes/01_内容采集_底稿.md
  3. raw/intake_records.json
  4. ai_hot_topics.json
  5. channel_top10.json
  6. event_clusters.json
  7. brief_input.json
  8. intake_manifest.json

执行顺序

  1. 检查本地 8001,采集 chats / messages / newsfeed
  2. 无论本地是否成功,都执行 hotspot_radar 公开热点捕捉
  3. 合并 local_chatlocal_newspublic_newspublic_hot
  4. 从本地新闻流、公开新闻兜底与公开热榜中派生 AI热点 Top10
  5. 对各渠道样本做真实标题清洗、去重、渠道内热度评级
  6. 生成渠道 Top10、底稿全量清单、重复/噪音池与 Brief handoff
  7. 落盘 canonical manifest 与 handoff 文件
  8. 如启用飞书同步,再把 canonical 产物映射到飞书

硬规则

  • 截图全部取消,不作为 intake 正式交付物
  • 报告与底稿必须只出现真实抓取标题
  • 以上内容都必须带原始链接
  • 默认模式不得主动依赖 5173 / reports / 8000 远程接口
  • legacy 远程接口只能通过 DASHENG_INTAKE_MODE=legacy 显式启用
  • 每个渠道都要单独产出 Top10;不足 10 条如实展示
  • AI热点 必须单列产出 Top10,并进入 brief_input.json.ai_hot_candidates
  • 正式执行脚本是../../scripts/run_stage1_intake.py

一句话版:

daily intake = 跑本地 canonical Stage 1,生成真实标题 / 真实链接的 intake 雷达,并把标准交接文件交给 Brief。

Install via CLI
npx skills add https://github.com/leecyno1/dasheng-media-workflow-skills --skill dasheng-daily-intake
Repository Details
star Stars 3
call_split Forks 0
navigation Branch main
article Path SKILL.md
More from Creator