dasheng-daily-intake

star 3

Use when running the canonical Dasheng intake stage for the current day and producing real-title, real-link source radar outputs for Brief handoff.

leecyno1

By leecyno1 schedule Updated 6/7/2026

play_arrow Run Skill in Manus View GitHub

name: dasheng-daily-intake description: Use when running the canonical Dasheng intake stage for the current day and producing real-title, real-link source radar outputs for Brief handoff.

dasheng-daily-intake

定位

这是 大圣工作流的 Intake 单环节 Skill，但执行口径以本地 canonical Stage 1 为准。

它吸收并替代历史上 dasheng-caiji 的采集职责，不再并行维护两套采集定义。

职责：

执行当天 canonical intake 采集
生成真实标题、真实链接的报告 / 底稿
输出交给 Brief 的标准 JSON 接口
如当前链路要求，再交给飞书同步层做共享文档与群通知

不负责：

聚类
Brief
大纲
初稿
强化版

数据源

默认执行模式为 DASHENG_INTAKE_MODE=simple，数据源采用 本地 8001 优先 + 公开免登录热点捕捉。旧的 5173 / reports / 8000 远程链路只作为显式 legacy 回滚口，不再作为日常默认采集方式。

1）本地 8001

用途：优先读取本地聊天记录、公众号/自媒体/会议线索和本地新闻流。

固定要求：

健康检查：GET /api/health
聊天会话：GET /api/chats
聊天消息：GET /api/messages
新闻流：GET /api/newsfeed/items
本地消息必须生成可追溯锚点：dasheng-local://messages/<id>
本地新闻没有原始 URL 时，必须生成：dasheng-local://news/<id>
每条进入标准化池的样本都要保留标题、来源、摘要、时间和原始 payload

2）公开热点捕捉模块

用途：作为独立 hotspot_radar 模块捕捉公开新闻与热榜动态。本模块不硬过滤新闻内容，只做来源健康、热度、宏观/时政/市场倾向评分，供 intake 和其它 Agent 复用。

独立执行：

python3 scripts/run_hotspot_radar.py
项目 skill：skills/dasheng-hotspot-radar

输出：

hotspot_radar.json
hotspot_radar_manifest.json
raw/hotspot_radar.json

3）公开新闻池

固定要求：

数据源至少包括：同花顺、华尔街见闻、彭博市场
每条必须保留 heat_score、tone、category、heat_cluster
输出渠道为 public_news，并写入 raw/public_news_fallback_items.json
AI热点 可从该新闻池派生，但不能替代原始 public_news 全量记录

4）公开热榜池

用途：当本地 8001 不足或不可用时，补充不依赖 API key、不依赖登录态的公开热点池。

固定要求：

RSS 源至少包括：Reddit RSS、Hacker News RSS、新浪财经 RSS、WSJ RSS
热榜源至少包括：微博热搜、知乎热榜、抖音热榜、虎扑热榜、头条热榜
所有公开源必须写入 raw/public_fallback_items.json
每条都要带原链接

5）AI 热点汇总

用途：从本地新闻流、公开新闻兜底与公开热榜中派生 AI / Agent / Skill / Workflow 方向的高时效证据池。

固定要求：

固定输出最多 10 条 AI热点 汇总
这些样本进入 intake 分析池与 brief handoff 时使用更高权重
但不替代全量原始采集底稿

6）Legacy 远程链路

用途：仅在需要回滚或对比旧采集结果时显式启用。

固定要求：

启用方式：DASHENG_INTAKE_MODE=legacy python3 scripts/run_stage1_intake.py
legacy 保留 5173 / reports / 8000 public wechat / B站 AI 聚合逻辑
legacy 异常不能影响 simple 默认路径

Intake 必须交付的内容

notes/01_内容采集_报告.md
notes/01_内容采集_底稿.md
raw/intake_records.json
ai_hot_topics.json
channel_top10.json
event_clusters.json
brief_input.json
intake_manifest.json

执行顺序

检查本地 8001，采集 chats / messages / newsfeed
无论本地是否成功，都执行 hotspot_radar 公开热点捕捉
合并 local_chat、local_news、public_news、public_hot
从本地新闻流、公开新闻兜底与公开热榜中派生 AI热点 Top10
对各渠道样本做真实标题清洗、去重、渠道内热度评级
生成渠道 Top10、底稿全量清单、重复/噪音池与 Brief handoff
落盘 canonical manifest 与 handoff 文件
如启用飞书同步，再把 canonical 产物映射到飞书

硬规则

截图全部取消，不作为 intake 正式交付物
报告与底稿必须只出现真实抓取标题
以上内容都必须带原始链接
默认模式不得主动依赖 5173 / reports / 8000 远程接口
legacy 远程接口只能通过 DASHENG_INTAKE_MODE=legacy 显式启用
每个渠道都要单独产出 Top10；不足 10 条如实展示
AI热点 必须单列产出 Top10，并进入 brief_input.json.ai_hot_candidates
正式执行脚本是：../../scripts/run_stage1_intake.py

一句话版：

daily intake = 跑本地 canonical Stage 1，生成真实标题 / 真实链接的 intake 雷达，并把标准交接文件交给 Brief。

Install via CLI

npx skills add https://github.com/leecyno1/dasheng-media-workflow-skills --skill dasheng-daily-intake

Repository Details

star Stars 3

call_split Forks 0

navigation Branch main

article Path SKILL.md

Occupations

News Analysts Reporters And Journalists 273023

More from Creator

leecyno1

leecyno1 Explore all skills →