knowledge-ingestion

star 0

Safely ingest non-standard materials into this repository's knowledge system without polluting the source of truth. Use when you need to merge help-center articles, product docs, operation guides, FAQ, screenshot or video analysis, meeting notes, requirement drafts, or external references into `knowledge/` while preserving the repository's Chinese naming, raw-as-source, and summary-first routing protocol.

A5356263 By A5356263 schedule Updated 6/3/2026

name: knowledge-ingestion description: Safely ingest non-standard materials into this repository's knowledge system without polluting the source of truth. Use when you need to merge help-center articles, product docs, operation guides, FAQ, screenshot or video analysis, meeting notes, requirement drafts, or external references into knowledge/ while preserving the repository's Chinese naming, raw-as-source, and summary-first routing protocol.

知识入库

只有先弄清仓库里哪里是事实来源、哪里只是过程残留之后,才开始做知识入库。

使用流程

  1. 写入前先读目标区域。
  2. 从附近的 README.mdknowledge/README.mdknowledge/LLM.mdknowledge/wiki/index.md、相关 specs/ 和邻近示例里判断本地约定。
  3. 先给输入材料分类,再决定它是可沉淀知识、未决信息、过程残留还是噪音。
  4. 先决定落点,再优先合并,避免扩散。
  5. 先更新 raw,再用 python knowledge/scripts/update_wiki.py --apply--only <raw-file-path> 刷新 wiki。
  6. 收尾前检查落点、命名、raw-summary 一致性和未决项。

入库前 summary 状态检查

执行知识入库前,先读取:

knowledge/outputs/reports/pending_semantic_summaries.md

检查:

  • pending_generate
  • pending_review

如果二者均为 0,说明当前 summary 语义填充状态可作为入库判断参考。

如果存在待生成或待复核 summary:

  • 不自动更新全部 summary。
  • 先判断本次入库涉及领域是否命中待处理 summary。
  • 如果命中,必须在最终汇报中说明风险。
  • 如果影响本次入库判断,应先处理相关 summary 或暂停入库。

注意:

  • 这里不是新增 semantic_stale
  • 这里不是自动补全所有 summary。
  • 这里只是入库前的健康检查。

定向影响面扫描

当输入材料来自 知识候选区/**,或涉及菜单、路径、权限、状态、字段、角色、流程、页面入口变化时,不得只更新候选文件中列出的“已知命中文件”。

必须基于以下线索做定向扫描:

  • 涉及领域
  • 影响对象
  • 旧表述线索
  • 新表述线索
  • 已知命中文件
  • 建议更新位置
  • [GAP] / [QUESTION] / [CONFLICT]

扫描顺序:

  1. 读取候选文件。
  2. 提取涉及领域、影响对象、旧表述线索、新表述线索、已知命中文件。
  3. 先读取候选文件中明确提到的 raw。
  4. 扫描涉及领域下的 knowledge/raw/**
  5. 使用旧表述线索和新表述线索搜索 knowledge/raw/**
  6. 检查相关 knowledge/wiki/summaries/**
  7. 如搜索结果命中邻近领域,再扩展读取邻近领域的 README、领域概述和命中文件。
  8. 形成“必须更新 / 命中但不更新 / 暂不处理”的判断结果,用于执行与最终汇报。
  9. 再执行 raw 更新和 wiki 同步。

候选文件提供的是扫描种子,不是完整更新边界。 这些判断结果只需要在任务结束时向用户汇报,不需要额外生成清单文件。

扫描范围控制

不要默认全库通读。

优先扫描:

  1. 候选文件明确写出的涉及领域。
  2. 候选文件明确写出的已知命中文件。
  3. 旧表述线索命中的文件。
  4. 新表述线索命中的文件。
  5. 相关领域的 README、00_领域概述、同目录相关能力文件。
  6. 同目录或同领域下已命中的邻近 summary / raw 文件。

只有在以下情况才扩大范围:

  • 旧表述线索在多个领域命中。
  • 变更涉及平台级菜单、全局入口、权限、组织、成员、审批等高复用基础能力。
  • 候选文件中明确出现跨领域影响。
  • 初始领域扫描发现明显外部依赖。

按需读取这些参考文件

核心规则

  • knowledge/raw/** 当成事实来源。
  • knowledge/wiki/summaries/** 当成路由卡,不当成正式知识。
  • 用最小但可复用的改动保留有效信息。
  • [GAP][CONFLICT][QUESTION] 显式保留不确定性。
  • 过程残留要隔离,不要把它抄成正式知识。

禁止事项

  • 不要只改 summary,不改 raw。
  • 不要重建 source_manifestbuild_manifest、旧 wiki/topics、registry 层或命名映射表。
  • 不要为了有个地方放内容,就把上传材料整个塞进 README.md
  • 不要为了让编号看起来整齐就批量造文件。
  • 不要让弱来源静默覆盖强来源。

最终汇报

简要说明:

  • 合并了什么
  • 跳过或暂缓了什么
  • 是否执行了 wiki 同步
  • 新增了哪些文件
  • 哪些文件属于“必须更新 / 命中但不更新 / 暂不处理”
  • 还剩哪些 [GAP][CONFLICT][QUESTION]

健康检查触发

当本 skill 用于知识入库、raw 删除同步、知识清理或大模块入库时,先做一次轻量健康检查:

  1. 运行 python knowledge/scripts/prune_orphan_summaries.py --dry-run
  2. 如果存在 orphan summary,列出:
    • summary 路径
    • 缺失的 source_path
    • 建议动作
  3. 不要立即删除,先等待用户确认
  4. 用户确认后,运行 python knowledge/scripts/update_wiki.py --apply --prune-orphans
  5. 然后重新检查 knowledge/outputs/reports/pending_semantic_summaries.md
  6. 如果 summary 的 1-4 段语义仍缺失,只做提示,不默认自动补全

大模块入库触发

当新材料无法稳定并入现有领域,或确实需要新建业务领域时:

  1. 读取 knowledge/raw/业务/README.md
  2. 读取目标领域 README 或相邻领域示例
  3. 读取 knowledge/templates/业务知识入库/
  4. 先区分:
    • README.md:模板目录说明
    • README.template.md:新业务领域 README 模板
  5. 在写 raw 之前,先输出简短入库计划
  6. 只有在用户确认后,才落地 raw 并刷新 wiki
Install via CLI
npx skills add https://github.com/A5356263/UX-Blueprinting --skill knowledge-ingestion
Repository Details
star Stars 0
call_split Forks 0
navigation Branch main
article Path SKILL.md
More from Creator