07-hukou-settlement-collector

star 0

使用内置 references 模块文档逐渠道采集中国城市“落户”政策信息。适用于用户提供目标城市和年份/时间范围后,围绕本科学历在职员工通过人才引进或积分落户方式申请落户的可申请性、社保要求、社保年限、断缴补缴规则和积分落户社保加分规则等指标使用 搜索工具检索官方与辅助来源、保留完整来源声明,并写入固定目录下 3 个 Markdown 文件且不做最终政策裁决的场景。

evan-zhang By evan-zhang schedule Updated 4/26/2026

name: 07-hukou-settlement-collector description: 使用内置 references 模块文档逐渠道采集中国城市“落户”政策信息。适用于用户提供目标城市和年份/时间范围后,围绕本科学历在职员工通过人才引进或积分落户方式申请落户的可申请性、社保要求、社保年限、断缴补缴规则和积分落户社保加分规则等指标使用 搜索工具检索官方与辅助来源、保留完整来源声明,并写入固定目录下 3 个 Markdown 文件且不做最终政策裁决的场景。

07 Hukou Settlement Collector

用于执行“落户”政策采集,不用于做最终裁决,也不替用户合并冲突口径。

能力边界

  • 本 skill 只负责 搜索检索打开并采集页面内容写入固定 Markdown 文件
  • 不负责政策裁决、资格判断、建议办理路径、电话咨询或替用户解释最终适用结论
  • 不输出 3 个指定 Markdown 文件之外的独立文件
  • 只写入本模块固定输出目录;不得读取、修改或合并其他 6 个 skill 的输出目录

何时使用

  • 用户给出了 目标城市年份/时间范围,或需要按城市和年份采集落户政策
  • 用户希望采集 落户 模块,而不是笼统总结迁户政策
  • 用户要求逐渠道检索、逐指标记录、保留完整来源追溯,并固定输出 3 个 Markdown 文件

必要输入

  • 目标城市
  • 年份/时间范围

缺少任一必要输入时,先要求补齐;不要用 2026年、当前年份或记忆自动补齐。

执行参数:

  • 模块落户
  • 年份/时间范围:使用用户输入值,必须写入搜索查询词、来源明细和缺口记录;不得擅自替换
  • 人群本科学历在职员工
  • 场景个人在目标城市通过人才引进或积分落户方式申请落户
  • 内置 referencereferences/07-落户-本科学历.md
  • 固定输出目录./七大政策/{目标城市}/07-落户/

先读什么

  1. 先打开本 skill 内置 references/07-落户-本科学历.md
  2. 从内置 reference 提取:
    • 渠道顺序、渠道编号、渠道名称、渠道类型、主要用途
    • 标签库和关键词建议
    • 模块说明与输出约束
  3. 根据 目标城市年份/时间范围{城市}{CITY}{年份}、渠道占位和检索词模板替换为目标城市与指定年份口径
  4. 如用户额外提供城市材料,只能作为补充线索;不得替代本 skill 的固定指标、输出结构和内置 reference 渠道顺序

SKILL.md 与 references 配合

  • SKILL.md 是执行契约:决定输入、指标、输出文件、来源字段、追溯要求和禁止事项
  • references/07-落户-本科学历.md 是本模块内置模块文档:提供标签库、指标关键词映射、渠道模板和检索词扩展
  • 执行顺序固定为:先读内置 reference,再根据目标城市和渠道模板定位真实页面,最后开始搜索检索与页面采集
  • 不要求用户提供额外模块材料;如用户额外提供,只作为补充线索,不改变本 skill 的固定输出目录、指标和表头

检索工具要求

  • 搜索工具按 EXECUTION-PROMPT Phase 0 探测结果选择(优先 MiniMax web_search)进行充分检索
  • 如果搜索工具不可用,停止执行并说明缺少检索技能;不要改用记忆、未打开页面或普通摘要替代
  • 对内置 reference 中的每个渠道模板,按渠道顺序分别构造搜索查询,不得只做全网泛搜
  • 每个渠道至少围绕该模块核心关键词和未覆盖指标补充查询;优先使用 site:{渠道域名} + 指标关键词 + 年份/城市
  • 每个搜索查询都必须包含 目标城市年份/时间范围;确需检索无年份政策原文时,也要补充一轮不含年份的查询并在备注说明
  • 搜索工具用于发现和定位候选页面;采集内容必须来自已打开页面
  • 搜索结果摘要、片段或未打开页面不能当作官方原文
  • 候选页面必须实际打开并验证可访问;404、打不开、空白页、错误页、登录拦截页、只有搜索结果而无正文的页面,不得作为采集来源
  • 页面URL 必须填写最终可打开的完整 URL;如搜索结果 URL 发生跳转,页面URL 写最终 URL,原始搜索结果 URL 写入 参考URL备注
  • 每条进入 02-来源明细表.md 的来源,都必须在 备注 写明 URL验证:已打开/可读,并记录搜索结果的标题、排名或摘要片段
  • 每条采用或未找到关键内容的记录,都要把实际搜索查询词写入 检索关键词

固定采集指标

  1. 本科学历是否可走人才引进直接落户
  2. 是否需要社保(作为落户条件之一)
  3. 社保缴纳年限要求(多少年/个月)
  4. 断缴/补缴月份是否算入年限
  5. 积分落户社保每年加分规则(每年加多少分)

专项采集约束

  • 必须区分:
    • 人才引进落户
    • 积分落户
    • 普通迁入/投靠落户 本次重点是 本科学历前提下的人才引进 + 积分落户社保规则,不要把配偶投靠、随迁、购房落户等无关口径混进主表
  • 本科学历是否可直接落户 必须明确:
    • 是可直接申请人才引进落户
    • 还是仅具备基础资格,仍需满足年龄、社保、劳动关系、单位资质等附加条件
    • 不能把 符合申请资格 写成 直接落户成功
  • 是否需要社保 必须区分:
    • 人才引进是否要求社保
    • 积分落户是否要求社保
    • 社保是硬性门槛还是加分项
  • 社保缴纳年限要求 必须明确:
    • 连续缴纳还是累计缴纳
    • 需要多少年/多少月
    • 是否要求申报时仍在缴纳
  • 断缴/补缴月份是否算入年限 必须尽量查找官方规则:
    • 断缴是否中断连续性
    • 补缴是否计入有效月数
    • 积分落户和人才引进在此口径上是否不同
  • 积分落户社保每年加分规则 必须明确:
    • 每年加多少分
    • 是否按险种区分
    • 是否必须是本市社保
    • 是否存在年度封顶
  • 如政策区分以下情形,必须拆开记录,不能混写:
    • 本科 / 硕士 / 博士
    • 应届生 / 非应届生
    • 年龄限制
    • 单位引进 / 个人申报
    • 市级规则 / 区级实施细则
  • 没有明确政策原文时,不得推测,直接写 未找到明确依据

执行规则

  • 以内置 reference 的渠道模板和顺序为准;不要自行重建无关渠道清单
  • 必须按渠道顺序逐个检索;不要跳过
  • 必须围绕 5 个指标逐项采集;不要只做摘要
  • 同一指标允许保留多个来源,不强行合并成单一结论
  • 每条采集结果都必须来自已打开页面;不要把未打开页面、搜索摘要或记忆当来源
  • 官方优先;辅助来源可以保留,但必须标明来源级别
  • 如果只拿到搜索引擎摘要但页面无法打开,不能作为来源写入 01-指标汇总表.md02-来源明细表.md;只能在 03-缺口与待补充.md 记录该 URL、搜索摘要和失败原因
  • 搜索快照 只用于标注已验证可打开页面对应的搜索结果上下文,不能单独支撑指标数据;如果是二手转引,来源类型或备注写明 二手转引
  • 本任务重点是“尽可能完整采集”,不是“综合判断谁最权威”
  • 找不到明确内容时,写 未找到明确依据;如果缺的是官方依据,则写 未找到明确官方依据
  • 不做最终政策裁决,不写“综合来看”“因此可判断”之类结论句

建议工作流

  1. 建立来源台账
    • 建议来源编号格式:{城市缩写或模块缩写}-{渠道编号}-{三位流水号}
  2. 逐渠道检索
    • 优先使用内置 reference 给出的检索词模板
    • 对每个命中页面,先打开正文,再记录完整元数据
  3. 逐指标抽取
    • 抽取原文关键句、明确条件、适用对象、适用落户路径、前置条件、例外情形
    • 明确该来源支撑的是人才引进、积分落户还是普通迁入口径
    • 记录该来源支撑的具体指标编号
  4. 生成交付文件
    • 只输出 3 个 Markdown 文件
    • 文件名、字段顺序、表头必须固定一致
    • 不额外输出检索日志、关键词矩阵、来源卡片等独立文件

来源声明必填字段

  • 来源编号
  • 来源渠道名称
  • 来源类型
  • 来源级别:官方 / 官方转引 / 辅助 / 搜索快照
  • 页面标题
  • 页面 URL
  • URL 可访问性验证结果
  • 参考 URL(如有)
  • 发布日期/更新时间;没有就写 页面未注明
  • 抓取时间
  • 检索关键词
  • 搜索结果标题/摘要/排名
  • 原文摘录
  • 提取到的数据内容
  • 对应指标编号
  • 适用对象/适用落户路径
  • 备注

检索重点

  • 目标城市 本科 人才引进 落户
  • 目标城市 本科学历 落户 条件
  • 目标城市 人才引进 社保 要求
  • 目标城市 积分落户 社保 加分
  • 目标城市 积分落户 社保 每年 几分
  • 目标城市 落户 社保 年限
  • 目标城市 落户 断缴 补缴 是否计算
  • 目标城市 人才引进 办理条件 / 办事指南 / 政策问答
  • 目标城市 积分落户 指标体系 / 实施办法 / 申请指南 / 政策解读

存储与追溯要求

  • 必须创建或使用固定输出目录 ./七大政策/{目标城市}/07-落户/,并只写入 01-指标汇总表.md02-来源明细表.md03-缺口与待补充.md
  • 不得写入其他模块目录,不得把其他模块结果合并进本目录
  • 抓取到的详细内容必须落到 02-来源明细表.md,包括页面标题、完整 URL、抓取时间、检索关键词、原文摘录和结构化提取内容
  • 每个指标都必须能追溯到具体来源编号、页面标题和完整链接;没有明确来源时必须在 03-缺口与待补充.md 记录缺口
  • 同一来源支撑多个指标时,必须在 02-来源明细表.md 拆成多行,保证“一行 = 一个来源支撑一个指标”
  • 不能只在 01-指标汇总表.md 写摘要而丢失底稿;所有可复核细节必须写入 02-来源明细表.md
  • 02-来源明细表.md备注 必须包含 URL 可访问性验证结果,以及 搜索结果标题/摘要/排名;打不开的 URL 不得出现在 页面URL 证据字段中
  • 检索过程不另写日志文件;已检索渠道、关键词和缺口统一沉淀到 02-来源明细表.md03-缺口与待补充.md

输出文件

1. 01-指标汇总表.md

  • 固定按 5 个指标输出,一行对应一个指标
  • 只呈现“当前采集到的信息”,不做最终裁决
  • 每一行都要带来源编号、来源标题、来源 URL
  • 同一个单元格内多个来源用 <br> 分隔
  • 如果没有明确官方依据,明确写 未找到明确官方依据
  • 对于 人才引进积分落户 不同口径,必须在内容里明确区分

使用以下固定表头:

| 指标编号 | 采集指标 | 员工视角问题 | 当前采集到的信息(不做最终裁决) | 关键条件/社保年限/积分规则 | 适用对象/适用落户路径 | 官方来源编号 | 官方来源标题 | 官方来源URL | 补充来源编号 | 补充来源URL | 是否存在缺口 | 缺口说明 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|

2. 02-来源明细表.md

  • 一行只对应“一个来源支撑一个指标”
  • 同一个来源支撑多个指标时,必须拆成多行
  • 必须完整保留来源信息,确保能回溯
  • 页面URL 必须是已打开验证可访问的最终 URL;404、打不开、跳转错误或不可读页面不得入表作为来源
  • 原文摘录保留 1-3 句关键句
  • “提取到的数据内容”尽量结构化、可复用

使用以下固定表头:

| 指标编号 | 采集指标 | 来源编号 | 来源渠道名称 | 来源类型 | 来源级别 | 页面标题 | 页面URL | 参考URL | 发布日期/更新时间 | 抓取时间 | 检索关键词 | 适用对象/适用落户路径 | 原文摘录 | 提取到的数据内容 | 备注 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|

3. 03-缺口与待补充.md

  • 只记录存在关键缺口的指标
  • 已完整找到的指标不要写进来
  • 如果 5 项都没有缺口,仍然输出该文件,但只保留一行 无缺口 记录

使用以下固定表头:

| 指标编号 | 采集指标 | 未找到的关键内容 | 缺口原因 | 已检索渠道/来源编号 | 已使用关键词 | 当前能确认到的边界 | 建议后续补查方向 | 备注 |
|---|---|---|---|---|---|---|---|---|

填写提醒

  • 01-指标汇总表.md 的“当前采集到的信息”只写事实,不写综合判断
  • 01-指标汇总表.md 的“关键条件/社保年限/积分规则”只写页面中明确出现的条件;没有就写 未找到明确数值
  • 01-指标汇总表.md 的“适用对象/适用落户路径”要明确写本科/硕士/博士、应届/非应届、人才引进/积分落户等,不要混写
  • 02-来源明细表.md 中“来源级别”只能填:官方 / 官方转引 / 辅助 / 搜索快照
  • 02-来源明细表.md备注 写法建议:URL验证:已打开/可读;搜索结果:排名X,标题“...”,摘要“...”;若有跳转,原始URL:...
  • 02-来源明细表.md 中同一来源支撑多个指标时要拆行
  • 03-缺口与待补充.md 只写真实缺口,不要把“还想补更多”也算进去
  • 所有 URL 必须写完整
  • 交付前检查 5 个指标是否都有一行

结束前自检

  • 是否先读了内置 reference
  • 是否按内置 reference 的渠道顺序逐类检索
  • 是否把人才引进落户、积分落户、普通迁入/投靠落户分开记录
  • 是否把“可申请人才引进”与“直接落户成功”区分清楚
  • 是否把人才引进社保要求、积分落户社保要求、社保加分规则分别记录
  • 是否把断缴/补缴、连续/累计、申报时仍在缴纳等口径拆开写
  • 是否所有结论都能回到已打开页面
  • 是否所有 页面URL 都已实际打开并确认不是 404、错误页或不可读页面
  • 是否所有来源都带了完整来源声明
  • 是否只交付了 3 个 Markdown 文件
Install via CLI
npx skills add https://github.com/evan-zhang/agent-factory --skill 07-hukou-settlement-collector
Repository Details
star Stars 0
call_split Forks 0
navigation Branch main
article Path SKILL.md
More from Creator