name: research-skill-flow-zh description: "科研 Skill 调用流总控技能:用于多痛点、多假设、多创新点的科研任务分阶段路由、候选池生成、Gap Gate、候选 smoke 漏斗、dev/formal 收敛、论文 claim 分级和外部科研 skill 冲突审计。Use when: 科研调用流、科研skill路由、多候选科研流程、多痛点、多假设、多创新点、候选池、Gap Gate、Memory Intake、Candidate Smoke Funnel、论文claim分级、外部科研skill冲突审计。不适用于:直接执行单一实验、单篇论文写作或普通工程开发,路由后应切换到对应阶段主 skill。" metadata: argument-hint: "说明科研阶段和材料,例如:按科研调用流做新方向探索;用多候选漏斗筛选这些创新点;论文前按 claim 分级整理"
科研 Skill 调用流
目标
把科研任务组织成“多候选生成 + 分阶段筛选 + 单实验验证”的调用流。早期允许提出多个痛点、多个假设、多个创新点;进入实验和论文 claim 前必须收敛,避免把多个机制一次混改后直接宣称整体有效。
本 skill 是科研路由和流程守门,不替代阶段主 skill。选定阶段后,按下表切换到对应主 skill 执行。
调用预算硬规则
每个科研任务阶段只能使用:
1 个主 skill + 最多 2 个辅助 skill + 条件触发审计 skill
- 主 skill:负责当前阶段的判断和产出。
- 辅助 skill:只补充资料、模板、监控、归档或统计,不覆盖主流程。
- 审计 skill:不计入辅助数量,但只有触发条件满足时才能调用。
- 跨阶段任务要分阶段切换主 skill,不要一次性加载全量科研 skill。
阶段路由
| 阶段 | 主 skill | 最多辅助 skill | 条件审计 skill | 必须产出 |
|---|---|---|---|---|
| Memory Intake | research-coach-zh |
info-evidence-chain-zh, literature-triage-matrix |
无 | 项目状态卡、文献比较矩阵、候选池初稿 |
| Gap Gate | research-coach-zh |
literature-triage-matrix, info-evidence-chain-zh |
iteration-reflection-guard-zh |
候选池表、PASS/CAUTION/BLOCK |
| Research Design | research-coach-zh |
research-design-helper, literature-triage-matrix |
plan-faithful-execution-zh |
创新点可行性矩阵、最小验证计划 |
| Candidate Smoke Funnel | research-experiment-ops-zh |
agent-wait-monitor-zh, artifact-curator-zh |
research-iteration-audit-zh |
每个候选的独立 smoke 记录和排序 |
| Dev/Formal | research-experiment-ops-zh |
agent-wait-monitor-zh, artifact-curator-zh |
decisive-result-audit-zh, plan-faithful-execution-zh |
dev/formal 结果、raw/summary/config 对齐检查 |
| Paper Memory/Writing | paper-writing-zh |
paper-memory-builder, research-statistics-reporting-zh |
decisive-result-audit-zh |
claim 分级、.paper/claims.yml、.paper/figures.yml |
| Handoff/Archive | project-handoff-zh |
artifact-curator-zh |
无 | 接班文档、产物索引、下一轮约束 |
若外部辅助 skill 未安装或不可用,只保留其方法定位,不新建同名本地 skill,不影响本地主流程执行。
1. Memory Intake
主 skill:research-coach-zh
读取:
- 历史实验记录。
- 实验日志、summary、raw。
- 既有失败路线和有效路线。
- 文献材料、证据链和文献比较矩阵。
- 用户指定边界、数据、算力、时间和论文目标。
项目状态卡必须保留六段式记忆:
尝试方法
计划
脚本/命令
结果
经验
下次必须继承的约束
新增候选记录区:
候选痛点列表
候选假设列表
候选创新点列表
每个候选对应的证据、风险和验证方式
2. Gap Gate
主 skill:research-coach-zh
使用多候选 gate,不把候选提前压成单痛点或单假设:
| Gate | 判断问题 | 依据 |
|---|---|---|
| Gate 1 | 每个痛点对应的 gap 是否存在? | 文献矩阵参考 |
| Gate 2 | 每个创新点是否构成真实贡献? | 文献对比辅助 |
| Gate 3 | 每个候选以当前数据、算力、时间是否可行? | 本地实验经验为主 |
候选池表模板:
| 候选ID | 痛点 | 假设 | 创新点 | 文献支持 | 本地可行性 | 预期收益 | 实现成本 | 风险等级 | 建议动作 |
|---|---|---|---|---|---|---|---|---|---|
| C1 | PASS / CAUTION / BLOCK |
建议动作含义:
- PASS:进入最小 smoke 设计。
- CAUTION:保留,但必须先补证据或缩小实现。
- BLOCK:暂不实验,写入失败路线或未来工作。
3. Research Design
主 skill:research-coach-zh
外部 research-design-helper 只能提供设计模板和问题收敛参考:
研究问题
候选痛点
候选假设
候选机制
可识别性
验证计划
风险登记
设计阶段必须产出创新点可行性矩阵:
| 创新点 | 对应痛点 | 预期机制 | 可独立实现 | 可独立消融 | smoke 成本 | 失败条件 |
|---|
筛选规则:
- 初始可以保留多个候选。
- 进入 smoke 前必须给每个候选定义最小验证。
- dev/formal 前必须收敛到一个主候选或一个明确组合候选。
- 组合候选必须说明为什么不能拆开验证。
4. Candidate Smoke Funnel
主 skill:research-experiment-ops-zh
实验执行采用候选漏斗:
候选池
-> 每个候选独立 smoke
-> smoke 结果排序
-> 选择 1 个主候选进入 dev
-> dev 通过后进入 formal
-> formal 后审计 claim
硬规则:
- smoke 可以并行多个候选。
- 每个 smoke 只验证一个主候选,或一个明确声明的组合候选。
- dev/formal 不允许未记录的混合机制。
- formal 前不得事后改 gate。
- 不允许把多个创新点一次性混改后直接宣称整体有效。
- 外部 two-loop 只作为节奏参考,不替代本地 smoke/dev/formal。
候选独立记录必须包含:
动机
对应痛点
核心假设
预期收益
实现成本
可消融方式
失败条件
脚本/命令
raw/summary/config 路径
结论边界
5. 审计触发
| 审计 skill | 触发条件 |
|---|---|
decisive-result-audit-zh |
结果影响论文、formal/gate、冻结版本、主表、是否停止迭代、是否声称胜过基线 |
research-iteration-audit-zh |
机制堆叠、连续失败、创新点说不清、runtime 膨胀、性能退化、研究债务增加 |
plan-faithful-execution-zh |
用户给出固定计划、题面、实验计划、边界锁定或禁止自我扩展 |
iteration-reflection-guard-zh |
继续迭代、提出下一轮方向、避免重复失败、检查创新性和致命痛点 |
审计只在触发时调用,不占辅助 skill 数量,但审计结论必须写入本轮记录。
6. Paper Memory / Writing
主 skill:paper-writing-zh
论文前必须把多个创新点分级:
主创新点:formal 证据支持,可进入摘要、方法、贡献
次创新点:dev 或消融支持,只能谨慎写
失败候选:写入局限或未来工作,不能包装成贡献
放弃候选:进入经验记录
.paper/claims.yml 每条 claim 必须标记:
claims:
- id: C1
text: ""
status: supported # supported | draft | rejected | gap
evidence:
formal: ""
audit: ""
boundary: ""
没有 formal 或审计支持的创新点不能写成正式贡献。
7. 外部候选策略
第一批只允许作为候选辅助或方法参考:
| 候选 | 用途 | 本地定位 |
|---|---|---|
literature-triage-matrix |
文献比较矩阵 | 辅助 gap 判断 |
research-design-helper |
多痛点、多假设设计模板 | 辅助研究设计 |
paper-memory-builder |
claim/figure 记忆 | 辅助论文写作 |
research-context-compressor |
.research/ manifest |
可选补充,不替代六段式记忆 |
research-project-orienter |
项目快速接班 memo | 可选补充 project-handoff-zh |
暂不直接纳入:
autoresearch:自治原则冲突,只吸收 two-loop 思路。academic-research-suite:体量过大,只吸收 pipeline/integrity gate 思路。- 大量模型训练工具 skill:遇到具体模型任务时再单独审计。
8. 冲突审计
任何外部 skill 后续安装或本地化前,必须审计:
| 审计项 | 规则 |
|---|---|
| 名称冲突 | 不允许与现有本地 skill 同名 |
| 职责冲突 | 本地已有主 skill 时,外部只能辅助 |
| 候选机制冲突 | 外部不得要求一次混改多个机制并直接 claim |
| 记忆冲突 | 不允许替换六段式记忆 |
| 执行冲突 | 不允许替代 smoke/dev/formal |
| 审计冲突 | 不允许绕过结果审计和迭代审计 |
| 输出冲突 | 不允许破坏 skill-outputs/<skill-name>/ |
| 许可证冲突 | 必须记录来源、许可证、是否可再分发 |
裁决优先级:
本地已验证规则
> 用户固定边界
> 多候选可比较性
> 结果可复现性
> 外部自动化效率
9. 输出格式
执行科研任务前先输出 2-5 行路由:
Skill 路由:
- 阶段:...
- 主 skill:...
- 辅助 skill:...
- 审计 skill:未触发 / 已触发,原因是...
随后直接进入对应阶段主 skill 执行。阶段结束时必须更新:
- 六段式项目状态卡。
- 候选池状态。
- 已触发审计及结论。
- 下一阶段唯一主候选或明确组合候选。
10. 自检清单
收尾前检查:
- 每个阶段只有 1 个主 skill。
- 辅助 skill 不超过 2 个。
- 审计 skill 只在触发条件满足时调用。
- 多个创新点都有独立证据和失败条件。
- dev/formal 没有未记录的混合机制。
- 未验证候选没有写成正式论文贡献。
- 六段式记忆被保留并更新。