model-code-and-result-generator - SKILL.md Agent Skill

name: "model-code-and-result-generator" description: "根据 model_route.json、数据计划和清洗数据，为数学建模论文生成结果证据契约和 q1/q2/q3 建模代码脚手架。Invoke when 需要把模型输出、评价指标、结构化结论、论文表格和当前赛题专用建模代码沉淀到 paper_output/results/、paper_output/tables/ 和 paper_output/code/modeling/，供 QA 与正文生成读取。"

建模代码与结果证据生成器

全局流程协作约束（长对话防漂移）

本 skill 不得作为孤立入口。用户要求完整论文、生成 Word、继续流程或不确定阶段时，先回到 paper-workflow-orchestrator 判断当前 S0-S8 阶段。

启动或继续本 skill 的正式任务前，必须运行：

python skills/paper-workflow-orchestrator/scripts/workflow_guard.py --skill model-code-and-result-generator

如果输出 [WORKFLOW FAIL] 或报告 status != "PASS"，停止本 skill，按 paper_output/qa/workflow_guard_report.json 的失败项回补前置阶段，不得凭记忆继续。
本 skill 只写入自己契约范围内的 paper_output/ 产物；完成后必须回到 paper-workflow-orchestrator 判断下一步，并用 context-memory-keeper 记录已完成产物、阻塞项和下一步。
长对话中如果上下文变长、阶段不确定或用户分开调用 skill，先运行：
```
python skills/paper-workflow-orchestrator/scripts/workflow_guard.py --status
```
再读取 paper_output/qa/workflow_guard_report.json、paper_output/preflight_report.json、paper_output/input_manifest.json、paper_output/results/run_manifest.json 和本 skill 的上游 JSON 契约，按报告里的 recommended_skill 与 next_action 继续。
继续流程前，必须把 paper_output/context/workflow_memory.json 视为长期断点记录；若其中的 current_step、next_step、recommended_skill 与 workflow_guard.py --status 不一致，以 guard 报告为准。
每次完成本 skill 的产物后，先回到 paper-workflow-orchestrator 或运行 workflow_guard.py --status，再更新 workflow memory：
```
python skills/context-memory-keeper/scripts/update_workflow_memory.py
```
更新后读取 paper_output/context/workflow_memory.json / .md，确认下一步和推荐 skill 已记录。

目标

本 skill 不是万能自动建模系统。它的作用是给 Agent 一个稳定的“结果证据层”和可运行的赛题专用建模代码起点，避免正文只根据模型路线空写，也避免 Agent 面对数据时无头乱转。

真实赛题中，Agent 必须根据 model_route.json、数据字段、题目约束和评分要求二次修改生成的 q*_model.py。生成代码固定放在 paper_output/code/modeling/，不要写回 skill 包的 scripts/。

执行契约

上游输入：优先读取 paper_output/plan/model_route.json、data_plan.json、visualization_plan.json，并扫描 paper_output/data_cleaned/。
必须输出：paper_output/results/model_results.json、metrics.json、conclusions.json、run_manifest.json、paper_output/tables/table_index.json、paper_output/tables/*.csv。
建模代码输出：paper_output/code/modeling/result_contract_io.py、run_modeling.py、q1_model.py、q2_model.py、q3_model.py 或与 question_id 对应的 q*_model.py。
下游交接：quality-assurance-auditor 读取结果与表格证据后写入 tasks.json；paper-micro-unit-generator 通过任务清单引用结果、指标、表格和结论。
失败回退：如果没有清洗数据或真实建模代码，仍生成契约骨架，并用 needs_real_modeling 标记，不伪装成最终比赛结果。

脚本

scripts/build_result_contracts.py
- 何时用：已有模型路线，需要生成结果契约、表格索引和当前赛题的 q1/q2/q3 建模代码脚手架。
- 做什么：扫描 model_route.json 的每个 question_id，生成结果契约骨架、基础字段画像表、paper_output/code/modeling/README.md，并生成可运行的 q*_model.py。
- 覆盖规则：生成文件带有 managed marker；如果 Agent 已经手工改写并去掉 marker，本脚本会保留用户文件，不覆盖。
scripts/result_contract_templates.py
- 何时用：需要了解不同任务类型应沉淀哪些指标、表格和结论字段。
- 做什么：提供预测、优化、评价、分类、聚类、仿真、通用建模的契约模板。

任务类型分发

预测/回归/时间序列 -> forecasting scaffold：生成目标列、特征列、预测值、残差、RMSE、MAE、MAPE。
优化/规划/调度/选址/路径 -> optimization scaffold：生成代理目标函数、方案排序、约束满足率待补项。
评价/排序/权重/TOPSIS/AHP/熵权 -> evaluation scaffold：生成指标归一化、综合得分、排序和权重敏感性待补项。
分类/识别/判别 -> classification scaffold：生成代理分类标签、准确率/F1 待补项。
聚类/分群 -> clustering scaffold：生成代理聚类标签、聚类数、簇内紧凑度。
仿真/机理/动力学/微分 -> simulation scaffold：生成趋势代理、情景结果、拟合误差和敏感性参数。
其他 -> general scaffold：生成数值字段统计摘要和通用结果表。

输出位置

paper_output/
|-- code/
|   `-- modeling/
|       |-- run_modeling.py
|       |-- result_contract_io.py
|       |-- q1_model.py
|       |-- q2_model.py
|       |-- q3_model.py
|       `-- README.md
|-- results/
|   |-- model_results.json
|   |-- metrics.json
|   `-- conclusions.json
`-- tables/
    |-- table_index.json
    |-- table_q1_result_skeleton.csv
    |-- table_q1_forecasting_scaffold.csv
    `-- ...

统一规则：

所有路径使用相对路径。
所有 JSON 包含 schema_version、generated_by、generated_at。
每条结果、指标、结论和表格都应带 question_id。
草稿或脚手架结果必须使用 status 或 evidence_status 标记。
正式结果必须带 execution_provenance，包含 source_code_path、run_command、run_exit_code 和 output_artifacts；统一入口 run_modeling.py 还必须写入 paper_output/results/run_manifest.json，记录脚本命令、退出码、输入文件 hash 和输出产物 hash。official evidence gate 会拒绝没有真实代码运行来源或没有 run_manifest 对应运行记录的结果。
正文中引用的表格必须能在 paper_output/tables/table_index.json 找到。

使用方式

推荐由 paper-workflow-orchestrator 在数据清洗与可视化之后调用。也可以手动运行：

python skills/model-code-and-result-generator/scripts/build_result_contracts.py

生成脚手架后，Agent 应按真实赛题执行：

python paper_output/code/modeling/run_modeling.py

该入口会写入 paper_output/results/run_manifest.json。然后重新运行 QA，让 paper_output/tasks.json 读取刷新后的 model_results.json、metrics.json、conclusions.json、run_manifest.json 和 table_index.json。

真实赛题使用原则

不要把占位式指标或代理结果直接当成最终比赛结果。
优先修改 paper_output/code/modeling/q*_model.py，不要修改 skill 包内的 scripts/。
正式建模完成后，必须由建模代码实际运行并把真实输出写回 paper_output/results/ 与 paper_output/tables/；不要手写 model_results.json 冒充运行结果。没有 run_manifest.json 对应运行记录时，不能进入正式 evidence gate。
如果某一问没有真实结果，QA 应保留 warning，正文不得把该问写成已经完成精确计算。