model-code-and-result-generator

star 164

根据 model_route.json、数据计划和清洗数据,为数学建模论文生成结果证据契约和 q1/q2/q3 建模代码脚手架。Invoke when 需要把模型输出、评价指标、结构化结论、论文表格和当前赛题专用建模代码沉淀到 paper_output/results/、paper_output/tables/ 和 paper_output/code/modeling/,供 QA 与正文生成读取。

yushui2022 By yushui2022 schedule Updated 6/2/2026

name: "model-code-and-result-generator" description: "根据 model_route.json、数据计划和清洗数据,为数学建模论文生成结果证据契约和 q1/q2/q3 建模代码脚手架。Invoke when 需要把模型输出、评价指标、结构化结论、论文表格和当前赛题专用建模代码沉淀到 paper_output/results/、paper_output/tables/ 和 paper_output/code/modeling/,供 QA 与正文生成读取。"

建模代码与结果证据生成器

全局流程协作约束(长对话防漂移)

  • 本 skill 不得作为孤立入口。用户要求完整论文、生成 Word、继续流程或不确定阶段时,先回到 paper-workflow-orchestrator 判断当前 S0-S8 阶段。
  • 启动或继续本 skill 的正式任务前,必须运行:
    python skills/paper-workflow-orchestrator/scripts/workflow_guard.py --skill model-code-and-result-generator
    
  • 如果输出 [WORKFLOW FAIL] 或报告 status != "PASS",停止本 skill,按 paper_output/qa/workflow_guard_report.json 的失败项回补前置阶段,不得凭记忆继续。
  • 本 skill 只写入自己契约范围内的 paper_output/ 产物;完成后必须回到 paper-workflow-orchestrator 判断下一步,并用 context-memory-keeper 记录已完成产物、阻塞项和下一步。
  • 长对话中如果上下文变长、阶段不确定或用户分开调用 skill,先运行:
    python skills/paper-workflow-orchestrator/scripts/workflow_guard.py --status
    
    再读取 paper_output/qa/workflow_guard_report.jsonpaper_output/preflight_report.jsonpaper_output/input_manifest.jsonpaper_output/results/run_manifest.json 和本 skill 的上游 JSON 契约,按报告里的 recommended_skillnext_action 继续。
  • 继续流程前,必须把 paper_output/context/workflow_memory.json 视为长期断点记录;若其中的 current_stepnext_steprecommended_skillworkflow_guard.py --status 不一致,以 guard 报告为准。
  • 每次完成本 skill 的产物后,先回到 paper-workflow-orchestrator 或运行 workflow_guard.py --status,再更新 workflow memory:
    python skills/context-memory-keeper/scripts/update_workflow_memory.py
    
    更新后读取 paper_output/context/workflow_memory.json / .md,确认下一步和推荐 skill 已记录。

目标

本 skill 不是万能自动建模系统。它的作用是给 Agent 一个稳定的“结果证据层”和可运行的赛题专用建模代码起点,避免正文只根据模型路线空写,也避免 Agent 面对数据时无头乱转。

真实赛题中,Agent 必须根据 model_route.json、数据字段、题目约束和评分要求二次修改生成的 q*_model.py。生成代码固定放在 paper_output/code/modeling/,不要写回 skill 包的 scripts/

执行契约

  • 上游输入:优先读取 paper_output/plan/model_route.jsondata_plan.jsonvisualization_plan.json,并扫描 paper_output/data_cleaned/
  • 必须输出:paper_output/results/model_results.jsonmetrics.jsonconclusions.jsonrun_manifest.jsonpaper_output/tables/table_index.jsonpaper_output/tables/*.csv
  • 建模代码输出:paper_output/code/modeling/result_contract_io.pyrun_modeling.pyq1_model.pyq2_model.pyq3_model.py 或与 question_id 对应的 q*_model.py
  • 下游交接:quality-assurance-auditor 读取结果与表格证据后写入 tasks.jsonpaper-micro-unit-generator 通过任务清单引用结果、指标、表格和结论。
  • 失败回退:如果没有清洗数据或真实建模代码,仍生成契约骨架,并用 needs_real_modeling 标记,不伪装成最终比赛结果。

脚本

  • scripts/build_result_contracts.py
    • 何时用:已有模型路线,需要生成结果契约、表格索引和当前赛题的 q1/q2/q3 建模代码脚手架。
    • 做什么:扫描 model_route.json 的每个 question_id,生成结果契约骨架、基础字段画像表、paper_output/code/modeling/README.md,并生成可运行的 q*_model.py
    • 覆盖规则:生成文件带有 managed marker;如果 Agent 已经手工改写并去掉 marker,本脚本会保留用户文件,不覆盖。
  • scripts/result_contract_templates.py
    • 何时用:需要了解不同任务类型应沉淀哪些指标、表格和结论字段。
    • 做什么:提供预测、优化、评价、分类、聚类、仿真、通用建模的契约模板。

任务类型分发

  • 预测/回归/时间序列 -> forecasting scaffold:生成目标列、特征列、预测值、残差、RMSE、MAE、MAPE。
  • 优化/规划/调度/选址/路径 -> optimization scaffold:生成代理目标函数、方案排序、约束满足率待补项。
  • 评价/排序/权重/TOPSIS/AHP/熵权 -> evaluation scaffold:生成指标归一化、综合得分、排序和权重敏感性待补项。
  • 分类/识别/判别 -> classification scaffold:生成代理分类标签、准确率/F1 待补项。
  • 聚类/分群 -> clustering scaffold:生成代理聚类标签、聚类数、簇内紧凑度。
  • 仿真/机理/动力学/微分 -> simulation scaffold:生成趋势代理、情景结果、拟合误差和敏感性参数。
  • 其他 -> general scaffold:生成数值字段统计摘要和通用结果表。

输出位置

paper_output/
|-- code/
|   `-- modeling/
|       |-- run_modeling.py
|       |-- result_contract_io.py
|       |-- q1_model.py
|       |-- q2_model.py
|       |-- q3_model.py
|       `-- README.md
|-- results/
|   |-- model_results.json
|   |-- metrics.json
|   `-- conclusions.json
`-- tables/
    |-- table_index.json
    |-- table_q1_result_skeleton.csv
    |-- table_q1_forecasting_scaffold.csv
    `-- ...

统一规则:

  • 所有路径使用相对路径。
  • 所有 JSON 包含 schema_versiongenerated_bygenerated_at
  • 每条结果、指标、结论和表格都应带 question_id
  • 草稿或脚手架结果必须使用 statusevidence_status 标记。
  • 正式结果必须带 execution_provenance,包含 source_code_pathrun_commandrun_exit_codeoutput_artifacts;统一入口 run_modeling.py 还必须写入 paper_output/results/run_manifest.json,记录脚本命令、退出码、输入文件 hash 和输出产物 hash。official evidence gate 会拒绝没有真实代码运行来源或没有 run_manifest 对应运行记录的结果。
  • 正文中引用的表格必须能在 paper_output/tables/table_index.json 找到。

使用方式

推荐由 paper-workflow-orchestrator 在数据清洗与可视化之后调用。也可以手动运行:

python skills/model-code-and-result-generator/scripts/build_result_contracts.py

生成脚手架后,Agent 应按真实赛题执行:

python paper_output/code/modeling/run_modeling.py

该入口会写入 paper_output/results/run_manifest.json。然后重新运行 QA,让 paper_output/tasks.json 读取刷新后的 model_results.jsonmetrics.jsonconclusions.jsonrun_manifest.jsontable_index.json

真实赛题使用原则

  • 不要把占位式指标或代理结果直接当成最终比赛结果。
  • 优先修改 paper_output/code/modeling/q*_model.py,不要修改 skill 包内的 scripts/
  • 正式建模完成后,必须由建模代码实际运行并把真实输出写回 paper_output/results/paper_output/tables/;不要手写 model_results.json 冒充运行结果。没有 run_manifest.json 对应运行记录时,不能进入正式 evidence gate。
  • 如果某一问没有真实结果,QA 应保留 warning,正文不得把该问写成已经完成精确计算。
Install via CLI
npx skills add https://github.com/yushui2022/MathModel-Skill --skill model-code-and-result-generator
Repository Details
star Stars 164
call_split Forks 18
navigation Branch main
article Path SKILL.md
More from Creator