sql-validate-and-export - SKILL.md Agent Skill

name: sql-validate-and-export version: 2.0.0 description: SQL 分段验证、自我修复、结果导出与智能分析。流程：解析SQL → Dataphin MCP 验证元数据 → 自动修复 → 分段执行验证 → 导出 CSV → 智能分析（漏斗解读、异常识别、预判用户问题）。适用场景："跑一下这个SQL"、"验证这个查询"、"帮我执行并导出"、"分析一下结果"等。

SQL 查询在复杂环境中容易出错（字段名错误、表引用错误、JOIN 膨胀等）。本 skill 通过分段验证、逐步合并的方式，确保最终结果可靠，并自动导出为 CSV 文件。最后，从数据和用户角度进行智能分析，预判用户可能追问的问题并提前给出答案。

这个流程模拟了资深数据分析师的工作习惯：先摸清数据，再逐步拼装，最后主动讲故事和提前回答追问——而不是把一张表甩给用户让他们自己看。

读取 SQL 文件，解析出涉及的所有表和字段
调用 Dataphin MCP 验证元数据：
- mcp__sh_dp_mcp__get_dp_table_meta 获取每张表的字段列表和类型
- 逐一核对 SQL 中引用的字段是否存在于正确的表中
- 检查字段类型是否与使用方式匹配（如 string 类型用于数值计算需注意隐式转换）
记录发现的问题，分类为：
- 致命错误：字段不存在、表名错误 → 必须修复
- 警告：类型隐式转换、可能的 NULL 值 → 提示用户

如果发现错误，在用户确认后自动修复：

修复后重新验证，确保所有引用正确。

按照从简单到复杂的顺序执行，每步验证结果合理性：

Step 1: 单表验证

Step 2: 两表 JOIN 验证

Step 3: 完整查询执行

验证通过后：

执行不带 LIMIT 的完整查询（如果数据量在 10000 条以内）
将结果解析并写入 CSV 文件
文件命名规则：{SQL文件名}_{YYYYMMDD_HHMM}.csv
- 例如：贷前指标_20260407_1430.csv
- 如果 SQL 不是来自文件，使用用户提供的名称或查询主题

导出完成后，从数据视角和用户视角两个维度自动生成分析：

5.1 数据视角分析

基于查询结果自动识别：

5.2 用户视角预判追问

根据查询的业务语义，提前回答用户最可能追问的 3-5 个问题：

5.3 输出格式

分析结果以结构化方式输出：

### 关键发现
- [发现1]：一句话结论 + 数据支撑
- [发现2]：...

### 预判追问 Q&A
**Q1: [用户可能问的问题]**
A: [基于数据的回答]

**Q2: ...**
A: ...

使用 Dataphin MCP 异步查询：

提交: mcp__sh_dp_mcp__submit_dp_query → 获取 taskId
轮询: mcp__sh_dp_mcp__get_dp_query_status → 间隔 10s+

每步执行后，自动检查以下项目：

每个 Phase 完成后，输出简洁的中间结果摘要：