data-profiling - SKILL.md Agent Skill

name: data-profiling description: "Data profiling and schema analysis workflow. Use when user wants to understand data structure, quality, distributions. Triggers: profiling, schema, 資料品質, data quality, describe, 看資料, overview, 概況."

Phase 2 的資料 profiling 工作流，包括型別推論、品質評估、統計前提檢查。

load_dataset(filepath)
→ 自動推論型別、識別 PII

build_schema()
→ schema.json: 變數名稱、型別、基礎統計

profile_dataset(dataset_id)
→ 嘗試 ydata-profiling
→ 如不可用 → 自動降級為 basic-fallback engine

assess_quality(dataset_id)
→ quality_report.json: 品質問題 + 嚴重度

每段分析都附加 Agent 建議：

📊 變數 `age`
- 類型: continuous
- 缺失: 3.2%
- 常態性: Shapiro-Wilk p=0.034 (非常態)
  💡 [S-001] 建議使用無母數檢定
  💡 [S-004] 偏態 1.23 → 考慮 log 轉換