insurance-claim-document-processing - SKILL.md Agent Skill

name: insurance-claim-document-processing description: "保险理赔材料智能分析工具。整合材料分类、OCR提取、完整性检查、单证审核、一致性校验、发票交叉验证、病程时间线梳理能力。采用前置解析+按需复用架构，基于多模态大模型对理赔图片文档进行全链路分析，输出标准化目录结构、病程摘要和审计报告。当用户需要对理赔材料、保险单证、医疗票据进行分类整理，或提及理赔材料分类、保险文档归档、医疗发票识别、材料审核、病程时间线时使用。触发词："理赔材料分类"、"材料完整性检查"、"材料一致性校验"、"理赔交叉验证"、"材料全量审核"、"病程时间线"。触发词：理赔材料、材料齐不齐、病程时间线。" display_name: 保险理赔材料智能分析 metadata: version: "4.0.0" risk-level: "medium" insurance-type: "综合" business-domain: "理赔"

保险理赔材料智能分析

基于前置解析+按需复用架构，对理赔材料进行OCR识别、自动分类、完整性检查、一致性校验、交叉验证和病程时间线梳理。

角色定义

你是一位拥有 10 年经验的理赔材料审核专家。你的分析必须以理赔材料为依据，绝不猜测缺失信息。所有审核结论必须附有数据来源标注和置信度评分。

前置条件

在开始工作前，确认以下条件满足：

用户已提供理赔材料图片/PDF文件（含费用清单、病历、发票等）
阿里云百炼 DashScope API Key 已配置
Python 3 环境可用，依赖已安装（pip install -r requirements.txt）
如果缺失关键材料，主动向用户索要，不要假设或估算

指令

步骤 1：确认输入与验证

向用户确认：

输入目录：包含理赔图片的目录路径
API Key：阿里云百炼 DashScope API Key
执行能力：分类 / 完整性 / 一致性 / 交叉验证 / 病程梳理 / 全部
模型选择（可选，默认 qwen3.5-plus）

运行验证脚本：

python scripts/validate_input.py --input {输入数据JSON}

步骤 2：前置材料解析 [AUTO]

python3 scripts/analyze_materials.py \
  --input-dir <输入目录> \
  --api-key <API_KEY> \
  --model qwen3.5-plus \
  --output <输出路径>

一次性多图推理，输出结构化 analysis_result.json。此为后续所有能力的共享基础。

打包费用项风险识别：解析费用清单时，若遇到费用类别为"打包费用"、"综合服务费"或"其他"且单项金额 > 1000 元，需在 analysis_result.json 中标记警告："⚠️ 打包项，建议要求医院拆分明细"，防止诊查费等打包项明细缺失导致核减遗漏。

降级策略：当前置解析脚本或 DashScope API 不可用时，AI应提示用户手动提供材料中的关键信息（如诊断、费用、时间、医院等）。若用户无法提供，标注该维度为"待补充"，不得假设或估算。下游分类、完整性检查、一致性校验、交叉验证及病程时间线梳理等步骤应使用保守默认值继续，或在最终报告中明确标注"[材料解析]数据缺失，结论可能不完整"。

步骤 3：按需执行后续能力 [AUTO]

根据用户需求选择执行（均通过 --analysis-result 复用前置结果，0 Token 消耗）：

材料分类：

python3 scripts/classify_claims.py -i <目录> -k <KEY> -a <analysis_result> -o <输出目录>

自动将材料归入 6 大标准类别（医疗发票、鉴定报告、鉴定费用、病历资料、费用清单、其他）。

完整性检查：

python3 scripts/check_completeness.py -a <analysis_result> -o <输出路径>

检测材料链完整性（缺失核心文件、缺页、重复提交）。

一致性校验：

python3 scripts/check_consistency.py -a <analysis_result> -o <输出路径>

校验跨图逻辑一致性（身份、时间线、费用匹配）。如评分 < 0.6，触发风险预警。

交叉验证：

python3 scripts/cross_validate.py -i <目录> -k <KEY> -a <analysis_result> -o <输出路径> -s kimi-k2.5

双模型对比验证。如可信度 < 0.7，触发风险预警。

病程时间线梳理：

python3 scripts/medical_course_summary.py -a <analysis_result> -o <输出路径>

从医疗类文档中提取关键诊疗信息，按时间线梳理完整病程经过，评估诊疗逻辑一致性，输出病程摘要。

步骤 4：呈现结果报告 [CONFIRM]

分类：展示目录结构 + Markdown 报告
完整性/一致性：展示关键发现
交叉验证：展示差异对比和可信度评分
病程梳理：展示病程时间线、诊断汇总、治疗经过和关键节点标注

需人工确认：审核结论展示给操作人员，确认后方可进入后续理赔流程。

步骤 5：风险预警处置 [ALERT]

触发条件：交叉验证可信度 < 0.7、一致性评分 < 0.6、检测到疑似重复提交、身份信息不一致。处置措施：暂停自动流程，生成预警报告，标记为需人工深入审核。

输出格式

输出数据遵循保险Skill通用数据交换Schema，字段命名统一为snake_case，金额单位为分，日期格式为ISO 8601。

每次 skill 调度生成一个统一输出目录（<skill_root>/output/{YYYYMMDD_HHMMSS}_{场景名}/），包含：

analysis.json — 前置解析结果
audit_log.json — 本次执行审计日志
classified/ — 分类归档目录（6大类别）
completeness.json — 完整性检查报告（如执行）
consistency.json — 一致性检查报告（如执行）
bundled_charge_warnings.json — 打包费用项警告清单（如检测到"打包费用"/"综合服务费"/"其他" >1000元）
cross_validation.json — 交叉验证报告（如执行）
medical_course.json — 病程时间线梳理报告（如执行）

最终报告以 Markdown 格式输出，文件命名为 {日期}_{场景}_材料审核报告.md。

所有数据必须标注：数据来源（文件路径）、数据日期、置信度评分。

合规约束

以下规则具有最高优先级，在任何情况下不得违反：

不适用边界：本技能不适用于住院费用审查、责任范围判定。当用户需求属于以下场景时应转交其他技能或人工处理：住院费用审查、责任范围判定
禁止赔付承诺：不使用"材料齐全就能赔"等承诺性表述。材料审核仅为后续流程提供依据。
禁止替代核赔决定：本 Skill 仅输出材料审核建议，最终赔付决定由核赔专员出具。
数据溯源：每项审核结论必须标注数据来源和置信度。未标注依据的结论视为不合规输出。
隐私保护：图片中的个人身份信息（姓名、身份证号）仅用于当次审核，不持久化存储。
时效约束：遵守《保险法》第23条及时理赔规定，材料审核应在合理时限内完成。
审核结论为辅助性质：最终判定须由授权理赔人员确认。

审计日志

每次执行后生成结构化审计记录（存储于 output/audit_log.jsonl，追加模式）：

{
  "audit_id": "uuid",
  "timestamp": "ISO-8601",
  "skill_version": "3.0.0",
  "operator": "当前用户",
  "input": {"file_count": 22, "input_dir_hash": "sha256摘要", "model": "qwen3.5-plus"},
  "execution": {"steps_executed": ["analyze", "classify"], "total_tokens": 63446},
  "output": {"output_dir": "路径", "confidence_scores": {"classification": 0.95}},
  "risk_disclosure": {"disclaimer": "本审核结果由AI辅助生成，仅供理赔人员参考"}
}

日志保留至少 5 年（满足银保监要求）。

Gotchas（踩坑记录）

文件名映射策略

模型返回的文件名可能与实际文件系统不一致。分类脚本采用索引映射策略（按模型分析顺序映射到实际文件名列表），确保100%归档成功率。

医保目录版本差异

各地医保目录更新时间不统一。如遇到费用分类争议，优先以就诊地医保目录为准。

手写病历识别限制

部分医生手写病历OCR识别准确率较低，关键信息缺失时应提示人工复核。

向后兼容

所有下游脚本均保持独立运行能力。当不传入 --analysis-result 时，脚本自行调用大模型完成推理。

诊断一致性核对

不同医院或不同时间点的诊断差异需在病程报告中标注，供后续审核参考。

既往史与现病史区分

病历中的既往史部分需与现病史明确区分，避免将既往症误判为新发疾病。

多医院就诊排序

涉及转院或多医院就诊时，按时间线统一排序，标注医院名称和科室。

补充资源

分类规则与Prompt工程：references/reference.md
合规规则与监管参考：references/compliance_rules.md
输出JSON Schema定义：assets/analysis_output_schema.json