cost-tracker - SKILL.md Agent Skill

name: cost-tracker description: | Skill de rastreamento de custo por sessao. Monitora tokens consumidos, chamadas de API (fal.ai, Brave, Firecrawl), tempo de execucao e custo estimado por skill no pipeline. Gera relatorio de custo ao final da sessao. Trigger em: "custo", "cost", "quanto gastou", "token usage", "consumo", "budget", "relatorio de custo". argument-hint: "[sessao-id ou --current]" allowed-tools: Read, Write, Bash

Cost Tracker

O Cost Tracker monitora e consolida os custos de cada sessao de trabalho. Rastreia tokens consumidos por skill, chamadas de API externas, tempo de execucao e modelo utilizado, gerando um relatorio detalhado de custo estimado ao final da sessao.

Governanca Global

Esta skill segue GLOBAL.md, policies/execution.md, policies/persistence.md, policies/token-efficiency.md, policies/tool-safety.md, policies/handoffs.md, policies/evals.md, policies/memory-tiers.md e policies/memory-consolidation.md (sugerir /consolidate-memory quando vault crescer demais).

Quando Usar

ao final de uma sessao para consolidar custos
quando o usuario perguntar quanto custou ou qual o consumo
quando o pipeline for longo e envolver multiplas skills
quando o objetivo for otimizar gastos e identificar skills mais caras

Quando Nao Usar

para decisoes de negocio baseadas em custo real de infra
para substituir billing real de provedores (fal.ai, Brave, Firecrawl)
para estimar custo de infraestrutura de deploy ou hosting

Entradas Esperadas

pipeline executado e skills acionadas
chamadas de API externas realizadas (fal.ai, Brave, Firecrawl)
metadata de respostas LLM (tokens de entrada/saida)

Saidas Esperadas

relatorio em docs/cost-reports/session-YYYY-MM-DD.md
resumo de custo por skill
total estimado da sessao

Responsabilidades

Rastrear tokens consumidos por skill durante o pipeline
Contabilizar chamadas de API externa (fal.ai, Brave Search, Firecrawl)
Calcular custo estimado com base no modelo usado e volume de tokens
Gerar relatorio estruturado de custo da sessao
Persistir historico de custos para comparacao entre sessoes

Metricas Rastreadas

Metrica	Fonte	Exemplo
Tokens consumidos	LLM response metadata	12.400 input / 3.200 output
Chamadas API fal.ai	Contagem por tool call	3 chamadas (image gen)
Chamadas API Brave	Contagem por tool call	5 chamadas (search)
Chamadas API Firecrawl	Contagem por tool call	2 chamadas (scrape)
Tempo de execucao	Timestamps inicio/fim	14min 32s
Modelo usado	Model Routing policy	claude-sonnet-4-20250514

Memory Tiers e Decay

O Cost Tracker também monitora a saúde dos tiers de memória ao final de cada sessão:

Learned-skills com score baixo (< 0.3): listar para arquivamento
Learned-skills candidatas à promoção (score ≥ 0.8): sinalizar para skill 35
Tamanho do devkit_context_pack: alertar se exceder 500 tokens por entrada

Ver policies/memory-tiers.md para a lógica completa de score e decay.

Formato do Relatorio

# Relatorio de Custo — Sessao YYYY-MM-DD

## Pipeline Executado
[nome do pipeline ou descricao]

## Skills Acionadas
| Skill | Tokens (in/out) | API Calls | Custo Estimado |
|---|---|---|---|
| Repo Auditor | 8.000 / 2.100 | 0 | $0.03 |
| Frontend Integration | 15.000 / 5.200 | 2 fal.ai | $0.12 |

## Chamadas de API Externa
| Provedor | Quantidade | Custo Estimado |
|---|---|---|
| fal.ai | 2 | $0.08 |
| Brave Search | 5 | $0.01 |

## Resumo
- **Total de tokens**: 45.600 input / 14.300 output
- **Total de chamadas API**: 7
- **Custo total estimado**: $0.25
- **Duracao da sessao**: 14min 32s

Integracao com Outras Skills

Orchestrator (09): aciona o Cost Tracker ao final do pipeline para gerar relatorio
Model Routing (policy): fornece o tier de modelo usado por skill/subagent, impactando o calculo de custo. Ver policies/model-routing.md
Todas as skills: reportam consumo de tokens e chamadas no handoff

Evidencia de Conclusao

relatorio de custo gerado em docs/cost-reports/
metricas de tokens e chamadas API coletadas
historico de custos atualizado

Handoff

Entregar:

caminho do relatorio de custo
highlight das skills mais caras da sessao
recomendacao de otimizacao (ex: usar modelo menor, reduzir chamadas)

Seguir policies/handoffs.md.

Codigo Limpo

Manter relatorios concisos, metricas precisas e formatos consistentes entre sessoes.