Política de Dados

De onde vêm os dados e o que fazemos com eles

O Anatomia do Gasto apresenta dados públicos, extraídos de fontes oficiais, sem edição editorial. Esta página explica o processo, a cadência de atualização e como reportar erros.

Origem dos dados

Todos os dados exibidos no Anatomia do Gasto são extraídos exclusivamente de documentos oficiais publicados pelo poder público. Nenhum dado é criado, estimado ou editado pela equipe do projeto.

  • Portal de Transparência da Prefeitura de Sorocaba — relatórios de aplicação da LRF (saúde) e relatórios de execução orçamentária (educação)

  • SICONFI — Sistema de Informações Contábeis e Fiscais do Setor Público Brasileiro (Tesouro Nacional) — RREO Anexo 12

  • SIOPS — Sistema de Informações sobre Orçamentos Públicos em Saúde (Ministério da Saúde) — referência de validação cruzada

Como os dados são extraídos

O processo de extração é automatizado e auditável. Nenhuma etapa envolve edição manual dos valores.

  • Download automático dos PDFs a partir das URLs oficiais

  • Leitura do texto dos PDFs com pdfplumber; fallback para PyMuPDF em PDFs baseados em imagem

  • Normalização: remoção de acentos, conversão do formato numérico brasileiro (1.234,56 → 1234.56)

  • Verificação de integridade: script que confere se os totais batem e se todos os períodos estão presentes

  • O código-fonte completo está disponível em github.com/sallumc2018/anatomia-do-gasto

Atualização dos dados

Os dados são atualizados manualmente quando novos relatórios são publicados pelos órgãos oficiais. Não há atualização em tempo real.

  • Saúde: três vezes por ano, ao término de cada quadrimestre (abril, agosto e dezembro)

  • Educação: quatro vezes por ano, ao término de cada trimestre

  • A data de referência de cada conjunto de dados é indicada na própria página

Erros e correções

Erros podem ocorrer por falhas no processo de extração ou por inconsistências nos próprios PDFs oficiais. Em ambos os casos, o procedimento é o mesmo.

  • Para reportar um erro: sallumc@gmail.com — informe a página, o valor incorreto e a fonte que indica o valor correto

  • Verificamos a ocorrência em até 7 dias úteis

  • Erros confirmados são corrigidos e o commit de correção fica registrado publicamente no histórico do GitHub

  • Se o erro estiver no PDF original: registramos a divergência na página correspondente, mas mantemos o valor do documento oficial até que ele seja corrigido na fonte

O que não coletamos sobre você

O site não coleta nenhum dado pessoal dos visitantes.

  • Nenhum formulário de cadastro ou login

  • Nenhum cookie de rastreamento ou publicidade

  • Nenhum sistema de analytics de terceiros (Google Analytics, Meta Pixel ou similar)

  • Os únicos cookies presentes são os estritamente necessários para o funcionamento do Next.js em produção