Política de Dados
De onde vêm os dados e o que fazemos com eles
O Anatomia do Gasto apresenta dados públicos, extraídos de fontes oficiais, sem edição editorial. Esta página explica o processo, a cadência de atualização e como reportar erros.
Origem dos dados
Todos os dados exibidos no Anatomia do Gasto são extraídos exclusivamente de documentos oficiais publicados pelo poder público. Nenhum dado é criado, estimado ou editado pela equipe do projeto.
- —
Portal de Transparência da Prefeitura de Sorocaba — relatórios de aplicação da LRF (saúde) e relatórios de execução orçamentária (educação)
- —
SICONFI — Sistema de Informações Contábeis e Fiscais do Setor Público Brasileiro (Tesouro Nacional) — RREO Anexo 12
- —
SIOPS — Sistema de Informações sobre Orçamentos Públicos em Saúde (Ministério da Saúde) — referência de validação cruzada
Como os dados são extraídos
O processo de extração é automatizado e auditável. Nenhuma etapa envolve edição manual dos valores.
- —
Download automático dos PDFs a partir das URLs oficiais
- —
Leitura do texto dos PDFs com pdfplumber; fallback para PyMuPDF em PDFs baseados em imagem
- —
Normalização: remoção de acentos, conversão do formato numérico brasileiro (1.234,56 → 1234.56)
- —
Verificação de integridade: script que confere se os totais batem e se todos os períodos estão presentes
- —
O código-fonte completo está disponível em github.com/sallumc2018/anatomia-do-gasto
Atualização dos dados
Os dados são atualizados manualmente quando novos relatórios são publicados pelos órgãos oficiais. Não há atualização em tempo real.
- —
Saúde: três vezes por ano, ao término de cada quadrimestre (abril, agosto e dezembro)
- —
Educação: quatro vezes por ano, ao término de cada trimestre
- —
A data de referência de cada conjunto de dados é indicada na própria página
Erros e correções
Erros podem ocorrer por falhas no processo de extração ou por inconsistências nos próprios PDFs oficiais. Em ambos os casos, o procedimento é o mesmo.
- —
Para reportar um erro: sallumc@gmail.com — informe a página, o valor incorreto e a fonte que indica o valor correto
- —
Verificamos a ocorrência em até 7 dias úteis
- —
Erros confirmados são corrigidos e o commit de correção fica registrado publicamente no histórico do GitHub
- —
Se o erro estiver no PDF original: registramos a divergência na página correspondente, mas mantemos o valor do documento oficial até que ele seja corrigido na fonte
O que não coletamos sobre você
O site não coleta nenhum dado pessoal dos visitantes.
- —
Nenhum formulário de cadastro ou login
- —
Nenhum cookie de rastreamento ou publicidade
- —
Nenhum sistema de analytics de terceiros (Google Analytics, Meta Pixel ou similar)
- —
Os únicos cookies presentes são os estritamente necessários para o funcionamento do Next.js em produção