Eleições Brasil

Esse repositório de código contém programas que baixam dados do Tribunal Superior Eleitoral, normalizam, agrupam e limpam. Atualmente as bases de dados disponíveis são:

Candidaturas (1996 a 2018)
Bens declarados (2006 a 2018)
Votação por zona eleitoral (1996 a 2018)

Metodologia

A fonte primária é o Repositório de Dados Eleitorais do TSE. O processo é o seguinte:

Baixar arquivos ZIP
Para cada ZIP, extrair (em memória) os arquivos internos
Para cada arquivo interno, processá-lo (identificar cabeçalho, limpar)
Juntar todos os resultados em um arquivo

Normalização

Algumas etapas de normalização são necessárias para facilitar análises e conversões dos dados, como:

Retirar todos os acentos: alguns nomes aparecem com acentos em um ano e sem em outros, dificultando muito os agrupamentos;
Retirar strings inúteis: valores como #NULO#, #NULO e #NE# são retirados, deixando as células em branco;
Normalização dos códigos de cargo: os códigos de cargo variam para alguns anos, tornando difícil o agrupamento entre anos e, para facilitar as análises, normalizamos todos os anos;
Renomear colunas: nem todas as colunas possuem nomes intuitivos e foram nomeadas (exemplo: COD_SIT_TOT_TURNO foi renomeado para codigo_totalizacao_turno). Para saber mais detalhes sobre as colunas que foram renomeadas, olhe os arquivos no diretório headers/ (caso você altere algum desses arquivos, gere novamente os cabeçalhos finais com python tse.py headers).

Nota: nem todos os códigos/descrição foram normalizados (alguns apresentam inconsistências ainda não resolvidas e serão feitos em breve).

Instalando

Os programas requerem Python 3.6+. Instale as dependências executando:

pip install -r requirements.txt

Rodando

O script tse.py baixa, trata e extrai os dados. Basta rodá-lo, passando que tipo de dado quer baixar/tratar/extrair:

python tse.py candidatura
python tse.py bemdeclarado
python tse.py votacao-zona

Os dados ficarão disponíveis em:

data/download/: arquivos originais baixados, por ano
data/output/: arquivos extraídos (agrupados por tipo)

Opções

As opções listadas abaixo podem ser utilizadas em conjunto.

Anos

Você pode especificar para quais anos deseja a extração (separados por vírgulas), como em:

python tse.py candidatura --years=2014,2018

Apenas baixar

Caso queira apenas baixar os arquivos, utilize a opção --download-only.

Forçar download

Por padrão, caso os arquivos necessários para uma extração já existam em data/download/, eles não serão baixados novamente. Você pode utilizar a opção --force-redownload para que eles sejam deletados e baixados novamente.

Arquivo de saída

Você pode especificar o arquivo de saída (que será sempre um CSV, mas pode estar compactado):

python tse.py candidatura --output=candidaturas.csv.gz

Desenvolvendo/contribuindo

Instale as dependências de desenvolvimento:

pip install -r dev-requirements.txt

Rode os testes:

pytest tests.py

Ao alterar os arquivos, rode o comando black . para normalizá-los com relação à PEP-0008.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
.github		.github
headers		headers
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
dev-requirements.txt		dev-requirements.txt
extractors.py		extractors.py
filiacao.sh		filiacao.sh
filiacao_download.py		filiacao_download.py
filiacao_parse.py		filiacao_parse.py
fotos.py		fotos.py
requirements.txt		requirements.txt
run.sh		run.sh
settings.py		settings.py
tests.py		tests.py
tse.py		tse.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Eleições Brasil

Metodologia

Normalização

Instalando

Rodando

Opções

Anos

Apenas baixar

Forçar download

Arquivo de saída

Desenvolvendo/contribuindo

About

Releases

Packages

Languages

License

fmercurio/eleicoes-brasil

Folders and files

Latest commit

History

Repository files navigation

Eleições Brasil

Metodologia

Normalização

Instalando

Rodando

Opções

Anos

Apenas baixar

Forçar download

Arquivo de saída

Desenvolvendo/contribuindo

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages