Documentos da CPI da Pandemia
A CPI da Pandemia recebeu milhares de documentos pรบblicos, todos disponibilizados no site do Senado Federal.
Mas como clicar um por um leva tempo, automatizamos o download e descompactaรงรฃo de todos esses arquivos, facilitando assim nรฃo sรณ o acesso, mas tambรฉm buscas nos arquivos com ferramentas como Evernote, Spotlight, etc.
Avisos importantes
Nome dos arquivos
Para sincronizar esses arquivos na nuvem e evitar erros no sistema de arquivos, todos os nomes de arquivos foram normalizados retirando acentuaรงรฃo e caracteres especiais.
Por exemplo, um arquivo chamado Ofรญcio.text
รฉ renomeado para Oficio.txt
.
Erros
Algumas links para baixar os documentos pรบblicos nรฃo funcionam. Mesmo com estratรฉgias de repetir a tentativa em caso de erro, pode ser que nem todos os arquivos listados estejam, de fato, disponรญvel.
Links que nรฃo puderem ser baixados sรฃo listados no arquivo erros.txt
.
Sรณ quero baixar os arquivos
O resultado estรก disponibilizado nesse diretรณrio no Dropbox, e vocรช pode baixar tudo com um clique.
Vou tentar manter esse diretรณrio atualizado executando esse programa cerca de 3x semana.
Sou hacker e quero mais
Vocรช tambรฉm pode baixar tudo direto do Senado Federal, instalando esse pacote e digitando apenas um comando.
Utilizaรงรฃo com docker
Requer Docker:
$ docker build -t docs-cpi-pandemia .
$ docker run -it -v $PWD/data:/data docs-cpi-pandemia
Os arquivos serรฃo baixados em um diretรณrio data/
dentro da pasta onde vocรช executou esse comando.
Instalaรงรฃo sem docker
Requer Python 3.9 e Poetry:
$ poetry install
Uso
$ poetry run python -m cpi_pandemia
Existem opรงรตes que podem ser configuradas, as instruรงรตes e valores padrรตes podem ser vistos adicionando --help
ao final do comando.