Evolução do Querido Diário
Onde conseguimos encontrar a maior parte dos dados relacionados às atividades municipais? No Diário Oficial.
Com 5570 municípios no país, perfis como jornalistas, acadêmicos, ativistas e gestores públicos que desejem acompanhar as publicações de vários municípios para realização de matérias, estudos e tomadas de decisão, tem seu trabalho muito limitado, pois cada município publica seus diários oficiais da sua própria maneira e normalmente utilizando formatos fechados.
O Querido Diário (https://queridodiario.ok.org.br/) é um projeto de código aberto que busca solucionar esta situação raspando, processando e disponibilizando os diários oficiais dos municípios brasileiros de forma centralizada e utilizando padrões abertos de publicação. Hoje, o projeto permite acessar as informações publicadas nos diários oficiais de mais de 350 municípios por meio da pesquisa em sua plataforma web e também em API pública (https://queridodiario.ok.org.br/api/docs).
Porém, ainda há muita oportunidade de melhoria na forma de publicação dos diários para atender casos de uso comuns. Neste projeto propomos o desenvolvimento de rotinas de processamento de dados, criação de pontos de acesso na API e desenvolvimento de interfaces na plataforma web para atender o deseolvimento das novas funcionalidades a seguir:
Com estes cenários solucionados, o Querido Diário será uma ferramenta ainda mais poderosa para enfrentamento ao deserto de dados governamentais municipais.
Novas funcionalidades esperadas:
- Funcionalidade de download de resultados de busca no “Querido Diário” (https://queridodiario.ok.org.br/) e “Querido Diário: Tecnologias na Educação” (https://queridodiario.ok.org.br/educacao) desenvolvida na interface da plataforma web;
- Como jornalista, quero poder baixar os resultados da minha busca na plataforma web do Querido Diário para sistematizar o processo de apuração de reportagens;
- Como pesquisadora, quero poder baixar os textos completos dos diários oficiais para realizar meus próprios recortes e processamentos de forma transversal.
- Desenvolvimento de rotina de agregação e compactação de arquivos de diários (em seu formato textual) em recortes geográficos e cronológicos (unidade federativa, município, ano, mês e dia) para disponibilização em sistema de arquivos em nuvem para download;
- Ponto de acesso na API do Querido Diário (https://queridodiario.ok.org.br/api/docs) para listagem de URLs de arquivos de diários agregados e compactados disponíveis para download pelos recortes geográficos e cronológicos desejados;
- Página na plataforma web do projeto para download de diários oficiais em formato agregado e compactado pelos recortes geográficos e cronológicos desejados.
Tamanho do projeto: Médio
Dificuldade: Grande
Habilidades necessárias/preferenciais
- Python
- FastAPI
- Typescript
- Angular
- Sistemas de arquivos s3-like (Digital Ocean Spaces)
- Elasticsearch/Opensearch
Mentores
- Giulio Carvalho, Open Knowledge Brasil
Resultados
-
Criação de manual de configuração do ambiente de desenvolvimento dentro do Linux em conjunto com o mentor Giulio.
-
Página de download de múltiplos enxertos resultantes de uma busca textual:
-
Página e serviço de download de arquivos proveniente da extração textual dos diários oficiais municipais, agregados em ano e estado/município:
-
Por estado:
-
Por município:
Roadmap
Repositórios Utilizados pela Equipe
Equipe
Foto | Nome | Github |
---|---|---|
Arthur Ferreira | ArthurFerreiraRodrigues | |
Cristian Furtado | csafurtado | |
Ester Lino | esteerlino | |
Pedro Cabeceira | pkbceira03 | |
Raissa Oliveira | raissamsoliveira | |
Wildemberg Sales | wildemberg-sales |