Evolução do Querido Diário

2024, Feb 20    

Evolução do Querido Diário

Descrição:

Onde conseguimos encontrar a maior parte dos dados relacionados às atividades municipais? No Diário Oficial.

Com 5570 municípios no país, perfis como jornalistas, acadêmicos, ativistas e gestores públicos que desejem acompanhar as publicações de vários municípios para realização de matérias, estudos e tomadas de decisão, tem seu trabalho muito limitado, pois cada município publica seus diários oficiais da sua própria maneira e normalmente utilizando formatos fechados.

O Querido Diário (https://queridodiario.ok.org.br/) é um projeto de código aberto que busca solucionar esta situação raspando, processando e disponibilizando os diários oficiais dos municípios brasileiros de forma centralizada e utilizando padrões abertos de publicação. Hoje, o projeto permite acessar as informações publicadas nos diários oficiais de mais de 350 municípios por meio da pesquisa em sua plataforma web e também em API pública (https://queridodiario.ok.org.br/api/docs).

Porém, ainda há muita oportunidade de melhoria na forma de publicação dos diários para atender casos de uso comuns. Neste projeto propomos o desenvolvimento de rotinas de processamento de dados, criação de pontos de acesso na API e desenvolvimento de interfaces na plataforma web para atender as duas situações a seguir:

  • Como jornalista, quero poder baixar os resultados da minha busca na plataforma web do Querido Diário para sistematizar o processo de apuração de reportagens;
  • Como pesquisadora, quero poder baixar os textos completos dos diários oficiais para realizar meus próprios recortes e processamentos de forma transversal.

Com estes cenários solucionados, o Querido Diário será uma ferramenta ainda mais poderosa para enfrentamento ao deserto de dados governamentais municipais.

Novas funcionalidades esperadas:

  1. Funcionalidade de download de resultados de busca no “Querido Diário” (https://queridodiario.ok.org.br/) e “Querido Diário: Tecnologias na Educação” (https://queridodiario.ok.org.br/educacao) desenvolvida na interface da plataforma web;
  2. Desenvolvimento de rotina de agregação e compactação de arquivos de diários (em seu formato textual) em recortes geográficos e cronológicos (unidade federativa, município, ano, mês e dia) para disponibilização em sistema de arquivos em nuvem para download;
  3. Ponto de acesso na API do Querido Diário (https://queridodiario.ok.org.br/api/docs) para listagem de URLs de arquivos de diários agregados e compactados disponíveis para download pelos recortes geográficos e cronológicos desejados;
  4. Página na plataforma web do projeto para download de diários oficiais em formato agregado e compactado pelos recortes geográficos e cronológicos desejados.

Habilidades necessárias/preferenciais

  • Python
  • FastAPI
  • Typescript
  • Angular
  • Sistemas de arquivos s3-like (Digital Ocean Spaces)
  • Elasticsearch/Opensearch

Mentores

  • Giulio Carvalho, Open Knowledge Brasil

Tamanho do projeto: Médio Dificuldade: Grande