Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Novo spider base]: Nome não identificado #1243

Open
1 task done
trevineju opened this issue Aug 7, 2024 · 2 comments
Open
1 task done

[Novo spider base]: Nome não identificado #1243

trevineju opened this issue Aug 7, 2024 · 2 comments
Labels
spider-base Adiciona robô raspador para um padrão

Comments

@trevineju
Copy link
Member

URL

não identificada

Municípios replicados

1. https://carapebus.rj.gov.br/m/Diario_Oficial
2. https://www.conceicaodemacabu.rj.gov.br/m/Diario_Oficial

Formato da publicação

Os diários oficiais são publicados em PDF (texto)

Detalhes do site de publicação

Possui filtro por data

Observações

  1. No geral, na página tem algum rastro de "desenvolvido por tal" ou alguns elementos no código-fonte que indicam que empresa ou órgão público desenvolveu a solução. Usamos essa informação para nomear a classe base. Em uma verificação inicial, não encontrei quem foi. Se quem for fazer a tarefa de desenvolvimento também não encontrar, poderá nomear a classe base como preferir, mas com bom senso.

  2. Apesar do filtro por data, como a lista de diários é continua (ou seja, não tem paginação, todos os diários estão já na página inicial) não parece ser relevante construir o raspador usando a navegação do filtro.

Não existe uma issue aberta sobre isso

  • Eu verifiquei e não existe uma issue aberta ou marcada com incompatible para o mesmo sistema.
@trevineju trevineju moved this from novo to pendente in [Querido Diário] Municípios Aug 7, 2024
@trevineju trevineju added enhancement Melhoria, novo recurso ou ferramenta spider Adiciona robô raspador para município(s) dificuldade:baixa Pouco desafiador de desenvolver labels Aug 7, 2024
@trevineju trevineju added spider-base Adiciona robô raspador para um padrão and removed enhancement Melhoria, novo recurso ou ferramenta spider Adiciona robô raspador para município(s) dificuldade:baixa Pouco desafiador de desenvolver labels Sep 15, 2024
@victorfernandesraton
Copy link
Contributor

@trevineju eu encontrei essa informação aqui a respeito do primeiro link
https://carapebus.rj.gov.br/pagina/15657/Sobre%20a%20ZEN

@trevineju
Copy link
Member Author

@trevineju eu encontrei essa informação aqui a respeito do primeiro link https://carapebus.rj.gov.br/pagina/15657/Sobre%20a%20ZEN

aqui você se refere ao possível nome para nomear a classe base?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
spider-base Adiciona robô raspador para um padrão
Projects
Status: pendente
Development

No branches or pull requests

2 participants