Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[dbt/code] br_sp_saopaulo_geosampa_iptu #76

Closed
wants to merge 13 commits into from

Conversation

tricktx
Copy link
Contributor

@tricktx tricktx commented Jun 23, 2023

No description provided.

Copy link
Contributor

@laura-l-amaral laura-l-amaral left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Inclui algumas orientações pra melhorar o nome de variáveis, é importante deixar o código mais fácil de entender pra gente e pra vc tbm

Copy link
Contributor

@laura-l-amaral laura-l-amaral left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • No BQ data_cadastramento só tem 32 valores, isso se verifica na tabela original?
  • Faz uma listinha de checks pra gente garantir que a base que foi pro BQ tá igual a original
  • O que é o codigo_logradouro? Ele é útil pra gente de alguma maneira?
  • Precisa alterar a ordem das colunas, quais são as colunas mais importantes dessa tabela? quais são as colunas de caracterização e quais são as colunas de valores? Atualizei nosso manual de estilo pra ele ficar mais claro como ordenar https://basedosdados.github.io/mais/style_data/#ordenamento-de-variaveis
  • Metadados - Título da tabela deve ser diferente do nome da tabela no BQ. O título deve ser em maiúsculo e quando aplicável, colocar palavrinhas como 'de' 'da' 'com', etc
  • A entidade não é pessoa, é imóvel
  • A unidade de medida da coluna valor é em brl/m³ mesmo? não é só brl?
  • Vc diz na descrição que são 120Mb de informações, mas no BQ temos 21GB. O que aconteceu aqui?

@tricktx
Copy link
Contributor Author

tricktx commented Jun 23, 2023

  1. Faz uma listinha de checks pra gente garantir que a base que foi pro BQ tá igual a original - Tudo bem.

  2. O que é o codigo_logradouro? Ele é útil pra gente de alguma maneira? - É o código referente a cada logradouro, acreditei que fosse válido por algum motivo, mas posso ter viajado, desculpa.

  3. Precisa alterar a ordem das colunas, quais são as colunas mais importantes dessa tabela? quais são as colunas de caracterização e quais são as colunas de valores? Atualizei nosso manual de estilo pra ele ficar mais claro como ordenar https://basedosdados.github.io/mais/style_data/#ordenamento-de-variaveis -Então, eu ordenei e posteriormente passou pela revisão da equipe, mas irei revisar o manual novamente. Desculpa.

  4. A unidade de medida da coluna valor é em brl/m³ mesmo? não é só brl? - Acreditei que como o valor é medido pelo m², faria sentido colocar dessa forma. Mas posso estar errado, irei consertar.

@laura-l-amaral
Copy link
Contributor

  1. Show
  2. É uma dúvida sincera, não uma correção, pq achou que era válido? continua achando?
  3. O manual estava pouco claro em relação como ordenar mesmo, zero problemas, se quiser depois fazemos juntos
  4. Vc verificou em algum lugar qual a unidade antes de consertar? A maneira como vc comunicou me deu a impressão que iria consertar sem verificar, como se eu tivesse corrigindo e não perguntando.
  5. "Vc diz na descrição que são 120Mb de informações, mas no BQ temos 21GB. O que aconteceu aqui?" -> o que aconteceu?

@tricktx
Copy link
Contributor Author

tricktx commented Jun 26, 2023

  1. É uma dúvida sincera, não uma correção, pq achou que era válido? continua achando? Porque o id do logradouro, por um momento faz sentido, mas como o nosso diretório não faz ligação e não se liga a nada, faz sentido dropar a coluna.

  2. Vc verificou em algum lugar qual a unidade antes de consertar? A maneira como vc comunicou me deu a impressão que iria consertar sem verificar, como se eu tivesse corrigindo e não perguntando. Então, para mim, fazia muito sentido manter o valor de brl/m², uma vez que o valor é expressado pelo valor total do imóvel pelo tamanho da área em metros quadrados, mas eu acabei aceitando a sua sugestão e alterando.

  3. O manual estava pouco claro em relação como ordenar mesmo, zero problemas, se quiser depois fazemos juntos - Eu refiz a arquitetura, verifica se está mais parecida com o ideal: https://docs.google.com/spreadsheets/d/1gm7JTtERy5LSGMV4rL1xdx-_UsEZAyATFeEB6pk8zZ0/edit?usp=drivesdk , dessa forma, consigo subir os dados novamente para dev.

  4. "Vc diz na descrição que são 120Mb de informações, mas no BQ temos 21GB. O que aconteceu aqui?" -> o que aconteceu? Em relação a essa informação, eu peguei uma descrição dos dados bem antiga no site do geosampa e acabei não alterando as informações. Foi erro de atenção mesmo.

dbt_project.yml Show resolved Hide resolved
@tricktx tricktx added table-approve Trigger action table-approve sync-dbt-schema Trigger actoin sync-dbt-schema labels Jul 3, 2023
@tricktx tricktx closed this Jul 7, 2023
@tricktx tricktx deleted the staging/br-sp-saopaulo-geosampa-iptu branch July 7, 2023 12:52
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
sync-dbt-schema Trigger actoin sync-dbt-schema table-approve Trigger action table-approve
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants