Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Doublons dans la nouvelle sortie JSON #382

Open
frodrigo opened this issue Feb 12, 2024 · 7 comments
Open

Doublons dans la nouvelle sortie JSON #382

frodrigo opened this issue Feb 12, 2024 · 7 comments

Comments

@frodrigo
Copy link
Member

frodrigo commented Feb 12, 2024

Il y a des doublons de type=city|town|village. Des lignes sont identiques. Principalement dans le 67.

Les type=city:

+"44015","Blain"
+"67043","Bischheim"
+"67046","Bischwiller"
+"67067","Brumath"
+"67130","Erstein"
+"67180","Haguenau"
+"67204","Hœnheim"
+"67218","Illkirch-Graffenstaden"
+"67267","Lingolsheim"
+"67348","Obernai"
+"67365","Ostwald"
+"67437","Saverne"
+"67447","Schiltigheim"
+"67462","Sélestat"
+"67482","Strasbourg"
@vdct
Copy link
Member

vdct commented Feb 19, 2024

Je ne constate aucun doublon dans les JSON du jour, et le code est plus ancien que ton ticket. Tu as des doublons encore de ton côté ?

@frodrigo
Copy link
Member Author

Si je vois toujours des doublons dans la dernière verison en ligne

zcat full.sjson.gz  | grep '"id":"67462"' 
{"id":"67462","type":"city","name":"Sélestat","postcode":"67600","lat":48.25944,"lon":7.454217,"city":"Sélestat","departement":"Bas-Rhin","region":"Grand Est","population":19242,"adm_weight":3,"importance":0.6462}
{"id":"67462","type":"city","name":"Sélestat","postcode":"67600","lat":48.25944,"lon":7.454217,"city":"Sélestat","departement":"Bas-Rhin","region":"Grand Est","population":19242,"adm_weight":3,"importance":0.6462}

@vdct
Copy link
Member

vdct commented Feb 21, 2024

Ok vu. Ca devrait être bon désormais (corrigé hier soir)

@frodrigo
Copy link
Member Author

Ok vu. Ca devrait être bon désormais (corrigé hier soir)

Ok plus de doublon là-dessus (pas de changement de code ?)

Mais il y en a d'autres sur les ids / code insee (il y en a aussi sur les codes fantoir)

      2 09110
      2 17307
      2 21352
      2 24478
      2 27466
      2 64214
      2 73257
      2 86247

86247 :

{"id":"86247","type":"town","name":"Val-de-Cognac","postcode":"86400","lat":45.744336,"lon":-0.357566,"city":"Val-de-Cognac","departement":"Vienne","region":"Nouvelle-Aquitaine","population":2399,"adm_weight":1,"importance":0.3277}
{"id":"86247","type":"village","name":"Val-de-Comporté","postcode":"86400","lat":46.133051,"lon":0.243007,"city":"Val-de-Comporté","departement":"Vienne","region":"Nouvelle-Aquitaine","population":497,"adm_weight":1,"importance":0.2785}

Val-de-Comporté contient les mêmes info que Val-de-Cognac alors que la commune est dans un autre département.

Pour 73257, 64214, 27466, 27466, 27466, 17307, 09110 doublons à l'exception des coordonnées.

@vdct
Copy link
Member

vdct commented Feb 22, 2024

Ok vu. Ca devrait être bon désormais (corrigé hier soir)

Ok plus de doublon là-dessus (pas de changement de code ?)

Non il s'agissait d'un fichier de données parasite

Val-de-Comporté contient les mêmes info que Val-de-Cognac alors que la commune est dans un autre département.

Corrigé dans OSM : une erreur de code INSEE dans la relation

Pour 73257, 64214, 27466, 27466, 27466, 17307, 09110 doublons à l'exception des coordonnées.

Pour chacun la situation était d'avoir 2 nodes avec un role admin_centre. Corrigés dans OSM

Le résultat devrait se voir dans les exports dispos demain

@frodrigo
Copy link
Member Author

frodrigo commented Feb 22, 2024 via email

@vdct
Copy link
Member

vdct commented Feb 22, 2024

Non car il ne s'agit pas de masquer ce qui est bancal dans OSM, sinon on ne le corrigera pas. C'est pour cette même raison qu'il n'y a jamais eu de fuzzy dans la recherche de correspondance entre les noms de voie d'OSM et les autres.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants