Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Eviter de créer un doublon lors du moissonnage si le remote ID est une URI et existe déjà #1587

Open
maudetes opened this issue Nov 26, 2024 · 0 comments
Labels
💙 Back Les tickets de back Moissonnage Indique que le sujet touche au moissonnage

Comments

@maudetes
Copy link
Contributor

maudetes commented Nov 26, 2024

Voir la logique de récupération OU création d'un dataset à partir du remote id : https://github.com/opendatateam/udata/blob/bfeae1b6a1d0d33c29485a2feae012db69eec38f/udata/harvest/backends/base.py#L387.

Aujourd'hui, un remote_id déjà existant ne suffit pas à raccrocher à un JDD existant.
Il faut aussi que le domaine ou le point de moissonnage soit le même.

Si l'identifiant remote_id est une URI, il est donc supposé unique au-delà de sa propre plateforme.
On devrait alors raccrocher le jeu de données à l'existant.

Exemple de duplicats alors que le remote_id est le même, mais les plateformes sont distinctes :

@maudetes maudetes converted this from a draft issue Nov 26, 2024
@maudetes maudetes added Moissonnage Indique que le sujet touche au moissonnage 💙 Back Les tickets de back labels Nov 26, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
💙 Back Les tickets de back Moissonnage Indique que le sujet touche au moissonnage
Projects
Status: 📝 Todo
Development

No branches or pull requests

1 participant