Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Liste des jeux de données tronquée lors de l'export csv d'un Topic #472

Open
Thesauruv opened this issue Nov 12, 2024 · 2 comments
Open
Assignees
Labels
bug Something isn't working upstream

Comments

@Thesauruv
Copy link

Lorsque j'exporte le csv des données exposées dans demo.ecologie.data.gouv, le fichier résultant présente un nombre de données inférieur à ce qui peut être attendu d'après le nombre de pages visibles et le nombre total de jeux de données affiché dans le dashboard :

  • A partir de l'export csv, on obtient 7801 datasets
  • demo.ecologie.data.gouv présente 476 pages de 21 datasets, soit 9996
  • le dashboard indique 21000+ datasets

image

image

@Thesauruv Thesauruv added the bug Something isn't working label Nov 12, 2024
@abulte abulte self-assigned this Nov 18, 2024
@abulte
Copy link

abulte commented Nov 19, 2024

Lié à #485, je l'attaque par là et quand ce sera réglé je ferai le point ici.

@abulte abulte changed the title Liste des jeux de données tronquée lors de l'export csv Liste des jeux de données tronquée lors de l'export csv d'un Topic Nov 19, 2024
@abulte
Copy link

abulte commented Nov 19, 2024

Testé et reproduit en prod

Le Topic contient 20k+ jeux de données. /datasets/search retourne 10k jeux de données (limite ES).

L'export CSV dispo sur https://www.data.gouv.fr/fr/datasets.csv?topic=65e9aa6cb5c809c30c70ee02 retourne 9280 jeux de données. La dernière ligne n'est pas tronquée.

Vu le code ici https://github.com/datagouv/udata-front/blob/0a9125b7c0b1b38b07771d682eb79e89be8aa8a5/udata_front/views/site.py#L120, on s'attend :

  • soit à un timeout parce que le catalogue est trop gros
  • soit à 20k+ jeux de données

@abulte abulte moved this to 💤 Blocked in Ecosphères Nov 19, 2024
@maudetes maudetes moved this to 📝 Todo in 🚀 Produit data.gouv.fr Nov 19, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working upstream
Projects
Status: 💤 Blocked
Development

No branches or pull requests

2 participants