Skip to content

Latest commit

 

History

History
205 lines (121 loc) · 7.82 KB

README.md

File metadata and controls

205 lines (121 loc) · 7.82 KB

Altervilles open data

💡 Le projet

Cet espace de travail collaboratif est alimenté par les étudiants du master Altervilles et Copter, dans le cadre du cours Ville numérique. Il a vocation à héberger des jeux de données constitués par les étudiants, ainsi que leur documentation associée.

Objectif : créer et mettre à disposition des jeux de données qui ne sont pas publiés par les collectivités territoriales stéphanoises.

🛠 Organisation

Deux rendus sont attendus pour chaque groupe

Comment organiser le travail ?

  1. Rendez-vous sur votre espace d'équipe
  2. Consultez les données sur lesquelles vous allez travailler
  3. Définissez vos rôles et répartissez vous les différentes tâches

🔎 Les données

Plusieurs jeux de données sont identifiés :

Délibérations de la Métropole de Saint-Etienne

Où se trouvent les données ?

Les délibérations se trouvent ici

👉 Une liste des délibérations existe, mais ce n'est pas un jeu de données exploitable.

Quel est le périmètre des données à constituer ?

Nous allons nous concentrer sur les délibérations de 2022 (soit 108 délibérations entre le 20-01-2022 et le 24-03-2022)

Où se trouve le modèle de fichier à créer ?

Le modèle de fichier à créer se trouve ici

Précisions sur le modèle de données

  • Le champ DELIB_MATIERE_CODEne peut pas être complété, car il n'est pas précisé dans les délibérations
  • Le champ DELIB_MATIERE_NOMest à interpréter, à partir de l'objet de la délibération et de cette nomenclature existante dans une autre administration. Exemple : COMMANDE PUBLIQUE
  • Le champ VOTE EFFECTIF = Nombre de membres en exercice
  • Le champ VOTE REEL= Nombre de présents
  • Si la délibération est adoptée à l'unanimité, alors VOTE POUR= Nombre de voix

Comment publier les données sur Github ?

👉 C'est ici

Marchés publics de la Métropole de Saint-Etienne

Où se trouvent les données ?

  1. Cherchez "Marchés publics Saint Etienne Métropole" dans Google
  2. Vous allez arriver sur une page qui vous permettra de faire une recherche avancée.
  3. Dans la recherche avancée, vous allez pouvoir sélectionner "Données essentielles".
  4. Cliquez sur rechercher
  5. Téléchargez les données de consultation

👉 C'est compliqué et le parcours pour accéder à la donnée n'est pas satisfaisant.

Indice C'est ici : https://www.saint-etienne-metropole.fr/etudier-entreprendre/entreprises/marches-publics

Que faire avec ces données ?

Les publier sur cet espace Github, au format CSV.

Pour convertir le fichier JSON récupéré en CSV, plusieurs outils existent, comme celui-ci

Comment publier les données sur Github ?

👉 C'est expliqué ici

Données sur les points d'intérêt du territoire

Ce sont les données géographiques sur les services et établissements du territoire. Elles se trouvent notamment sur OpenStreetMap, cartographie collaborative en ligne.

Quelles données publier ?

Nous allons nous concentrer sur trois jeux de données :

  1. Services publics
  2. Patrimoine historique
  3. Stationnement de vélo
  4. Commerces

Comment extraire les données ?

  1. Rendez-vous sur Géodatamine (outil qui extrait les données depuis OpenStreetMap)
  2. Sélectionner la donnée que vous recherchez
  3. Sélectionnez le territoire (Saint Etienne Métropole)
  4. Cliquez sur "télécharger"

Comment mettre en qualité les données ?

  1. Supprimer les colonnes les plus vides (lorsque moins de 10% des champs sont renseignés environ)
  2. Compléter certaines données quand c'est possible.

Détails :

Pour le jeu de données Services publics:

  • Compléter les noms des mairies et des établissements. Exemple : "Mairie de La Talaudière" au lieu de "Mairie".

Pour le jeu de données Patrimoine historique

  • Supprimer les rangs vides - pour lesquels il n'y a pas de nom

Pour le jeu de données Stationnement vélo

  • À priori il n'y a pas de mise en qualité à envisager (?)

Pour le jeu de données Commerces

  • C'est le jeu de données le plus complet
  • Vous pouvez supprimer les rangs vides (filtrer les données où le champ "name" est vide)
  • Enrchissez le jeu de données pour les commerces que vous connaissez (horaires, site web, contacts...)

Comment publier les données sur Github ?

👉 C'est expliqué ici


🔌 Publier les données sur Github

  1. Une fois votre CSV prêt, vous pourrez lui donner un nom (machin-truc-saint-etienne-metropole.csv)

  2. Et l'ajouter dans le dossier data

  3. Pour cela, cliquez à droite sur Add file / Upload files :

image

  1. C'est tout bon ! maintenant, ajoutez votre documentation dans le même dossier

📖 La documentation

En supplément du jeu de donnée constitué par votre groupe, vous produisez une courte documentation (l'équivalent d'une ou deux pages maximum).

Instructions pour la documentation :

  1. ⚠️ Elle est rédigée en Markdown, vous pouvez le faire directement dans Github
  2. Allez dans le dossier (data)
  3. Ajoutez un fichier :

image

  1. Il faut nommer votre fichier en .md (exemple documentation-marches-publics.md)
  2. Vous pouvez rédiger directement en langage Markdown : ici la documentation du langage Markdown
  3. Et cliquer sur "commit changes"

image


Votre documentation détaille :

Le jeu de donnée et l'objectif de sa publication

  • Quel est le jeu de données ?
  • Quelles données contient-il ? (expliquez comme vous le feriez à un lycéen)
  • Quel est le périmètre / l'étendue des données (géographique et ou temporel)
  • À quoi peuvent servir ces données ? (en trois lignes maximum)

Votre méthode

  • Quelle est la source des données ?
  • Quels outils avez-vous utilisé ?

Vos difficultés

  • Est-ce que la source des données vous a permis de constituer le jeu de données que vous souhaitiez ?
  • Est-ce que c'est incomplet ? Pourquoi / qu'est-ce qu'il vous a manqué ?
  • Autre chose ?

Conclusion libre

  • Quelque-chose vous semble important ou utile à ajouter ? 👉 N'hésitez pas à consulter le contenu des données en détail et proposer une courte analyse.

Critères d'évaluation - pour chaque groupe

Qualité des données (10 pts)

  • Un fichier CSV a été déposé sur Github - (2 pts)
  • Les données sont exploitables (la structure est respectée) - (2pts)
  • Même s'il peut manquer des données, vous avez fait votre possible pour constituer un fichier le plus complet et le plus correct possible - (6 pts)

Qualité de la documentation (7 pts)

  • Une documentation accompagne votre jeu de données (2 pts)
  • Vous avez détaillé correctement le contenu du fichier (2 pts)
  • Vous avez exposé vos difficultés et vos éléments de méthode (3 pts)

Organisation et méthode (3 pts)

  • Votre groupe a fourni les éléments dans le délai demmandé (1 pt)
  • Vous avez sollicité de l'aide si c'était nécessaire ! (2 pts)