Skip to content

Latest commit

 

History

History
34 lines (20 loc) · 2.9 KB

File metadata and controls

34 lines (20 loc) · 2.9 KB

Python : Le nettoyage des données

Ce dossier Repository est lié au cours Python : Le nettoyage des données. Le cours entier est disponible sur LinkedIn Learning.

Nom final de la formation

Ce cours est intégré à GitHub Codespaces, un environnement de développement instantané « dans le nuage » qui offre toutes les fonctionnalités de votre IDE préféré sans nécessiter de configuration sur une machine locale. Avec Codespaces, vous pouvez vous exercer à partir de n'importe quelle machine, à tout moment, tout en utilisant un outil que vous êtes susceptible de rencontrer sur votre lieu de travail. Consultez la vidéo "Utilisation de Codespaces GitHub dans le cadre de ce cours" pour savoir comment démarrer.

Dans cette formation, Omar Souissi vous initie au nettoyage des données avec Python, une tâche essentielle en science des données. Vous apprendrez à identifier et à corriger les erreurs, les doublons, les valeurs manquantes et aberrantes. Vous découvrirez comment utiliser l'imputation, normaliser les données et automatiser le processus via des pipelines. Les erreurs humaines, de machines ou de conception seront analysées, afin de vous aider à comprendre les causes profondes des données de mauvaise qualité. Enfin, vous aborderez l’utilisation des expressions régulières et vous créerez des fonctions réutilisables pour simplifier vos tâches de nettoyage.

Instructions

Ce dossier Repository a des branches pour chacune des vidéos du cours. Vous pouvez utiliser le menu des Branches sur GitHub afin d’accéder aux passages qui vous intéressent. Vous pouvez également rajouter /tree/BRANCH_NAME à l’URL afin d’accéder à la branche qui vous intéresse.

Branches

Les branches sont structurées de manière à correspondre aux vidéos du cours. La convention de nommage est : CHAPITRE#_VIDEO#. Par exemple, la branche nommée02_03 correspond au second chapitre, et à la troisième vidéo de ce chapitre. Certaines branches ont un état de départ et de fin.
La branche 02_03_d correspond au code du début de la vidéo.
La branche 02_03_f correspond au code à la fin de la vidéo.
La branche master correspond au code à la fin de la formation.

Formateur

Omar Souissi

Retrouvez mes autres formations sur LinkedIn Learning.