Ce dossier Repository est lié au cours Python : Le nettoyage des données
. Le cours entier est disponible sur LinkedIn Learning.
Ce cours est intégré à GitHub Codespaces, un environnement de développement instantané « dans le nuage » qui offre toutes les fonctionnalités de votre IDE préféré sans nécessiter de configuration sur une machine locale. Avec Codespaces, vous pouvez vous exercer à partir de n'importe quelle machine, à tout moment, tout en utilisant un outil que vous êtes susceptible de rencontrer sur votre lieu de travail. Consultez la vidéo "Utilisation de Codespaces GitHub dans le cadre de ce cours" pour savoir comment démarrer.
Dans cette formation, Omar Souissi vous initie au nettoyage des données avec Python, une tâche essentielle en science des données. Vous apprendrez à identifier et à corriger les erreurs, les doublons, les valeurs manquantes et aberrantes. Vous découvrirez comment utiliser l'imputation, normaliser les données et automatiser le processus via des pipelines. Les erreurs humaines, de machines ou de conception seront analysées, afin de vous aider à comprendre les causes profondes des données de mauvaise qualité. Enfin, vous aborderez l’utilisation des expressions régulières et vous créerez des fonctions réutilisables pour simplifier vos tâches de nettoyage.
Ce dossier Repository a des branches pour chacune des vidéos du cours. Vous pouvez utiliser le menu des Branches sur GitHub afin d’accéder aux passages qui vous intéressent. Vous pouvez également rajouter /tree/BRANCH_NAME
à l’URL afin d’accéder à la branche qui vous intéresse.
Les branches sont structurées de manière à correspondre aux vidéos du cours. La convention de nommage est : CHAPITRE#_VIDEO#
. Par exemple, la branche nommée02_03
correspond au second chapitre, et à la troisième vidéo de ce chapitre. Certaines branches ont un état de départ et de fin.
La branche 02_03_d
correspond au code du début de la vidéo.
La branche 02_03_f
correspond au code à la fin de la vidéo.
La branche master correspond au code à la fin de la formation.
Omar Souissi
Retrouvez mes autres formations sur LinkedIn Learning.