Airbnb Berlin Price Prediction

Objectif du projet :

Le marché des locations court-terme est en forte expansion dans les villes touristiques, et à Berlin y compris. L'objectif de cette étude est d'estimer notre capacité à prédire le prix d'une location en fonction des différentes caractéristiques d'une annonce sur la plateforme Airbnb. Ce problème est tiré d'un challenge disponible à ce lien.

Présentation de l'approche :

La résolution de ce problème s'est faite en 3 temps :

Analyse des données
Preprocessing des données
Entrainement et évaluation de différents modèles de régression

Finalement, nous calculons l'erreur RMSE et le coefficient R2 sur notre set de données test pour les deux modèles les plus performants.

Structure des fichiers :

Analyse des données :

Les statistiques des différentes features et une heatmap de corrélation sont crées par le script stats.py.

Preprocessing :

Le preprocessing modulable de la donnée se trouve dans le script preprocessing_wrapper.py.

Les différents outils de preprocessing (PCA, scaling) ou encore la cross-validation qui sera utilisée pour évaluer les différents modèles se trouvent dans le dossier Preprocessing.

Evaluation des différents modèles :

Les différents modèles évalués sont les suivants :

La régression linéaire (Reg.py)
Les k plus proches voisins (kNN.py)
L'arbre de décision (Decision_Tree.py)
La forêt aléatoire (Random_Forest.py)
Le AdaBoost (AdaBoost.py)
Le xgBoost (xgBoost.py)

Chaque script justifie le choix des hyperparamètres et indique les mesures de performance moyennées (en utilisant la cross-validation).

Conclusion

Pour prédire les valeurs de prix du file de test stratifié il faut exécuter le fichier Best_Models.py avec la commande python3 Best_Models.py.

Ce fichier affiche le R2 et RMSE pour les deux modèles les plus performants : le XGBoost et le Random Forest.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Airbnb Berlin Price Prediction

Objectif du projet :

Présentation de l'approche :

Structure des fichiers :

Analyse des données :

Preprocessing :

Evaluation des différents modèles :

Conclusion

Files

README.md

Latest commit

History

README.md

File metadata and controls

Airbnb Berlin Price Prediction

Objectif du projet :

Présentation de l'approche :

Structure des fichiers :

Analyse des données :

Preprocessing :

Evaluation des différents modèles :

Conclusion