Skip to content

Latest commit

 

History

History
25 lines (20 loc) · 776 Bytes

README.md

File metadata and controls

25 lines (20 loc) · 776 Bytes

Predykcji szans na przeżycie pasażera po katastrofie Titanica

Z użyciem Pythona, Pandasa, Matplotlib, Seaborn, SKlearn, XGBoosta

Jest to kopia notebook z mojego Kaggle'a https://www.kaggle.com/bimbus94/titanic-po-polsku

Stosowane rozwiązania:

  • Obróbka danych w Pandas'ie
  • Wizualizacja danych z wykorzystaniem Matplotlib i Seaborn
  • Różnorodne wykorzystanie Sklearn
  • Imputacja, normalizacja, skalowanie danych
  • Przegląd różnych modeli Machine Learningu
  • Feature Engineering
  • Heatmapy
  • Cross-Validation
  • Krzywe uczenia
  • Feature Importance
  • Modelowanie z użyciem XGBoosta
  • Próba tuningu/optymalizacji parametrów XGBoosta z GridSeachCV

Uzyskany wynik:

  • 0.7894 przy wyborze tylko 5 zmiennych
  • 0.76-0.77 przy wyborze większości zmiennych