Skip to content

Stuksus/Hackaton_SBER

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

68 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GSB Data Science Practice

Условия:

  • Задача: Предсказать вероятность дефолта(PD) команий
  • Данные: 32 395 объектов предоставлющие информацию о компаниях
  • Целевая метрика: Accuracy
  • Вспомогательная метрика: ROC-AUC

Видео презентация и защиты решения:

video_presentation.mov

Последовательность работы с данными:

  • Анализ данных
  • Создание признаков, основываясь на анализе предметной области
  • WOE-binning
  • Pipeline содержащий в себе:
    • SMOTE
    • StantardScaler
    • Logistic regression
  • Интерпретация модели:
    • PDP-plots
    • Benefit-curve
    • Скоринговая карта
  • Рекомендации:
    • Предложена метрика для оценивания модели после ее интеграции

Результаты:

  • Accuracy: 0.65
  • ROC-AUC: 0.69
  • ROC-curve:
    • ROC
  • Benefit-curve:
    • image

Библиотеки использованные в работе:

  • pandas
  • numpy
  • matplotlib
  • sklearn
  • scipy
  • pdpbox
  • mlxtend

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published