- Задача: Предсказать вероятность дефолта(PD) команий
- Данные: 32 395 объектов предоставлющие информацию о компаниях
- Целевая метрика: Accuracy
- Вспомогательная метрика: ROC-AUC
video_presentation.mov
- Анализ данных
- Создание признаков, основываясь на анализе предметной области
- WOE-binning
- Pipeline содержащий в себе:
- SMOTE
- StantardScaler
- Logistic regression
- Интерпретация модели:
- PDP-plots
- Benefit-curve
- Скоринговая карта
- Рекомендации:
- Предложена метрика для оценивания модели после ее интеграции
- pandas
- numpy
- matplotlib
- sklearn
- scipy
- pdpbox
- mlxtend