Данный проект представляет собой модель прогнозирования заработной платы на основе навыков и других факторов, используя алгоритм CatBoost. Модель обучена на датасете, содержащем информацию о заработной плате, опыте работы, типе занятости, регионе и других признаках.
catboost_info/
: Директория с информацией о модели CatBoost.images/
: Директория с изображениями, созданными в процессе анализа данных.catboost_model.cbm
: Файл, содержащий обученную модель CatBoost.catboost_model_params.txt
: Файл с параметрами модели CatBoost.column_names.txt
: Файл со списком названий колонок из датасета.inference.py
: Файл с кодом для выполнения инференса (прогнозирования) на основе модели.requirements.txt
: Файл с перечисленными зависимостями и их версиями, необходимыми для запуска проекта.research.ipynb
: Jupyter Notebook с исследовательским анализом данных, обучением модели и оценкой результатов.
-
Установите необходимые зависимости из файла
requirements.txt
с помощью команды:pip install -r requirements.txt
-
Запустите Jupyter Notebook
research.ipynb
, чтобы ознакомиться с исследовательским анализом данных, обучением модели и оценкой результатов. -
Используйте файл
inference.py
, чтобы выполнить инференс (прогнозирование) на основе обученной модели. Измените переменные в коде для задания значений переменных и навыков. Запустите скрипт с помощью команды:python inference.py
- Проверьте пути к модели и файлам данных, чтобы они соответствовали структуре вашей директории.