Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Специалист по Data Science".
Название проекта | Описание | Используемые библиотеки | Статус |
---|---|---|---|
Исследование данных сервиса “Яндекс.Музыка” — сравнение пользователей двух городов | С помощью библиотеки Pandas и её возможностей проверить данные и сравнить поведение и предпочтения пользователей двух столиц — Москвы и Санкт-Петербурга | Pandas | Завершён |
Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | Pandas | Завершён |
Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Pandas, Matplotlib, Seaborn | Завершён |
Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Pandas, Matplotlib, NumPy, SciPy, Seaborn | Завершён |
Выявление закономерностей, определяющих успешность игры | Анализ открытых данных, и поиск потенциально популярного продукта, что позволит компании заказчику спланировать рекламные кампании | Pandas, Matplotlib, NumPy, SciPy, Seaborn | Завершён |
Рекомендация тарифов | Построить модель для задачи классификации, которая выберет подходящий тариф | Pandas, Matplotlib, Scikit-learn | Завершён |
Прогнозирование оттока клиента Банка | На основе данных из банка определить клиента, который может уйти | Pandas, Matplotlib, Scikit-learn | Завершён |
Определение прибыльного региона для нефтедобывающей компании | Поиск прибыльного нефтедобывающего региона с помощью моделирования машинного обучения | Pandas, Numpy, Seaborn, Scikit-learn, Bootstrap | Завершён |
Исследование технологического процесса очистки золота | С помощью машинного обучения спрогнозировать концентрацию золота при проведении процесса очистки золота | Pandas, Matplotlib, NumPy, Seaborn, Scikit-learn | Завершён |
Защита пользовательских данных | Разработка метода шифрования данных. Построение модели машинного обучения на шифрованных данных | Pandas, Numpy, Scikit-learn, Random | Завершён |
Определение стоимости автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания. Построить модель машинного обучения, используя модели Градиентного Бустинга для быстрого определения стоимости автомобиля | Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Matplotlib, Seaborn, Scipy | Завершён |
Прогноз заказов такси на следующий час | Построение системы прогноза количества заказов такси на следующий час | Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Seaborn, Statsmodels | Завершён |
Определение токсичных комментариев | Поиск токсичных комментариев и отправка их на модернизацию. Классификация комментариев на позитивные и негативные. | Pandas, Numpy, Seaborn, tf-idf, nltk, pipeline, LinearRegression, CatBoost, LightGBM | Завершён |
Прогнозирование оттока клиентов телеком | Построить модель, которая предсказывает, уйдёт ли пользователь. | pandas, matplotlib, seaborn, datetime, random, ProfileReport, phik, sklearn.metrics, lightgbm, catboost, RandomForestClassifier, LogisticRegression, Scikit-learn, Pipeline | Завершён |