Skip to content

Latest commit

 

History

History
21 lines (18 loc) · 9.69 KB

README.md

File metadata and controls

21 lines (18 loc) · 9.69 KB

Портфолио проектов Яндекс.Практикум "Специалист по Data Science"

Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Специалист по Data Science".

Название проекта Описание Используемые библиотеки Статус
Исследование данных сервиса “Яндекс.Музыка” — сравнение пользователей двух городов С помощью библиотеки Pandas и её возможностей проверить данные и сравнить поведение и предпочтения пользователей двух столиц — Москвы и Санкт-Петербурга Pandas Завершён
Исследование надёжности заёмщиков — анализ банковских данных На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок Pandas Завершён
Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир Pandas, Matplotlib, Seaborn Завершён
Определение выгодного тарифа для телеком компании На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа Pandas, Matplotlib, NumPy, SciPy, Seaborn Завершён
Выявление закономерностей, определяющих успешность игры Анализ открытых данных, и поиск потенциально популярного продукта, что позволит компании заказчику спланировать рекламные кампании Pandas, Matplotlib, NumPy, SciPy, Seaborn Завершён
Рекомендация тарифов Построить модель для задачи классификации, которая выберет подходящий тариф Pandas, Matplotlib, Scikit-learn Завершён
Прогнозирование оттока клиента Банка На основе данных из банка определить клиента, который может уйти Pandas, Matplotlib, Scikit-learn Завершён
Определение прибыльного региона для нефтедобывающей компании Поиск прибыльного нефтедобывающего региона с помощью моделирования машинного обучения Pandas, Numpy, Seaborn, Scikit-learn, Bootstrap Завершён
Исследование технологического процесса очистки золота С помощью машинного обучения спрогнозировать концентрацию золота при проведении процесса очистки золота Pandas, Matplotlib, NumPy, Seaborn, Scikit-learn Завершён
Защита пользовательских данных Разработка метода шифрования данных. Построение модели машинного обучения на шифрованных данных Pandas, Numpy, Scikit-learn, Random Завершён
Определение стоимости автомобиля Разработка системы рекомендации стоимости автомобиля на основе его описания. Построить модель машинного обучения, используя модели Градиентного Бустинга для быстрого определения стоимости автомобиля Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Matplotlib, Seaborn, Scipy Завершён
Прогноз заказов такси на следующий час Построение системы прогноза количества заказов такси на следующий час Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Seaborn, Statsmodels Завершён
Определение токсичных комментариев Поиск токсичных комментариев и отправка их на модернизацию. Классификация комментариев на позитивные и негативные. Pandas, Numpy, Seaborn, tf-idf, nltk, pipeline, LinearRegression, CatBoost, LightGBM Завершён
Прогнозирование оттока клиентов телеком Построить модель, которая предсказывает, уйдёт ли пользователь. pandas, matplotlib, seaborn, datetime, random, ProfileReport, phik, sklearn.metrics, lightgbm, catboost, RandomForestClassifier, LogisticRegression, Scikit-learn, Pipeline Завершён