- 👋 Привет, я Морозов Виктор
- 👀 Сейчас я учусь в yandex.practicum по специализации DS+.
- 📫 Вы можете связаться со мной https://www.linkedin.com/in/victor-morozov-724351a5/
Название | Задача проекта | Стек |
---|---|---|
Поиск топонимов в сообщениях | Целью проекта является разработка решения для автоматического выделения топонимов (конкретно - названий городов и областей) в сообщениях, которые пишут участники сообщества. Соавторы: https://github.com/Dehle Ревьюер: https://github.com/PhySci Статус проекта - В работе |
Python, Pandas, Yargy-parser, argparse |
Название | Описание | Библиотеки |
---|---|---|
GlowByte Autumn Hack 2022 | Задача - создать таблицы измерений, таблицы фактов и исторические витрины. Решение заняло 3-е место. | pandas, SQL, SQLAlchemy |
Heart-diseases-prediction (Kaggle) | Построить модель машинного обучения, которая по табличным данным предсказывает вероятность наличия скрытых проблем у пациентов, проходящих регулярную диспансеризацию. Для определения качества работы модели использовалась метрика ROC-AUC. | pandas, CatBoost, sklearn, mathplotlibpandas, CatBoost, sklearn, mathplotlib |
Хакатон AGROHACK 2022 | Рабочие ноутбуки и материалы с Хакатона AGROHACK 2022, кейс "Болезни коров", команда AGROTEAM | pandas, CatBoost, sklearn, mathplotlib |
Название | Задача проекта | Стек |
---|---|---|
Прогнозирование оттока клиентов. (Kaggle based) | Изучение моделей оттока клиентов. Построение модели с предельно большим значением F1-меры. | pandas, DecisionTreeClassifier, RandomForestClassifier, LogisticRegression, GradientBoostingClassifier, sklearn |
Учебный проект "Симулятор аналитика" от Karpov.Courses | С нуля выстроить аналитические процессы в небольшом стартапе. Провести AB - тестирование с применением различных методов анализа (t-тест, Пуассоновский бутстреп, тест Манна-Уитни, t-тест на сглаженном ctr (α=5 ) а также t-тест и тест Манна-Уитни поверх бакетного преобразования, Linearization). Настройка системы сбора и отправки отчетов с использованием ETL-piplile на основе Airflow. Настройка системы Алертов для отслеживания аномалий в ключевых метриках с отправкой сообщений в Telegram |
Python (pandas, pandahouse, numpy, matplotlib, seaborn, telegram, scipy), ClickHouse, GitLab CI/CD, Superset, Airfl |
Аллергия | Необходимо выделить топонимы и классифицировать текст на предмет указывает ли пользователь в своем сообщении о наличии у него аллергии в активной фазе и/или наличии в воздухе аллергенов. Дополнительно из текста выделить упоминания про симптомы аллергии и принимаемые лекарства. На основании предсказаний построить карту аллергии в России. | Python (Pandas, NumPy, CatBoost, Yargy, Sklearn) |
Предсказание стоимости жилья | В проекте необходимо обучить модель линейной регрессии на данных о жилье в Калифорнии в 1990 году. На основе данных нужно предсказать медианную стоимость дома в жилом массиве — median_house_value. Обучить модель и сделать предсказания на тестовой выборке. Для оценки качества модели использовать метрики RMSE, MAE и R2. | Pandas, pyspark, , numpy, Seaborn, Matplotlib, pandas_profiling, scipy |
Прогнозирование заказов такси | В проекте необходимо спрогнозировать количество заказов такси на следующий час. Значение метрики RMSE на тестовой выборке должно быть не больше 48. | Pandas, Matplotlib, statsmodels, sklearn, catboost, optuna |
Предсказание риска ДТП | Нужно создать систему, которая могла бы оценить риск ДТП по выбранному маршруту движения. Под риском понимается вероятность ДТП с любым повреждением транспортного средства. Как только водитель забронировал автомобиль, сел за руль и выбрал маршрут, система должна оценить уровень риска. Если уровень риска высок, водитель увидит предупреждение и рекомендации по маршруту. | Pandas, Matplotlib, sqlalchemy, sklearn, catboost, optuna, lightGBM, numpy |
Advanced SQL | Научиться делать сложные SQL запросы с использованием оконных функций | SQL |