Skip to content
View vik1109's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report vik1109

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
vik1109/README.md

Мои проекты:

Название Задача проекта Стек
Поиск топонимов в сообщениях Целью проекта является разработка решения для автоматического выделения топонимов (конкретно - названий городов и областей) в сообщениях, которые пишут участники сообщества.
Соавторы: https://github.com/Dehle
Ревьюер: https://github.com/PhySci
Статус проекта - В работе
Python, Pandas, Yargy-parser, argparse

Соревнования:

Название Описание Библиотеки
GlowByte Autumn Hack 2022 Задача - создать таблицы измерений, таблицы фактов и исторические витрины. Решение заняло 3-е место. pandas, SQL, SQLAlchemy
Heart-diseases-prediction (Kaggle) Построить модель машинного обучения, которая по табличным данным предсказывает вероятность наличия скрытых проблем у пациентов, проходящих регулярную диспансеризацию. Для определения качества работы модели использовалась метрика ROC-AUC. pandas, CatBoost, sklearn, mathplotlibpandas, CatBoost, sklearn, mathplotlib
Хакатон AGROHACK 2022 Рабочие ноутбуки и материалы с Хакатона AGROHACK 2022, кейс "Болезни коров", команда AGROTEAM pandas, CatBoost, sklearn, mathplotlib

Учебные проекты:

Название Задача проекта Стек
Прогнозирование оттока клиентов. (Kaggle based) Изучение моделей оттока клиентов. Построение модели с предельно большим значением F1-меры. pandas, DecisionTreeClassifier, RandomForestClassifier, LogisticRegression, GradientBoostingClassifier, sklearn
Учебный проект "Симулятор аналитика" от Karpov.Courses С нуля выстроить аналитические процессы в небольшом стартапе. Провести AB - тестирование с применением различных методов анализа (t-тест, Пуассоновский бутстреп, тест Манна-Уитни, t-тест на сглаженном ctr (α=5) а также t-тест и тест Манна-Уитни поверх бакетного преобразования, Linearization). Настройка системы сбора и отправки отчетов с использованием ETL-piplile на основе Airflow. Настройка системы Алертов для отслеживания аномалий в ключевых метриках с отправкой сообщений в Telegram Python (pandas, pandahouse, numpy, matplotlib, seaborn, telegram, scipy), ClickHouse, GitLab CI/CD, Superset, Airfl
Аллергия Необходимо выделить топонимы и классифицировать текст на предмет указывает ли пользователь в своем сообщении о наличии у него аллергии в активной фазе и/или наличии в воздухе аллергенов. Дополнительно из текста выделить упоминания про симптомы аллергии и принимаемые лекарства. На основании предсказаний построить карту аллергии в России. Python (Pandas, NumPy, CatBoost, Yargy, Sklearn)
Предсказание стоимости жилья В проекте необходимо обучить модель линейной регрессии на данных о жилье в Калифорнии в 1990 году. На основе данных нужно предсказать медианную стоимость дома в жилом массиве — median_house_value. Обучить модель и сделать предсказания на тестовой выборке. Для оценки качества модели использовать метрики RMSE, MAE и R2. Pandas, pyspark, , numpy, Seaborn, Matplotlib, pandas_profiling, scipy
Прогнозирование заказов такси В проекте необходимо спрогнозировать количество заказов такси на следующий час. Значение метрики RMSE на тестовой выборке должно быть не больше 48. Pandas, Matplotlib, statsmodels, sklearn, catboost, optuna
Предсказание риска ДТП Нужно создать систему, которая могла бы оценить риск ДТП по выбранному маршруту движения. Под риском понимается вероятность ДТП с любым повреждением транспортного средства. Как только водитель забронировал автомобиль, сел за руль и выбрал маршрут, система должна оценить уровень риска. Если уровень риска высок, водитель увидит предупреждение и рекомендации по маршруту. Pandas, Matplotlib, sqlalchemy, sklearn, catboost, optuna, lightGBM, numpy
Advanced SQL Научиться делать сложные SQL запросы с использованием оконных функций SQL

Моя статистика на LeetCode:

KnlnKS's LeetCode stats

Popular repositories Loading

  1. AgroTeam AgroTeam Public

    AgroHack 2022

    Jupyter Notebook 1 2

  2. GlowByte_autumn_hack_2022 GlowByte_autumn_hack_2022 Public

    My solution from GlowByte Automn Hackaton 2022

    Python 1

  3. Supervised-learning Supervised-learning Public

    Jupyter Notebook

  4. Heart-diseases-prediction Heart-diseases-prediction Public

    Jupiter notebook for Heart diseases prediction on Kaggle

    Jupyter Notebook

  5. vik1109 vik1109 Public

    Config files for my GitHub profile.

  6. Karpov-data-analyst-course Karpov-data-analyst-course Public

    Tasks solved within the course "Analyst Simulator" from Karpov.Courses

    Jupyter Notebook