Козынченко Вячеслав 411 группа 2022 год
Первая реализация парсера фандомной википедии(poor code)
Улучшенная реализация парсера. Добавлен парсинг полей страниц(Имя, Фамилия, Семья, ...)
Модель машинного обучения TF-IDF, Logistic Regression для классификации страниц на страницы персонажей/не персонажей.
Модель машинного обучения(TF-IDF, Logistic Regression) с предобученными word2vec векторами с rusvectores
Схема данных для последующей индексации в Solr ядре
Улучшенная схема данных. Добавлены русские и английские синонимы, а также настройка стопслов для русского языка
Первая попытка создания Solr ядра с плохо спаршенными данными
Ядро Solr, предназначенное для работы с улучшенной схемой данных