Skip to content

Latest commit

 

History

History
18 lines (12 loc) · 2.17 KB

README.md

File metadata and controls

18 lines (12 loc) · 2.17 KB

Finding the reach of a post

Задача была решена в рамках 24 часового хакатона.

Задача: Необходимо спрогнозировать потенциальный охват (количество просмотров) публикаций в двух-трех соцсетях, опираясь на собранную статистику (данные предоставляются) и используя машинное обучение.

В качестве формулы охвaта используется следующее выражение:

Основой модели был выбран Берт, выдававший вектроное представление предложения.

image

На этой основе была располжена лстм, которая в зависимости от подаваемого токена дня недели возвращала выход и полученное скрытое представление.

image

Последним уровнем модели были обычные полносвязные линейные слои с активацией ReLU и Dropout.

Исходные данные были проанализированны, почищенны от неинформативных примеров, отнормированны и разелены на train/test. Более подробно можно увидеть в ноутбуке.

Абсолютная разница между спрогнозируемым охватом и реальным на валидационной выборке составила 0.0025