Refactored CrossEncoder into our own wrapper class to support head training #88

Dmitryv-2024 · 2024-12-29T08:29:22Z

Сейчас в качестве классификатора используем LogisticRegressionCV из sklearn (как раньше). Можно сделать несколько улучшений:

LogisticRegressionCV поддерживает class_weight="balanced". Может стоит убрать balance_factor из construct_samples и положится на реализацию sklearn для сильно разбалансированных меток?
Можно реализовать тренировку своего классификатора. Например: сделать два полносвязных слоя и использовать label smoothing + kl_div loss function (идея из кода к статье DNCC, но у них в классификаторе был один слой, поэтому предлагаю попробовать два слоя, т.к. не уверен что имеет смысл что-то делать с одним слоем, вряд-ли будет лучше логистической регрессии)

В классе Dataset добавил ключ - не разбивать train (по умолчанию делим на два как и раньше), т.к. для тестов нужно чуть больше данных.

…aining

Samoed · 2024-12-29T09:44:53Z

А почему у нас тут используется предсказания из CrossEncoder, а не промто эмбеды? Кажется что делать классификацию на предсказаниях кросс энкодера так себе

Dmitryv-2024 · 2024-12-29T10:21:41Z

А почему у нас тут используется предсказания из CrossEncoder, а не промто эмбеды? Кажется что делать классификацию на предсказаниях кросс энкодера так себе

Реализованы два режима:

простая обертка над CrossEncoder - используем предсказания кросс энкодера
С тренировкой классификатора - используем эмбединги из кроссэнкодера (hook установлен на слой классификатора в метод _classifier_hook) и тренируем логистическую регрессию.

Samoed · 2024-12-29T10:43:16Z

Я говорю про то чтобы не использовать _classifier_hook можно просто сделать SentenceTranformer, а не CrossEncoder

Dmitryv-2024 · 2024-12-29T17:43:49Z

Я говорю про то чтобы не использовать _classifier_hook можно просто сделать SentenceTranformer, а не CrossEncoder

Нам нужно проверять сходство двух предложений. CrossEncoder как раз на это и натренирован, т.е. ожидаем, что его эмбединги хороши для нашей задачи. Есть гипотеза, что спомощью тренировки только головы, мы можем получить дешевый finetuning.

Refactored CrossEncoder into our own wrapper class to support head tr…

ddf0345

…aining

Dmitryv-2024 requested a review from voorhs December 29, 2024 08:29

Dmitryv-2024 added 2 commits December 29, 2024 12:31

Fix typo in comment

0e93c26

Merge branch 'dev' into feat/cross_encoder_refactor

4c86e30

Dmitryv-2024 added 5 commits December 29, 2024 23:23

fixing tests

5c07205

Fixing mypy errors

f86390b

Fixing doc build

2aac121

Still fixing doc build

9c02bb4

Keep fixing doc build

78c306f

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Refactored CrossEncoder into our own wrapper class to support head training #88

Refactored CrossEncoder into our own wrapper class to support head training #88

Dmitryv-2024 commented Dec 29, 2024

Samoed commented Dec 29, 2024

Dmitryv-2024 commented Dec 29, 2024

Samoed commented Dec 29, 2024 •

edited

Loading

Dmitryv-2024 commented Dec 29, 2024

Refactored CrossEncoder into our own wrapper class to support head training #88

Are you sure you want to change the base?

Refactored CrossEncoder into our own wrapper class to support head training #88

Conversation

Dmitryv-2024 commented Dec 29, 2024

Samoed commented Dec 29, 2024

Dmitryv-2024 commented Dec 29, 2024

Samoed commented Dec 29, 2024 • edited Loading

Dmitryv-2024 commented Dec 29, 2024

Samoed commented Dec 29, 2024 •

edited

Loading