Skip to content

Latest commit

 

History

History

syntax

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

NLP (Natural Language Processing)

Структура репозитория

Где Что Описание
lemmatize/ Лемматизация Приведение к начальной форме
stemmer/ Стемминг Нахождение основы слова
tagger/ Токенизация Теггинг

Ресурсы

Нужно? Что Ссылка
Модели и корпуса русских слов RusVectores
Токенизатор, тэгер, лемматизатор UDPipe, Скачать, Скачать, Скачать
Корпус лемматизированных (морфологически нормализованных) текстов российских СМИ GitHub

Источники

Документация

Принцип

Реализация

Ключевые фразы (поисковики)

  • RusVectores Word2Vec
  • NLTK tagger
  • pymorphy2 мама мыла раму
  • векторизация текста
  • нормализация текста
  • word2vec python examples
  • word2vec классификация