Skip to content

Latest commit

 

History

History
37 lines (29 loc) · 2.6 KB

README.md

File metadata and controls

37 lines (29 loc) · 2.6 KB

NLP Review & Tutorial

NLP 실습용 GitHub Repository 입니다.

Blog: velog, GitHub Blog

Huggingface Usage

Tutorial

Transformers Tutorial의 내용을 한국어 데이터셋을 이용해 공부할 수 있도록 새롭게 구성하여 만들었습니다.

Data Preprocessing

  • Tokenization: NLTK, spaCy, torchtext 라이브러리를 활용해 토큰화를 수행합니다.
  • Vocab: spaCy, torchtext를 활용해 Vocab을 만듭니다.
  • Dataset & DataLoader: NLP Task를 위한 Dataset, DataLoader을 만듭니다.

Model