GitHub - keep-steady/HAN_IMDB

HAN은 구조도 더 복잡하고, ATTENTION 까지사용, 그리고 GLOVE를 이용해 단어임베딩도 사용했는데도 95 그냥 LSTM은 임베딩부터 학습하고 ATTENTION도 안썼는데, 그냥 문단을 LSTM 사용하니 성능이 99

같은 데이타인데 왜그럴까?

HAN

data 폴더에 labeledTrainData.tsv 필요
- wget https://www.kaggle.com/c/word2vec-nlp-tutorial/download/labeledTrainData.tsv
- 이름바꾸고 unzip
glove 폴더에 glove.6B.100d or glove.6B.200d, (단어, 임베딩)쌍으로
- http://nlp.stanford.edu/data/glove.6B.zip

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
data		data
.gitignore		.gitignore
IMDB_LSTM_99.97acc.ipynb		IMDB_LSTM_99.97acc.ipynb
IMDB_LSTM_HAN_complete_94.73.ipynb		IMDB_LSTM_HAN_complete_94.73.ipynb
README.md		README.md

Provide feedback