Skip to content

Latest commit

 

History

History
executable file
·
135 lines (117 loc) · 4.86 KB

Assignmnet.md

File metadata and controls

executable file
·
135 lines (117 loc) · 4.86 KB

深度学习之自然语言处理斯坦福大学CS224n课程集训营作业

环境要求 Requirements

  • Python 2.7
  • TensorFlow r1.2

作业和比赛提交要求:

  • 运行截图
  • 源代码
  • 比赛排名(比赛)

本部分内容主要是python徒手实现基础算法和NLP应用初步

Assignment #1.1

1.1 Softmax 分类算法

Assignment #1.2

1.2 Neural Network Basics 神经网络基础实现

Assignment #1.3

1.3 word2vec 词向量 q3_word_vectors

Assignment #1.4

  1. Sentiment Analysis 情绪分析 q4_reg_v_acc q4_dev_conf

本部分内容开始使用tensorflow框架进行NLP问题处理

  1. Tensorflow Softmax 基于Tensorflow的softmax分类
  2. Neural Transition-Based Dependency Parsing 基于神经网络的依赖解析
    运行效果:
924/924 [==============================] - 49s - train loss: 0.0631    
Evaluating on dev set - dev UAS: 88.54
New best dev UAS! Saving model in ./data/weights/parser.weights
================================================================================
TESTING
================================================================================
Restoring the best model weights found on the dev set
Final evaluation on test set - test UAS: 88.92
Writing predictions
Done!
  1. Recurrent Neural Networks: Language Modeling 基于RNN的语言模型
    运行效果: unrolled_rnn

本部分作业主要是一些NLP典型问题的处理

Assignment #3

  1. window into named entity recognition(NER)基于窗口模式的名称识别
    运行效果:
DEBUG:Token-level confusion matrix:
go\gu   PER     ORG     LOC     MISC    O    
PER     2968    26      84      16      55   
ORG     147     1621    131     65      128  
LOC     48      88      1896    26      36   
MISC    37      40      54      1030    107  
O       42      46      18      39      42614
DEBUG:Token-level scores:
label   acc     prec    rec     f1   
PER     0.99    0.92    0.94    0.93 
ORG     0.99    0.89    0.77    0.83 
LOC     0.99    0.87    0.91    0.89 
MISC    0.99    0.88    0.81    0.84 
O       0.99    0.99    1.00    0.99 
micro   0.99    0.98    0.98    0.98 
macro   0.99    0.91    0.89    0.90 
not-O   0.99    0.89    0.87    0.88 
INFO:Entity level P/R/F1: 0.82/0.85/0.84
  1. Recurrent neural nets for named entity recognition(NER) 基于RNN的名称识别
    运行效果:
DEBUG:Token-level confusion matrix:
go\gu   PER     ORG     LOC     MISC    O    
PER     2987    32      47      12      71   
ORG     136     1684    90      70      112  
LOC     39      83      1907    21      44   
MISC    43      45      47      1031    102  
O       36      56      15      34      42618
DEBUG:Token-level scores:
label   acc     prec    rec     f1   
PER     0.99    0.92    0.95    0.93 
ORG     0.99    0.89    0.80    0.84 
LOC     0.99    0.91    0.91    0.91 
MISC    0.99    0.88    0.81    0.85 
O       0.99    0.99    1.00    0.99 
micro   0.99    0.98    0.98    0.98 
macro   0.99    0.92    0.89    0.91 
not-O   0.99    0.90    0.88    0.89 
INFO:Entity level P/R/F1: 0.85/0.86/0.85
  1. Grooving with GRUs((NER)基于GRU的名称识别:
    运行效果:

q3-noclip-rnn q3-clip-rnn q3-noclip-gru q3-clip-gru

DEBUG:Token-level confusion matrix:
go\gu	PER  	ORG  	LOC  	MISC 	O    
PER  	2920 	41   	57   	12   	119  
ORG  	101  	1716 	73   	64   	138  
LOC  	22   	95   	1908 	16   	53   
MISC 	37   	45   	53   	1017 	116  
O    	21   	67   	14   	39   	42618

DEBUG:Token-level scores:
label	acc  	prec 	rec  	f1   
PER  	0.99 	0.94 	0.93 	0.93 
ORG  	0.99 	0.87 	0.82 	0.85 
LOC  	0.99 	0.91 	0.91 	0.91 
MISC 	0.99 	0.89 	0.80 	0.84 
O    	0.99 	0.99 	1.00 	0.99 
micro	0.99 	0.98 	0.98 	0.98 
macro	0.99 	0.92 	0.89 	0.90 
not-O	0.99 	0.91 	0.88 	0.89 

INFO:Entity level P/R/F1: 0.86/0.85/0.85
  1. Easter Egg Hunt! 彩蛋一枚!!
    • Run python q3_gru.py dynamics to unfold your candy eggs

作业参考答案 References