- 用一个RELU作为中介,一个Linear Model的输出作为其输入,其输出作为另一个Linear Model的输入,使其能够解决非线性问题
- 神经网络并不一定要完全像神经元那样工作
- Chain Rule:复合函数求导规律
-
大量可重用的数据,易于实现(简单的数据流)
-
Back propagation
- 计算train_loss时,数据正向流入,计算梯度时,逆向计算
- 计算梯度需要的内存和计算时间是计算train_loss的两倍
-
利用上面的知识,结合lesson1中的SGD,训练一个全连接神经网络:神经网络实践
扩展阅读:西瓜书第五章·神经网络