C2W3 超参数调整、批量标准化、编程框架

测验

1、如果在大量的超参数中搜索最佳的参数值，那么应该尝试在网格中搜索而不是使用随机值，以便更系统的搜索，而不是依靠运气，请问这句话是正确的吗？

2、每个超参数如果设置得不好，都会对训练产生巨大的负面影响，因此所有的超参数对于调优都同样重要，请问这是正确的吗？

错误

如学习率，会比其他参数更重要。

3、在超参数搜索过程中，你尝试只照顾一个模型（使用熊猫策略）还是一起训练大量的模型（鱼子酱策略）在很大程度上取决于：

4、如果您认为β（动量超参数）介于0.9和0.99之间，那么推荐采用以下哪一种方法来对β值进行取样？

A.

  r = np.random.rand()
  beta = r*0.09 + 0.9

B.

  r = np.random.rand()
  beta = 1-10**(- r - 1)

    r在0-1之间
    当r=0时，β=0.9; 当r=1时，β=0.99。

C.

  r = np.random.rand()
  beta = 1-10**(- r + 1)

D.

  r = np.random.rand()
  beta = r*0.9 + 0.09

5、找到好的超参数的值是非常耗时的，所以通常情况下你应该在项目开始时做一次，并尝试找到非常好的超参数，这样你就不必再次重新调整它们。请问这正确吗？

6、在视频中介绍的批量标准化中，如果将其应用于神经网络的第l层，那么需要标准化什么？

7、在标准化公式中，为什么要使用epsilon（ϵ）？

8、批处理标准化中关于 γ 和 β 的以下哪些陈述是正确的？

9、训练具有BN(批量标准化)的神经网络之后，测试时间，在新样本上评估神经网络时，你应该：

10、关于深度学习编程框架的这些陈述中，哪一个是正确的？