基本要求:
(1)修改现有的CNN架构(如AlexNet, ResNet-18) 用于鸟类识别,通过将其输出层大小设置为200以适应数据集中的类别数量,其余层使用在ImageNet上预训练得到的网络参数进行初始化;
(2)在[CUB-200 2011]数据集上从零开始训练新的输出层,并对其余参数使用较小的学习率进行微调;
(3)观察不同的超参数,如训练步数、学习率,及其不同组合带来的影响,并尽可能提升模型性能;
(4)与仅使用CUB-200-2011数据集从随机初始化的网络参数开始训练得到的结果进行对比,观察预训练带来的提升。