- Python 3.7
- PaddlePaddle 每日版本
- CUDA 10.1
- cuDNN 7.5
- NCCL 2.4.8
- 所有模型均在COCO17数据集中训练和测试。
- 除非特殊说明,所有ResNet骨干网络采用ResNet-B结构。
- 推理时间(fps): 推理时间是在一张Tesla V100的GPU上通过'tools/eval.py'测试所有验证集得到,单位是fps(图片数/秒), cuDNN版本是7.5,包括数据加载、网络前向执行和后处理, batch size是1。
- 我们采用和Detectron相同的训练策略。
- 1x 策略表示:在总batch size为8时,初始学习率为0.01,在8 epoch和11 epoch后学习率分别下降10倍,最终训练12 epoch。
- 2x 策略为1x策略的两倍,同时学习率调整位置也为1x的两倍。
Paddle提供基于ImageNet的骨架网络预训练模型。所有预训练模型均通过标准的Imagenet-1k数据集训练得到,ResNet和MobileNet等是采用余弦学习率调整策略或SSLD知识蒸馏训练得到的高精度预训练模型,可在PaddleClas查看模型细节。
请参考Faster R-CNN
请参考Mask R-CNN
请参考YOLOv3
请参考SSD
请参考FCOS
请参考SOLOv2
请参考PP-YOLO
请参考TTFNet
请参考HRNets
请参考Res2Net
请参考GFL
请参考PicoDet
请参考PP-YOLOE
请参考YOLOX
请参考YOLOv5
请参考YOLOv6
请参考YOLOv7
请参考PP-TinyPose
请参考HRNet
请参考HigherHRNet
请参考DeepSORT
请参考JDE
请参考FairMOT
请参考ByteTrack