简体中文 | English
-
特色模型
- PP-YOLOE+:
- 发布PP-YOLOE+模型,COCO test2017数据集精度提升0.7%-2.4% mAP,模型训练收敛速度提升3.75倍,端到端预测速度提升1.73-2.3倍
- 发布智慧农业,夜间安防检测,工业质检场景预训练模型,精度提升1.3%-8.1% mAP
- 支持分布式训练、在线量化、serving部署等10大高性能训练部署能力,新增C++/Python Serving、TRT原生推理、ONNX Runtime等5+部署demo教程
- PP-PicoDet:
- 发布PicoDet-NPU模型,支持模型全量化部署
- 新增PicoDet版面分析模型,基于FGD蒸馏算法精度提升0.5% mAP
- PP-TinyPose
- 发布PP-TinyPose增强版,在健身、舞蹈等场景的业务数据集端到端AP提升9.1% AP
- 覆盖侧身、卧躺、跳跃、高抬腿等非常规动作
- 新增滤波稳定模块,关键点稳定性显著增强
- PP-YOLOE+:
-
场景能力
- PP-Human v2
- 发布PP-Human v2,支持四大产业特色功能:多方案行为识别案例库、人体属性识别、人流检测与轨迹留存以及高精度跨镜跟踪
- 底层算法能力升级,行人检测精度提升1.5% mAP;行人跟踪精度提升10.2% MOTA,轻量级模型速度提升34%;属性识别精度提升0.6% ma,轻量级模型速度提升62.5%
- 提供全流程教程,覆盖数据采集标注,模型训练优化和预测部署,及pipeline中后处理代码修改
- 新增在线视频流输入支持
- 易用性提升,一行代码执行功能,执行流程判断、模型下载背后自动完成。
- PP-Vehicle
- 全新发布PP-Vehicle,支持四大交通场景核心功能:车牌识别、属性识别、车流量统计、违章检测
- 车牌识别支持基于PP-OCR v3的轻量级车牌识别模型
- 车辆属性识别支持基于PP-LCNet多标签分类模型
- 兼容图片、视频、在线视频流等各类数据输入格式
- 易用性提升,一行代码执行功能,执行流程判断、模型下载背后自动完成。
- PP-Human v2
-
前沿算法
- YOLO家族全系列模型
- 发布YOLO家族全系列模型,覆盖前沿检测算法YOLOv5、MT-YOLOv6及YOLOv7
- 基于ConvNext骨干网络,YOLO各算法训练周期缩5-8倍,精度普遍提升1%-5% mAP;使用模型压缩策略实现精度无损的同时速度提升30%以上
- 新增基于ViT骨干网络高精度检测模型,COCO数据集精度达到55.7% mAP
- 新增OC-SORT多目标跟踪模型
- 新增ConvNeXt骨干网络
- YOLO家族全系列模型
-
产业实践范例教程
- 基于PP-TinyPose增强版的智能健身动作识别
- 基于PP-Human的打架识别
- 基于PP-Human的营业厅来客分析
- 基于PP-Vehicle的车辆结构化分析
- 基于PP-YOLOE+的PCB电路板缺陷检测
-
框架能力
- 功能新增
- 新增自动压缩工具支持并提供demo,PP-YOLOE l版本精度损失0.3% mAP,V100速度提升13%
- 新增PaddleServing python/C++和ONNXRuntime部署demo
- 新增PP-YOLOE 端到端TensorRT部署demo
- 新增FGC蒸馏算法,RetinaNet精度提升3.3%
- 新增分布式训练文档
- 功能完善/Bug修复
- 修复Windows c++部署编译问题
- 修复VOC格式数据预测时保存结果问题
- 修复FairMOT c++部署检测框输出
- 旋转框检测模型S2ANet支持batch size>1部署
- 功能新增
-
PP-YOLOE:
- 发布PP-YOLOE特色模型,l版本COCO test2017数据集精度51.6%,V100预测速度78.1 FPS,精度速度服务器端SOTA
- 发布s/m/l/x系列模型,打通TensorRT、ONNX部署能力
- 支持混合精度训练,训练较PP-YOLOv2加速33%
-
PP-PicoDet:
- 发布PP-PicoDet优化模型,精度提升2%左右,CPU预测速度提升63%。
- 新增参数量0.7M的PicoDet-XS模型
- 后处理集成到网络中,优化端到端部署成本
-
行人分析Pipeline:
- 发布PP-Human行人分析Pipeline,覆盖行人检测、属性识别、行人跟踪、跨镜跟踪、人流量统计、动作识别多种功能,打通TensorRT部署
- 属性识别支持StrongBaseline模型
- ReID支持Centroid模型
- 动作识别支持ST-GCN摔倒检测
-
模型丰富度:
- 发布YOLOX,支持nano/tiny/s/m/l/x版本,x版本COCO val2017数据集精度51.8%
-
框架功能优化:
- EMA训练速度优化20%,优化EMA训练模型保存方式
- 支持infer预测结果保存为COCO格式
-
部署优化:
- RCNN全系列模型支持Paddle2ONNX导出ONNX模型
- SSD模型支持导出时融合解码OP,优化边缘端部署速度
- 支持NMS导出TensorRT,TensorRT部署端到端速度提升
-
特色模型:
- 检测: 轻量级移动端检测模型PP-PicoDet,精度速度达到移动端SOTA
- 关键点: 轻量级移动端关键点模型PP-TinyPose
-
模型丰富度:
-
检测:
- 新增Swin-Transformer目标检测模型
- 新增TOOD(Task-aligned One-stage Object Detection)模型
- 新增GFL(Generalized Focal Loss)目标检测模型
- 发布Sniper小目标检测优化方法,支持Faster RCNN及PP-YOLO系列模型
- 发布针对EdgeBoard优化的PP-YOLO-EB模型
-
跟踪
- 发布实时跟踪系统PP-Tracking
- 发布FairMot高精度模型、小尺度模型和轻量级模型
- 发布行人、人头和车辆实跟踪垂类模型库,覆盖航拍监控、自动驾驶、密集人群、极小目标等场景
- DeepSORT模型适配PP-YOLO, PP-PicoDet等更多检测器
-
关键点
- 新增Lite HRNet模型
-
-
预测部署:
- YOLOv3系列模型支持NPU预测部署
- FairMot模型C++预测部署打通
- 关键点系列模型C++预测部署打通, Paddle Lite预测部署打通
-
文档:
- 新增各系列模型英文文档
-
模型丰富度:
- 发布Transformer检测模型:DETR、Deformable DETR、Sparse RCNN
- 关键点检测新增Dark模型,发布Dark HRNet模型
- 发布MPII数据集HRNet关键点检测模型
- 发布人头、车辆跟踪垂类模型
-
模型优化:
- 旋转框检测模型S2ANet发布Align Conv优化模型,DOTA数据集mAP优化至74.0
-
预测部署
- 主流模型支持batch size>1预测部署,包含YOLOv3,PP-YOLO,Faster RCNN,SSD,TTFNet,FCOS
- 新增多目标跟踪模型(JDE, FairMot, DeepSort) Python端预测部署支持,并支持TensorRT预测
- 新增多目标跟踪模型FairMot联合关键点检测模型部署Python端预测部署支持
- 新增关键点检测模型联合PP-YOLO预测部署支持
-
文档:
- Windows预测部署文档新增TensorRT版本说明
- FAQ文档更新发布
-
问题修复:
- 修复PP-YOLO系列模型训练收敛性问题
- 修复batch size>1时无标签数据训练问题
-
模型丰富度提升:
- 发布关键点模型HRNet,HigherHRNet
- 发布多目标跟踪模型DeepSort, FairMot, JDE
-
框架基础能力:
- 支持无标注框训练
-
预测部署:
- Paddle Inference YOLOv3系列模型支持batch size>1预测
- 旋转框检测S2ANet模型预测部署打通
- 增加量化模型Benchmark
- 增加动态图模型与静态图模型Paddle-Lite demo
-
检测模型压缩:
- 发布PPYOLO系列模型压缩模型
-
文档:
- 更新快速开始,预测部署等教程文档
- 新增ONNX模型导出教程
- 新增移动端部署文档
说明: 自2.0版本开始,动态图作为PaddleDetection默认版本,原dygraph
目录切换为根目录,原静态图实现移动到static
目录下。
-
动态图模型丰富度提升:
- 发布PP-YOLOv2及PP-YOLO tiny模型,PP-YOLOv2 COCO test数据集精度达到49.5%,V100预测速度达到68.9 FPS
- 发布旋转框检测模型S2ANet
- 发布两阶段实用模型PSS-Det
- 发布人脸检测模型Blazeface
-
新增基础模块:
- 新增SENet,GhostNet,Res2Net骨干网络
- 新增VisualDL训练可视化支持
- 新增单类别精度计算及PR曲线绘制功能
- YOLO系列模型支持NHWC数据格式
-
预测部署:
- 发布主要模型的预测benchmark数据
- 适配TensorRT6,支持TensorRT动态尺寸输入,支持TensorRT int8量化预测
- PP-YOLO, YOLOv3, SSD, TTFNet, FCOS, Faster RCNN等7类模型在Linux、Windows、NV Jetson平台下python/cpp/TRT预测部署打通:
-
检测模型压缩:
- 蒸馏:新增动态图蒸馏支持,并发布YOLOv3-MobileNetV1蒸馏模型
- 联合策略:新增动态图剪裁+蒸馏联合策略压缩方案,并发布YOLOv3-MobileNetV1的剪裁+蒸馏压缩模型
- 问题修复:修复动态图量化模型导出问题
-
文档:
- 新增动态图英文文档:包含首页文档,入门使用,快速开始,模型算法、新增数据集等
- 新增动态图中英文安装文档
- 新增动态图RCNN系列和YOLO系列配置文件模板及配置项说明文档
-
动态图模型丰富度提升:
- 优化RCNN模型组网及训练方式,RCNN系列模型精度提升(依赖Paddle develop或2.0.1版本)
- 新增支持SSDLite,FCOS,TTFNet,SOLOv2系列模型
- 新增行人和车辆垂类目标检测模型
-
新增动态图基础模块:
- 新增MobileNetV3,HRNet骨干网络
- 优化RoIAlign计算逻辑,RCNN系列模型精度提升(依赖Paddle develop或2.0.1版本)
- 新增支持Synchronized Batch Norm
- 新增支持Modulated Deformable Convolution
-
预测部署:
- 发布动态图python、C++、Serving部署解决方案及文档,支持Faster RCNN,Mask RCNN,YOLOv3,PP-YOLO,SSD,TTFNet,FCOS,SOLOv2等系列模型预测部署
- 动态图预测部署支持TensorRT模式FP32,FP16推理加速
-
检测模型压缩:
- 裁剪:新增动态图裁剪支持,并发布YOLOv3-MobileNetV1裁剪模型
- 量化:新增动态图量化支持,并发布YOLOv3-MobileNetV1和YOLOv3-MobileNetV3量化模型
-
文档:
- 新增动态图入门教程文档:包含安装说明,快速开始,准备数据,训练/评估/预测流程文档
- 新增动态图进阶教程文档:包含模型压缩、推理部署文档
- 新增动态图模型库文档
-
动态图支持:
- 支持Faster-RCNN, Mask-RCNN, FPN, Cascade Faster/Mask RCNN, YOLOv3和SSD模型,试用版本。
-
模型提升:
- 更新PP-YOLO MobileNetv3 large和small模型,精度提升,并新增裁剪和蒸馏后的模型。
-
新功能:
- 支持VisualDL可视化数据预处理图片。
-
Bug修复:
- 修复BlazeFace人脸关键点预测bug。
-
模型丰富度提升:
- 发布SOLOv2系列模型,其中SOLOv2-Light-R50-VD-DCN-FPN 模型在单卡V100上达到 38.6 FPS,加速24% ,COCO验证集精度达到38.8%, 提升2.4绝对百分点。
- 新增Android移动端检测demo,包括SSD、YOLO系列模型,可直接扫码安装体验。
-
移动端模型优化:
- 新增PACT新量化策略,YOLOv3-Mobilenetv3在COCO数据集上比普通量化相比提升0.7%。
-
易用性提升及功能组件:
- 增强generate_proposal_labels算子功能,规避模型出nan风险。
- 修复deploy下python与C++预测若干问题。
- 统一COCO与VOC数据集下评估流程,支持输出单类AP和P-R曲线。
- PP-YOLO支持矩形输入图像。
-
文档:
- 新增目标检测全流程教程,新增Jetson平台部署教程。
-
模型丰富度提升:
- 发布PPYOLO模型,COCO数据集精度达到45.2%,单卡V100预测速度达到72.9 FPS,精度和预测速度优于YOLOv4模型。
- 新增TTFNet模型,base版本对齐竞品,COCO数据集精度达到32.9%。
- 新增HTC模型,base版本对齐竞品,COCO数据集精度达到42.2%。
- 新增BlazeFace人脸关键点检测模型,在Wider-Face数据集的Easy-Set精度达到85.2%。
- 新增ACFPN模型, COCO数据集精度达到39.6%。
- 发布服务器端通用目标检测模型(包含676类),相同策略在COCO数据集上,V100为19.5FPS时,COCO mAP可以达到49.4%。
-
移动端模型优化:
- 新增SSDLite系列优化模型,包括新增GhostNet的Backbone,新增FPN组件等,精度提升0.5%-1.5%。
-
易用性提升及功能组件:
- 新增GridMask, RandomErasing数据增强方法。
- 新增Matrix NMS支持。
- 新增EMA(Exponential Moving Average)训练支持。
- 新增多机训练方法,两机相对于单机平均加速比80%,多机训练支持待进一步验证。
-
模型丰富度提升:
- 添加Efficientdet-D0模型,速度与精度优于竞品。
- 新增YOLOv4预测模型,精度对齐竞品;新增YOLOv4在Pascal VOC数据集上微调训练,精度达到85.5%。
- YOLOv3新增MobileNetV3骨干网络,COCO数据集精度达到31.6%。
- 添加Anchor-free模型FCOS,精度优于竞品。
- 添加Anchor-free模型CornernetSqueeze,精度优于竞品,优化模型的COCO数据集精度38.2%, +3.7%,速度较YOLOv3-Darknet53快5%。
- 添加服务器端实用目标检测模型CascadeRCNN-ResNet50vd模型,速度与精度优于竞品EfficientDet。
-
移动端推出3种模型:
- SSDLite系列模型:SSDLite-Mobilenetv3 small/large模型,精度优于竞品。
- YOLOv3移动端方案: YOLOv3-MobileNetv3模型压缩后加速3.5倍,速度和精度均领先于竞品的SSDLite模型。
- RCNN移动端方案:CascadeRCNN-MobileNetv3经过系列优化, 推出输入图像分别为320x320和640x640的模型,速度与精度具有较高性价比。
-
预测部署重构:
- 新增Python预测部署流程,支持RCNN,YOLO,SSD,RetinaNet,人脸系列模型,支持视频预测。
- 重构C++预测部署,提高易用性。
-
易用性提升及功能组件:
- 增加AutoAugment数据增强。
- 升级检测库文档结构。
- 支持迁移学习自动进行shape匹配。
- 优化mask分支评估阶段内存占用。
- 新增模型:
- 新增基于CBResNet模型。
- 新增LibraRCNN模型。
- 进一步提升YOLOv3模型精度,基于COCO数据精度达到43.2%,相比上个版本提升1.4%。
- 新增基础模块:
- 主干网络: 新增CBResNet。
- loss模块: YOLOv3的loss支持细粒度op组合。
- 正则模块: 新增DropBlock模块。
- 功能优化和改进:
- 加速YOLOv3数据预处理,整体训练提速40%。
- 优化数据预处理逻辑,提升易用性。
- 增加人脸检测预测benchmark数据。
- 增加C++预测引擎Python API预测示例。
- 检测模型压缩 :
- 裁剪: 发布MobileNet-YOLOv3裁剪方案和模型,基于VOC数据FLOPs - 69.6%, mAP + 1.4%,基于COCO数据FLOPS-28.8%, mAP + 0.9%; 发布ResNet50vd-dcn-YOLOv3裁剪方案和模型,基于COCO数据集FLOPS - 18.4%, mAP + 0.8%。
- 蒸馏: 发布MobileNet-YOLOv3蒸馏方案和模型,基于VOC数据mAP + 2.8%,基于COCO数据mAP + 2.1%。
- 量化: 发布YOLOv3-MobileNet和BlazeFace的量化模型。
- 裁剪+蒸馏: 发布MobileNet-YOLOv3裁剪+蒸馏方案和模型,基于COCO数据FLOPS - 69.6%,基于TensorRT预测加速64.5%,mAP - 0.3 %; 发布ResNet50vd-dcn-YOLOv3裁剪+蒸馏方案和模型,基于COCO数据FLOPS - 43.7%,基于TensorRT预测加速24.0%,mAP + 0.6 %。
- 搜索: 开源BlazeFace-Nas的完成搜索方案。
- 预测部署:
- 集成 TensorRT,支持FP16、FP32、INT8量化推理加速。
- 文档:
- 增加详细的数据预处理模块介绍文档以及实现自定义数据Reader文档。
- 增加如何新增算法模型的文档。
- 文档部署到网站: https://paddledetection.readthedocs.io
- 增加Res2Net模型。
- 增加HRNet模型。
- 增加GIOU loss和DIOU loss。
- 增加CascadeClsAware RCNN模型。
- 增加CBNet,ResNet200和Non-local模型。
- 增加SoftNMS。
- 增加Open Image V5数据集和Objects365数据集模型。
- 增加增强版YOLOv3模型,精度高达41.4%。
- 增加人脸检测模型BlazeFace、Faceboxes。
- 丰富基于COCO的模型,精度高达51.9%。
- 增加Objects365 2019 Challenge上夺冠的最佳单模型之一CACascade-RCNN。
- 增加行人检测和车辆检测预训练模型。
- 支持FP16训练。
- 增加跨平台的C++推理部署方案。
- 增加模型压缩示例。
- 增加GroupNorm模型。
- 增加CascadeRCNN+Mask模型。
- 增加Modulated Deformable Convolution系列模型。
- 增加检测库中文文档
- 修复R-CNN系列模型训练同时进行评估的问题
- 新增ResNext101-vd + Mask R-CNN + FPN模型
- 新增基于VOC数据集的YOLOv3模型
- 首次发布PaddleDetection检测库和检测模型库
- 模型包括:Faster R-CNN, Mask R-CNN, Faster R-CNN+FPN, Mask R-CNN+FPN, Cascade-Faster-RCNN+FPN, RetinaNet, YOLOv3, 和SSD.