C++例程

cpp目录下提供了一系列C++例程以供参考使用，具体情况如下：

序号	C++例程	说明
1	ssd_bmcv	使用OpenCV解码、BMCV前处理、BMRT推理
2	ssd_opencv	使用OpenCV解码、OpenCV前处理、BMRT推理

1. x86 PCIe 平台

1.1 环境准备

如果您在x86平台安装了PCIe加速卡，并使用它测试本例程，您需要安装libsophon(>=0.3.0)、sophon-opencv(>=0.2.4)和sophon-ffmpeg(>=0.2.4),具体步骤可参考x86-pcie平台的开发和运行环境搭建。

1.2 程序编译

C++程序需要编译可执行文件，ssd_opencv和ssd_bmcv编译方法相同，以编译ssd_bmcv程序为例：

cd ssd_bmcv
#change macro 'DEBUG' in ssd.hpp, when DEBUG=0, test whole dataset.
mkdir build && cd build
cmake .. && make

1.3 测试命令

编译完成后，会生成ssd_bmcv.pcie，具体参数说明如下：

usage:./ssd_bmcv.pcie <image directory or video path> <bmodel path> <device id(default: 0)> <conf_thre(default: unset)> <nms_thre(default: unset)>

测试实例如下：

./ssd_bmcv.pcie ../../../data/VOC2007-test-images ../../../data/models/BM1684X/ssd300_fp32_1b.bmodel 0

可通过改变模型进行b4或int8推理。

执行完成后，会将预测结果图片保存在results/下，预测结果信息保存在bmcv_cpp_result_b1.json中，同时会打印推理时间等信息。

注：如果测试的是视频，则会在build目录下生成视频流预测结果video.avi，且不会保存json格式的预测结果信息。

############################
SUMMARY: SSD detect
############################
[         SSD overall]  loops:    1 avg: 390676506 us
[      SSD preprocess]  loops:  100 avg: 1526 us
[       SSD inference]  loops:  100 avg: 65929 us
[     SSD postprocess]  loops:  100 avg: 6076 us

2. arm SoC平台

2.1 环境准备

对于arm SoC平台，内部已经集成了相应的libsophon、sophon-opencv和sophon-ffmpeg运行库包，位于/opt/sophon/下。

2.2 交叉编译

通常在x86主机上交叉编译程序，使之能够在arm SoC平台运行。您需要在x86主机上使用SOPHON SDK搭建交叉编译环境，将程序所依赖的头文件和库文件打包至soc-sdk目录中，具体请参考交叉编译环境搭建。本例程主要依赖libsophon、sophon-opencv和sophon-ffmpeg运行库包。

交叉编译环境搭建好后，使用交叉编译工具链编译生成可执行文件，以编译ssd_bmcv程序为例：

cd ssd_bmcv
mkdir build && cd build
#请根据实际情况修改-DSDK的路径，需使用绝对路径。
cmake -DTARGET_ARCH=soc -DSDK=/path_to_sdk/soc-sdk ..
make # 生成ssd_bmcv.soc

2.3 测试命令

将生成的可执行文件及所需的模型和测试图片拷贝到SoC目标平台中测试，测试方法请参考x86 PCIe平台的1.3 测试命令。

3. 精度与性能测试

3.1 精度测试

本例程在SSD/tools目录下提供了eval.py脚本，以计算推理结果的mAP。具体的测试命令如下：

# 请根据实际情况修改 --ground_truths 和 --result_json参数
# --ground_truths: 数据集的标注文件，这里默认设置为../data/pascal_test2007.json
# --result_json: 预测结果文件，可以填cpp或python例程运行生成的.json格式文件。
python3 eval.py --result_json ../cpp/ssd_bmcv/build/bmcv_cpp_result_b1.json

执行完成后，会打印出mAP信息：

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.433
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.717 # mAP
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.458
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.059
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.253
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.544
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.383
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.531
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.550
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.163
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.433
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.642

3.2 性能测试

可以使用bmrt_test测试模型的理论性能：

bmrt_test --bmodel {path_of_bmodel}

也可以参考1.3 测试命令打印程序运行中的实际性能指标。

############################
SUMMARY: SSD detect
############################
[         SSD overall]  loops:    1 avg: 390676506 us
[      SSD preprocess]  loops:  100 avg: 1526 us # preprocess_time
[       SSD inference]  loops:  100 avg: 65929 us # infer_time
[     SSD postprocess]  loops:  100 avg: 6076 us

测试中性能指标存在一定的波动属正常现象。

3.3 测试结果

经本地编译测试，caffe at SSD中VOC07+12模型在VOC2007-test数据集上的mAP为71.7%。

在BM1684X PCIE上，不同例程、不同模型的精度和性能测试结果如下：

例程	精度	batch_size	mAP	preprocess_time	infer_time
ssd_bmcv	fp32	1	71.7%	1.5ms	65.7ms
ssd_bmcv	fp32	4	71.7%	5.3ms	255.1ms
ssd_bmcv	int8	1	71.5%	1.4ms	5.3ms
ssd_bmcv	int8	4	71.5%	5.3ms	20.1ms
ssd_opencv	fp32	1	71.8%	4.8ms	66.0ms
ssd_opencv	fp32	4	71.8%	15.5ms	255.1ms
ssd_opencv	int8	1	71.5%	3.4ms	5.4ms
ssd_opencv	int8	4	71.5%	13.8ms	20.0ms

在BM1684 PCIE上，不同例程、不同模型的精度和性能测试结果如下：

例程	精度	batch_size	mAP	preprocess_time	infer_time
ssd_bmcv	fp32	1	71.7%	2.7ms	38.2ms
ssd_bmcv	fp32	4	65.0%	10.3ms	180.5ms
ssd_bmcv	int8	1	71.5%	2.7ms	21.8ms
ssd_bmcv	int8	4	63.0%	10.4ms	70.1ms
ssd_opencv	fp32	1	71.7%	4.1ms	38.2ms
ssd_opencv	fp32	4	65.0%	10.5ms	180.5ms
ssd_opencv	int8	1	71.4%	3.7ms	21.8ms
ssd_opencv	int8	4	62.9%	8.1ms	72.0ms

注:

1.同一例程、同一模型在soc与pcie上的infer_time相近，mAP相同。

2.ssd_opencv 的 preprocess_time 一定程度上取决于主机硬件。

3.1684的4b模型存在精度问题，正在排查中。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

C++例程

1. x86 PCIe 平台

1.1 环境准备

1.2 程序编译

1.3 测试命令

2. arm SoC平台

2.1 环境准备

2.2 交叉编译

2.3 测试命令

3. 精度与性能测试

3.1 精度测试

3.2 性能测试

3.3 测试结果

Files

README.md

Latest commit

History

README.md

File metadata and controls

C++例程

1. x86 PCIe 平台

1.1 环境准备

1.2 程序编译

1.3 测试命令

2. arm SoC平台

2.1 环境准备

2.2 交叉编译

2.3 测试命令

3. 精度与性能测试

3.1 精度测试

3.2 性能测试

3.3 测试结果