- 是否可以使用selective search 或其他方法提取预选框?类似fast-rcnn中使用的预选框提取
网络。需要考虑遮挡的问题,运动检测似乎是必须的。 - 使用harr-like检测场景中的人脸,使用肤色过滤,然后估测人头的大小。
- 提取预选框之后可以使用预估的人头大小来剔除一些预选框
使用瀑布模型,先使用简单的CNN快速剔除非人头部分,然后使用更耗时的CNN检测余下的部分
对实验场景进行拍照,然后提取人头大小的部分作为负例,应该可以提高当前场景的检测精度。
如何不使用滑动窗口
可以使用这个文章中的方法来提取预选框(网上有中文版的)