论文部分内容阅读
目标检测作为目前发展较为成熟的计算机视觉技术,在监控定位,交通国防等实际应用领域发挥着越来越重要的作用。针对多类别目标检测问题的神经网络模型从最初的R-CNN系列,再到后来的SSD、YOLO等受到学术界的广泛关注,随着模型的发展其检测精度逐步增加。然而通过分析实际需求可以发现,很多场景下目标检测网络并不需要识别过多的类别,甚至只需要识别某一个类别的场景也屡见不鲜,相对而言实时性的需求反而更加重要。若直接采用上述多类别目标检测模型,会由于网络自身运算参数过多,导致上述网络不能在普通算力计算机上进行实时检测,为实际应用带来困难。本文就实时性单类别目标检测问题出发,针对当前目标检测网络模型运行速度不达标的问题,提出两个优化模型参数的方法,并在上述优化算法的基础上搭建了一个室内定位系统。本文的主要工作包括:1.为获得能够快速检测的单类别目标检测模型,本文对特征提取网络基模型mobilenet v3提出了一种优化策略,修改了SE(Squeeze-and-Excitation)层的实现细节和depthwise,SE,pointwise层的连接顺序,结合warmup训练方式,最终得到了比原mobilenet v3网络参数量更少,精度更高的新网络模型mobilenet v3 small2。实验将其作为SSD网络的骨干模型,与其它网络模型相比有明显速度上的优势,为后续实现可实时性单类别目标检测任务打下基础。2.为进一步提高上述单类别目标检测模型的速度与精度,本文提出了一种针对目标类别的网络剪枝算法,该算法可以根据目标类别的变化适应性地选择不同的卷积核进行删减。同时,本文从可解释性的角度证明该剪枝算法的合理性。实验证明相比于剪枝前网络,该算法剪枝后的网络在目标类别检测的速度、精度上都具有一定优势。综合上述两个工作,本文提出的单类别目标检测模型在普通算力的计算机上运行即可达到实时检测的要求。3.在上述两个工作的基础上,本文训练了一个针对单类别(人物)的目标检测模型,并使用此模型搭建了一个室内定位系统。该系统在普通算力的计算机上就能达到实时性检测的效果,同时具有较高的检测精度。相关实验表明,本文提出的优化算法及剪枝策略可以有效的提升目标检测网络在单一类别检测上的运行速度和精度。同时,在此基础上实现的室内定位系统证明了上述算法的实用性及可行性。