论文部分内容阅读
基于深度学习的实时目标检测算法逐渐成为研究和应用的热门,实时目标检测算法在智慧交通、智能监控、安防、军事、手术医疗等众多领域有着广泛的应用。行人是目标检测中的一类重要检测对象,视频图像中的行人检测和行人流量统计对于智慧城市安防、经济建设规划等起到重要的作用。YOLO(You Look Only Once)方法是一种先进的实时物体检测方法,与以往较主流的实时物体检测方法相比,YOLO算法的检测速度快,实时效果较好。虽然YOLO系列检测算法已经非常出色,但是YOLO检测模型较为复杂,模型占用较大存储空间,实时运行需要强有力的图形处理器(Graphics Processing Unit,GPU)的计算资源支持才可以实现,在计算资源有限和内存有限的平台上无法使用。近几年的研究中,在前端嵌入式或移动设备上部署检测算法成为热门,这类设备的计算资源和内存资源通常具有一定的局限性,这就对目标检测算法提出更高的要求。Tiny-YOLOV3虽然是为局限平台而设计,但是模型仍然较大,实际执行速度不佳。本文通过对实时目标检测算法YOLO进行研究,重点研究了相关结构模型优化和压缩的算法,针对行人实时检测及计数、计算资源局限平台实现实时目标检测进行研究,在YOLO和TinyYOLO-V3算法基础上进行了算法的改进和优化,具体工作如下:(1)研究了一种基于YOLO算法的实时行人计数方法YOLO-PC(YOLO-based People Counting Approach)。YOLO-PC对检测图像网格的划分更加细致,获得了更多的检测框和更高的检测置信度。该算法基于边界选择的方法,针对性对行人进行计数,在电梯出入口,建筑物出入口等处能有效对行人人流进行统计,可以检测某时刻画面人数,也可以统计某时段人流量。实验表明基于多划分边界选择的YOLO-PC算法在统计人流流量的任务上具有实时的检测速度和较高的精度。(2)研究了一种基于YOLO和YOLO-PC算法改进的模型压缩的人数统计方法SYOLO-PC(Squeezee YOLO-based People Counting Approach)。YOLO-PC由于更加细致的划分导致其参数数量非常大,因此需要在设备上占用大量存储空间,同时使得模型在网络上传下载变得非常耗时。S-YOLO-PC引入SqueezeeNet中的火层模块来优化整体网络结构,同时优化了火层模块在整体网络结构中的使用,实现了模型中的参数数量的压缩。实验结果表明,与YOLO-PC相比,S-YOLO-PC将模型存储空间进行缩减,与此同时精度几乎没有损失。(3)研究了一种基于Tiny-YOLO-V3算法的面向计算资源局限平台部署的实时物体检测方法Tinier-YOLO。通过在Tiny-YOLO-V3中引入大量火层模块来减少模型参数和计算量。在模型压缩到一定程度会对精度有所影响,Tinier-YOLO进一步增加了火层模块的密集连接和更多细粒度特征来提升模型的精度,并部分去除火层模块的BN操作来进一步优化网络的综合性能。最终在保证无损甚至提升检测精度的情况下对模型参数进行大量缩减,减少了大量模型存储空间和计算量,实现在低性能计算平台快速且实时的检测效果。实验表明Tinier-YOLO与Tiny-YOLO-V3相比,所耗费时间复杂度和空间占用都大大减小,更适合在计算资源局限平台上部署。Tinier-YOLO在VOC 2007测试集上实现67.5%的平均精度均值(Mean Average Precision,mAP),优于Tiny-YOLO-V3。在MS COCO(Microsoft Common Objects in Context)数据集上交并比(Intersection-over-Union,IoU)为0.5时的mAP值与Tiny-YOLO-V3基本持平。但是在更严格的评判条件下,即IoU为0.75和0.50到0.95时Tinier-YOLO的mAP均优于Tiny-YOLO-V3。总体来说,Tinier-YOLO在模型空间占用、计算量、实时性、精度上均优于Tiny-YOLO-V3。本文基于实时目标检测算法YOLO进行深入研究,提出了一种基于YOLO改进的多划分边界选择的实时行人检测及计数算法YOLO-PC,这种算法在速度和精度上性能良好。基于YOLO-PC对其模型进行压缩优化后提出S-YOLO-PC,检测算法变得更加高效,减少了大量的冗余参数。本文对YOLO进一步优化,基于Tiny-YOLO-V3提出了一种面向计算资源局限平台部署的实时物体检测算法Tinier-YOLO,该算法不仅使得模型变得更小,计算量更少,速度更快,更适合部署于低性能的计算平台,同时还提高了多类物体的检测精度,是一种更小更快精度更高的检测算法。