论文部分内容阅读
目标检测一直以来都是学术界和工业界研究的热点课题,近年来得到了更加快速的发展,但仍然存在着许多的问题,目标小、目标过多、目标过于密集、目标倾斜等都是影响准确率的因素,因此,如何克服这些负面因素,同时提高准确率和检测速度是研究者们面临的问题。近年来产生了许多优秀的研究成果,例如:Yolo,Retinanet,Faster-rcnn。但是这些方法都只对稀疏的目标场景有效,对于密集型的具有方向性的目标检测任务效果欠佳,因为在倾斜场景下使用正矩形目标框会使相邻目标重叠面积过大,从而导致训练的时候包含的干扰特征过多,且在进行非极大值抑制的时候阈值不好选择的问题,为了解决上述面临的问题,本文将提出一种新型的专门针对此类密集型具有方向性的目标检测场景的方法,使用具有倾斜角度的矩形框作为候选框的定向匹配网络(DMnet),可以有效的避免相邻特征的干扰以及非极大值抑制不准的问题,由于采用了倾斜矩形框作为候选框,从而导致后续IOU计算、倾斜框的回归、Loss函数等需要进行改进,本文针对以上问题都给出了相应的解决方案,并且在快消品数据集上进行了实验,验证了本文所提出的方法具有可行性,并取得了不错的效果,和经典的使用正矩形框作为候选框的目标检测算法相比具有更高的mAP值,在VOC数据集上的实验表明,在不密集且具无方向性的目标检测场景下也适用。本文将上述所提出的方法应用到了快消品识别系统当中,啤酒厂商需要对市场上的啤酒销售情况进行统计分析,所以需要及时了解超市中各类啤酒的销售情况等,以前都需要人工来进行标记以进行统计,非常耗时费力,现使用目标检测与识别技术来自动完成这一工作,快消品识别系统能够自动图片中所具有的的啤酒类别及数量,改进了开源工具labelImg使之可以进行倾斜框的标注,对训练数据进行了预处理筛除模糊等图片以进行质控,此系统是使用的Flask框架搭建的Web服务,并使用TensorFlow Serving作为模型管理工具,以及针对此类场景具有的一些规律,进行了预测结果的后处理工作以提高预测结果的准确率,整个系统以分布式的方式进行训练及测试。