论文部分内容阅读
在计算机视觉以及模式识别领域,卷积神经网络是一种广泛使用的技术,近年来,随着深度学习理论的发展,传统卷积神经网络因其较低的性能及过大的计算资源消耗,已不能满足日益增长的需求,因此,需要研究新的方法来提高图像分类与目标检测的效率。本文研究了用于图像分类的空洞卷积模型及HDC模型,并提出了用于图像目标检测的HDF-RCNN模型。具体工作如下:1)研究了卷积神经网络与目标检测的相关基础,分析了空洞卷积的原理与结构,搭建了空洞卷积模型,在Mnist手写数字识别数据集上验证了空洞卷积模型在提取图像特征上的良好性能。实验结果表明,空洞卷积模型的训练耗时比传统卷积神经网络平均降低了11.31%,训练精度提升0.5%,但是,它的测试精度降低了0.18%。2)分析了空洞卷积模型中存在的不足,设计搭建了HDC模型,通过堆叠不同尺寸的空洞卷积核来构成一个完整的,没有空洞存在的卷积核。在宽波段遥感图像数据集上测试了HDC模型以及与之结构相同的传统卷积神经网络和空洞卷积模型的性能并将其对比,验证了HDC模型的优越性。实验结果证明,HDC模型的训练耗时比空洞卷积模型平均降低了2.02%,训练精度和测试精度分别提升了14.15%和15.35%。3)设计并搭建了HDF-RCNN模型,并使用LeakyReLU激活函数来代替ReLU激活函数,以进一步减少空洞卷积带来的影响。使用Microsoft COCO数据集来对HDFRCNN模型进行测试,得到HDF-RCNN模型的图像目标检测结果。实验结果证明,HDFRCNN模型的训练耗时相比传统Faster RCNN平均降低了34.29%,训练精度和测试精度分别提升了40.06%和7.11%,在挑选出的10类共1200张图像上的平均识别率提高了0.6%。本文提出的HDF-RCNN模型解决了空洞卷积中存在的信息丢失问题,在Mnist手写数字识别数据集,宽波段遥感图像数据集和Microsoft COCO数据集上均获得了较好的效果,是一种性能良好的图像目标检测方法。