论文部分内容阅读
机器学习、深度学习和自然语言处理等新技术是推动现代社会各方面发展进步的动力源泉,无论在电子商务网站上的内容推荐还是对大量网络信息数据过滤和分析,这些技术都起到了不可或缺的作用。车型识别具有广阔的应用前景,在车型识别过程中,车辆定位的精确度和车辆型号分类的准确度,是决定车型识别效果好坏的重要因素。现有的车型识别算法中多数是对车辆不同品牌型号的车型进行识别,缺乏对同一品牌不同车系的车型进行更细致的识别,而且准确率有待提高。本文基于卷积神经网络对车型识别两个方面:车辆定位和车型分类进行了研究,提出了一种以Faster RCNN为基础进行改进的车型识别网络模型,实现了细粒度的车型识别,且提高了车型识别的准确率。主要研究内容如下:(1)数据增广能够在增加训练数据量的同时,提高所训练模型的泛化能力和鲁棒性,本文采用斯坦福大学的公开汽车数据集Stanford Cars Dataset为基础数据集,利用网络爬虫、几何变换、高斯噪声、仿射变换等方式对基础数据集进行增广处理,然后对增广得来的数据作预处理并进行标注,构成一个新的汽车数据集Stanford Cars-extend用于网络模型训练。(2)对现有的目标检测RCNN、Fast RCNN以及Faster RCNN等算法进行了分析研究,本文采用Faster RCNN算法作为车型识别中车辆定位的基础,分别将ImageNet数据集上的VGG16和ResNet50两个预训练模型作为Faster RCNN的特征提取CNN,并在新的汽车数据集Stanford Cars-extend上进行训练和测试,实验表明,采用ResNet50网络模型的车辆定位准确率更高。(3)在采用ResNet50网络模型作为Faster RCNN的特征提取CNN的基础上,采用InceptionV3网络模型来进行车型分类,构成了 Faster RCNN+ResNet50+InceptionV3的车型识别网络模型。在新的汽车数据集Stanford Cars-extend 上,分别对 ImageNet 数据集上的 ResNet50 和 GoogLeNet Inceptionv3预训练模型进行车型分类训练和测试,实验结果表明,采用GoogLeNet Inceptionv3进行车型分类效果更优,车型识别准确率达到93%。