论文部分内容阅读
摘 要:通常在相对复杂的场景下,会对入场车辆产生严重遮挡的情况,再加之部分车辆尺寸较小,所以车辆识别系统在识别车辆的过程中会存在别率低、虚警率高等难题。为了有效解决该问题,本次研究中提出一种基于深度学习的复杂场景下有效识别车辆的方法。可以根据场景当中车辆存在的特点,以可视化解析的方式分析公开数据集当中的标注性文件,运用深度学习对复杂场景下车辆进行有效识别。
关键词:深度学习;车辆识别;应用
0. 引言
我国城市化的不断深入以及交通道路的快速发展使我国公路车辆的数量不断攀升,进而造成城市交通拥堵、难停车等一系列负面问题。为了减轻这类问题的严重性,有学者提出使用深度学习法分析与调整城市交通和停车状况,从而引发一定程度上的关注。
对于复杂场景下的目标识别方法,国内外学者提出了许多的内容和观点。尽管如此,但是在车辆识别的过程中都会面临着目标图像背景复杂、尺寸相差大、遮挡严重等因素引起的目标识别率较低、虚警率高、实时性差等一系列问题。
在研究过程中,发现 YOLO v2利用回归法可以实现车辆的分类与检测同步进行,进而使车辆的训练与识别实践缩短。
为了满足复杂的场景下有效识别车辆的需要,本次研究在 YOLO v2网络模型基础上提出深度学习的车辆识别方法,配合标注文件解析等方法规范数据集标注文件,确保学习样本的准确性。在运用回归的基础上使计算速度得到提升。经过实践应用最终得出结论,基于深度学习的车辆识别算法可以有效的提升车辆识别率,实用性较强。
1. 深度学习基础上的车辆快速识别方法
1.1 数据预处理
数据预处理的终于要内容包括对数据的裁剪、标注、批量规范、化、数据增强。
(1) 对标注文件进行可视化解析与调整
通过对摄像头和网络采集的数据进行人为标注,在深度网络模型训练当中可能会用到这些数据。
在本次研究中使用 LabelImg 法对每张图片当中存在的车辆进行标注并整理训练数据集,每张图片现实汽车标注的工作完成以后,使用 Labe- lImg 法会在原图目录的基础上,会生成与原图相匹配的 xml 格式文件,在这个文件的内容中,对该图片的路径、标记框的相对位置、标记框内物体的类别等内容进行了明确的标注[1]。
如果发现需要标注的图像当中车辆太小,就可以选择放弃将次图片加入到训练集当中。
微软公司的 COCO 公共数据集图像无法实现对观察标注框内部包围车辆的实际情况进行清晰观察。为了避免这种情况带来的一系列负面问题,所以在本次研究编写脚本的过程中可以用可视化分析方法处理公共数据集标注文件,重新标注漏标、误标等一系列情况,进而使训练数据集的质量得到提升。
(2) 增强数据
所谓的数据增强是在每一次訓练正式开始之前在特定范围内旋转、对随即曝光度进行设计、对随机饱和度进行设计。
通过增强数据等方式可以有效预处理训练集,进而在最大程度上降低由于计算机视觉模型泛化产生的误差。在实际的测试过程中,可以把同一输入通过不同的版本传递到模型,模型比例的不同决定了模型输出的不同,即通过集成法有效解决问题,泛化误差程度被降低。结合传感器的采集特点可以实现在将训练集和验证集融入到特定场景的图像当中,由此场景目标识别的效果就会得到增强。
1.2 YOLO 模型的物体识别方法
使用 YOLO 模型的物体识别方法可以实现对回归问题进行求解,进而使原始图像从输入到输出物体的位置与类别[2]。
使用 YOLO 模型的物体识别方法,无论是检测还是训练都是在一个独立的网络中进行的。 YOLO v2使用全新的网络,常用的卷积核为3*3, 一次池化操作结束后,通道的数量就会出现翻倍增长。YOLO 模型的物体识别方法在使用的过程中可以引用 network in network 思想,将卷积核1*1穿插在卷积核3*3中间,使目标特征被压缩。
YOLO v2技术的内部含有卷积层、最大值池化层,分别是19个、5个。最后一层网络数量为13*13,相比曾经的7*7网络,处理细粒度目标数量就会出现成倍增加,相比26*26的特征,与13*13实现同时决策,包括贡献为双层、SSD 网络大于4层都是相等的,因而计算量增加程度并不显著。
为了使 YOLO v2可以在任何尺度下进行任务检测,有学者曾试验使用分辨率不同的图片使网络的适应性得到提升,不过该方法只运用到了卷积层与池化层,如此一来在进行动态调整时将会更加有效[3]。
2. 实践与分析
为了证明上述分析的有效性,接下来通过 COCO 数据集和 PCAR 数据集分析与对比不同深度学习网络模型识别性能[3]。
COCO 数据集是一种以微软维护为前提的图像数据集,可以进行一系列的机器视觉任务的数据集工作,包括识别对象、分割图像、识别图片中字幕等工作。
COCO 数据集具有较为强大的工作能力,可以处理图像数量大于30万、实例大于200万、对象80大于类实现同时处理。本次研究中仅选择数据集当中的一部分进行使用,数据集主要由两部分组成,含其中车辆训练图8290张、车辆测试图4051张,图片分辨率全部都在640*640以下。
本次研究进行了三组实验进行相互对比,在实验中除了运用到 YOLO 以外,还运用到了 SSD 以及改良版的 COCO 算法,数据上行训练集结束后,可以使用 COCO 测试集进行测试。
本次研究中运用到 YOLO、SSD、改良版 COCO 数据三种技术,通过三种算法对 COCO 数据集进行训练,分别对同一张图片进行测试,测试效果相对直观,首先在 YOLO 、SSD、改良版 COCO 测试结果技术的基础上观察车辆识别效果,可以清晰的看出无论使用 YOLO 还是 SSD 模型进行图片测试,均存在虚警现象,YOLO 技术会出现将多辆车与背景识别为一辆车的情况,SSD 技术车辆识别图像当中会将公路、花坛、摩托车错误的识别为车辆。改良版 COCO 可以在一定程度上规避将其它目标或背景错误识别为车辆[4]。
经过实践证明,改良版 COCO 增强了车辆识别精确强度,将虚警现象有效消除。
结论:
复杂场景下的车辆识别是长期以来对工作人员造成困扰的一项难题,本次研究从深度学习的角度出发对复杂场景下车辆识别方法进行研究。具体做法是针对传统的 COCO 法文件进行重新标注,随后使用 YOLO、SSD 以及改良版的 COCO 法对复杂场景下的车辆识别进行实践分析,发现无论是 YOLO 还是 SSD 都存在将周围的非车辆目标识别为车辆,进而增大了实验误差,最终结果显示改良版的 COCO 法在复杂场景下的车辆识别工作中展现出更出众的效果。
参考文献:
[1] 石鑫,赵池航,林盛梅,李彦伟,薛善光,钱子晨.基于深度学习网络模型的车辆类型识别方法研究 [J]. 筑路机械与施工机械化,2020,37(04):67-73+78.
[2] 程远航,吴锐.基于图像实例分割的行人车辆检测识别方法[J].信息与电脑(理论版),2020,32(06):130-132.
[3] 石鑫,赵池航,张小琴,李彦伟,薛善光,毛迎兵.基于融合特征稀疏编码模型的车辆品牌识别方法[J].筑路机械与施工机械化,2020,37(03):59-63.[4]朱文佳,付源梓,金强,余烨.视角相关的车辆型号精细识别方法[J].合肥工业大学学报(自然科学版),2020,43(02):205-210+279.
[5] 苏婕,张磊,申欣,徐海丰.基于号牌识别数据的车辆出行链分离方法研究[J].汽车与安全,2020(02):88-91.
[6] 王也. 基于深度学习与虚拟数据的车辆识别与状态估计研究[D].吉林大学,2019.
关键词:深度学习;车辆识别;应用
0. 引言
我国城市化的不断深入以及交通道路的快速发展使我国公路车辆的数量不断攀升,进而造成城市交通拥堵、难停车等一系列负面问题。为了减轻这类问题的严重性,有学者提出使用深度学习法分析与调整城市交通和停车状况,从而引发一定程度上的关注。
对于复杂场景下的目标识别方法,国内外学者提出了许多的内容和观点。尽管如此,但是在车辆识别的过程中都会面临着目标图像背景复杂、尺寸相差大、遮挡严重等因素引起的目标识别率较低、虚警率高、实时性差等一系列问题。
在研究过程中,发现 YOLO v2利用回归法可以实现车辆的分类与检测同步进行,进而使车辆的训练与识别实践缩短。
为了满足复杂的场景下有效识别车辆的需要,本次研究在 YOLO v2网络模型基础上提出深度学习的车辆识别方法,配合标注文件解析等方法规范数据集标注文件,确保学习样本的准确性。在运用回归的基础上使计算速度得到提升。经过实践应用最终得出结论,基于深度学习的车辆识别算法可以有效的提升车辆识别率,实用性较强。
1. 深度学习基础上的车辆快速识别方法
1.1 数据预处理
数据预处理的终于要内容包括对数据的裁剪、标注、批量规范、化、数据增强。
(1) 对标注文件进行可视化解析与调整
通过对摄像头和网络采集的数据进行人为标注,在深度网络模型训练当中可能会用到这些数据。
在本次研究中使用 LabelImg 法对每张图片当中存在的车辆进行标注并整理训练数据集,每张图片现实汽车标注的工作完成以后,使用 Labe- lImg 法会在原图目录的基础上,会生成与原图相匹配的 xml 格式文件,在这个文件的内容中,对该图片的路径、标记框的相对位置、标记框内物体的类别等内容进行了明确的标注[1]。
如果发现需要标注的图像当中车辆太小,就可以选择放弃将次图片加入到训练集当中。
微软公司的 COCO 公共数据集图像无法实现对观察标注框内部包围车辆的实际情况进行清晰观察。为了避免这种情况带来的一系列负面问题,所以在本次研究编写脚本的过程中可以用可视化分析方法处理公共数据集标注文件,重新标注漏标、误标等一系列情况,进而使训练数据集的质量得到提升。
(2) 增强数据
所谓的数据增强是在每一次訓练正式开始之前在特定范围内旋转、对随即曝光度进行设计、对随机饱和度进行设计。
通过增强数据等方式可以有效预处理训练集,进而在最大程度上降低由于计算机视觉模型泛化产生的误差。在实际的测试过程中,可以把同一输入通过不同的版本传递到模型,模型比例的不同决定了模型输出的不同,即通过集成法有效解决问题,泛化误差程度被降低。结合传感器的采集特点可以实现在将训练集和验证集融入到特定场景的图像当中,由此场景目标识别的效果就会得到增强。
1.2 YOLO 模型的物体识别方法
使用 YOLO 模型的物体识别方法可以实现对回归问题进行求解,进而使原始图像从输入到输出物体的位置与类别[2]。
使用 YOLO 模型的物体识别方法,无论是检测还是训练都是在一个独立的网络中进行的。 YOLO v2使用全新的网络,常用的卷积核为3*3, 一次池化操作结束后,通道的数量就会出现翻倍增长。YOLO 模型的物体识别方法在使用的过程中可以引用 network in network 思想,将卷积核1*1穿插在卷积核3*3中间,使目标特征被压缩。
YOLO v2技术的内部含有卷积层、最大值池化层,分别是19个、5个。最后一层网络数量为13*13,相比曾经的7*7网络,处理细粒度目标数量就会出现成倍增加,相比26*26的特征,与13*13实现同时决策,包括贡献为双层、SSD 网络大于4层都是相等的,因而计算量增加程度并不显著。
为了使 YOLO v2可以在任何尺度下进行任务检测,有学者曾试验使用分辨率不同的图片使网络的适应性得到提升,不过该方法只运用到了卷积层与池化层,如此一来在进行动态调整时将会更加有效[3]。
2. 实践与分析
为了证明上述分析的有效性,接下来通过 COCO 数据集和 PCAR 数据集分析与对比不同深度学习网络模型识别性能[3]。
COCO 数据集是一种以微软维护为前提的图像数据集,可以进行一系列的机器视觉任务的数据集工作,包括识别对象、分割图像、识别图片中字幕等工作。
COCO 数据集具有较为强大的工作能力,可以处理图像数量大于30万、实例大于200万、对象80大于类实现同时处理。本次研究中仅选择数据集当中的一部分进行使用,数据集主要由两部分组成,含其中车辆训练图8290张、车辆测试图4051张,图片分辨率全部都在640*640以下。
本次研究进行了三组实验进行相互对比,在实验中除了运用到 YOLO 以外,还运用到了 SSD 以及改良版的 COCO 算法,数据上行训练集结束后,可以使用 COCO 测试集进行测试。
本次研究中运用到 YOLO、SSD、改良版 COCO 数据三种技术,通过三种算法对 COCO 数据集进行训练,分别对同一张图片进行测试,测试效果相对直观,首先在 YOLO 、SSD、改良版 COCO 测试结果技术的基础上观察车辆识别效果,可以清晰的看出无论使用 YOLO 还是 SSD 模型进行图片测试,均存在虚警现象,YOLO 技术会出现将多辆车与背景识别为一辆车的情况,SSD 技术车辆识别图像当中会将公路、花坛、摩托车错误的识别为车辆。改良版 COCO 可以在一定程度上规避将其它目标或背景错误识别为车辆[4]。
经过实践证明,改良版 COCO 增强了车辆识别精确强度,将虚警现象有效消除。
结论:
复杂场景下的车辆识别是长期以来对工作人员造成困扰的一项难题,本次研究从深度学习的角度出发对复杂场景下车辆识别方法进行研究。具体做法是针对传统的 COCO 法文件进行重新标注,随后使用 YOLO、SSD 以及改良版的 COCO 法对复杂场景下的车辆识别进行实践分析,发现无论是 YOLO 还是 SSD 都存在将周围的非车辆目标识别为车辆,进而增大了实验误差,最终结果显示改良版的 COCO 法在复杂场景下的车辆识别工作中展现出更出众的效果。
参考文献:
[1] 石鑫,赵池航,林盛梅,李彦伟,薛善光,钱子晨.基于深度学习网络模型的车辆类型识别方法研究 [J]. 筑路机械与施工机械化,2020,37(04):67-73+78.
[2] 程远航,吴锐.基于图像实例分割的行人车辆检测识别方法[J].信息与电脑(理论版),2020,32(06):130-132.
[3] 石鑫,赵池航,张小琴,李彦伟,薛善光,毛迎兵.基于融合特征稀疏编码模型的车辆品牌识别方法[J].筑路机械与施工机械化,2020,37(03):59-63.[4]朱文佳,付源梓,金强,余烨.视角相关的车辆型号精细识别方法[J].合肥工业大学学报(自然科学版),2020,43(02):205-210+279.
[5] 苏婕,张磊,申欣,徐海丰.基于号牌识别数据的车辆出行链分离方法研究[J].汽车与安全,2020(02):88-91.
[6] 王也. 基于深度学习与虚拟数据的车辆识别与状态估计研究[D].吉林大学,2019.