基于深度学习的车辆检测与识别算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:jjdoris1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济的快速腾飞,私家车的数量逐年增加,这使得交通监管的压力与日俱增,城市交通问题成了我们必须要解决的问题。近年来,人工智能的迅猛发展,为城市交通问题带来了更高效的解决办法。
  车辆检测技术是智能交通建设中的关键技术,可为交通管理者节约更多的时间和精力。它不仅要求可以满足实时检测,更加要求准确的识别出车辆信息。随着深度学习的不断发展,使用深度学习进行车辆检测与识别的研究成为新的发展趋势。因此,本文利用深度学习领域内的目标检测算法进行车辆检测与识别,本文的创新内容工作如下:
  (1)针对SSD网络模型中因浅层特征层的特征提取能力有限,造成小尺度车辆的漏检情况,设计了特征增强模块,提高网络的特征提取能力。在Conv4_3和FC7特征层添加了特征增强模块,使用1×1和3×3卷积提取到更多的特征,同时使用空洞卷积扩大特征层的感受野,让网络学习到多尺度的特征,改善SSD算法在小尺度车辆检测与识别中出现的漏检情况。
  (2)针对SSD网络模型中浅层特征层的特征表达能力不强,对小尺度车辆不敏感,造成检测精度不佳的问题。设计了特征融合模块,提高网络浅层特征层的特征表达能力。特征融合模块是将Conv4_3和FC7、FC7和Conv8_2、Conv8_2和Conv9_2特征层进行融合,融合方式为时间复杂度较低的双线性插值法。增强浅层特征层对小尺度车辆的特征表达能力,提高车辆检测与识别的检测精度。
  (3)针对SSD先验框的比例设置不适合车辆检测与识别任务,采用K-means聚类算法对KITTI数据集的真实框标注信息进行聚类分析,得出最适合车辆检测与识别任务的先验框比值,提高算法在车辆检测与识别中对目标标注的准确性。
其他文献
以la掺杂Pb(Zr,Sn,Ti)O反铁电相变陶瓷为研究对象,从结构、性能与应用的角度出发,深入系统地研究了铁电-相界附近,组份、温度、电场、压力变化对相结构和相变 性能的影响,揭示了场诱相变临界参数变化规律及相互关系.将温度诱导的Fe-AFE相变与电场诱导的AFE-FE相变和压力诱导的FE-AFE相变联系起来,详细研究了它们之间的内在机制.对场诱相变所产生的各种宏观效应-电致应就、压致相变电茶释
在这个科学技术不断发展和进步的时代,人们已经不满足于现有的通信速率和通信质量。满足上述要求的多输入多输出(multiple-input multiple-output,MIMO)技术得到了快速发展,其通过在收发端分别配置多根天线来对信息进行发送和接收,使得整个通信系统的传输速率大大增加。但在MIMO系统中,多天线收发会使系统性能受信道间干扰(inter-channel interference,I
学位
滚动轴承是旋转机械设备中关键零部件之一,在不同工业领域中应用广泛。但在实际工作中轴承工况不断变化导致大量有标签数据获取困难,同时传统寿命预测方法存在健康指标难以构建及寿命预测误差大的不足。因此,能够准确预测滚动轴承的剩余使用寿命对工业生产具有重大意义。本文针对不同工况滚动轴承剩余使用寿命预测提出一种方法,该方法分为状态识别与寿命预测两部分。状态识别方面:提出基于深度模型迁移的滚动轴承状态识别方法。
学位
图像是人们从客观世界获取信息的重要来源。然而,受环境以及成像设备的影响,获取的图像经常存在遮挡、扭曲、光照不均、边缘模糊等问题,导致图像中有效信息不能充分利用。这些低质量图像会给后续图像的处理,譬如图像中文本的定位与识别,带来很大的困难。目前基于深度学习算法的文本定位与识别算法在处理高质量图像时较传统的文档文本定位与识别技术有显著优势,但是在处理低质量的图像时,定位与识别效果仍然不理想。本文针对提
学位
核磁共振成像(Magnetic Resonance Imaging,MRI)过程中,由于受自身成像机制的影响,以及遵循奈奎斯特采样定理将耗费大量的采集时间,长时间的扫描操作容易引起患者感到不适,并且可能会引入运动伪影。近年来,基于生成对抗网络的压缩感知(Compressed sensing,CS)核磁共振重建算法在重建时间上有了较大的提升,但是由于原始的生成对抗网络存在训练稳定性差、困难和模式崩溃
随着信息技术与人工智能的发展,人们在日常生活中接触到的图片越来越多。图片中包含了大量的信息,因此通过文本检测与识别提取图片中的信息变得尤为重要。伴随着计算机视觉技术的快速发展,提高了人们对自然场景文本信息的检测与识别的要求。自然场景文本检测是从背景复杂的图片中得到文字的位置信息。通过检测与识别自然场景中的文本可以应用于工业自动化、车牌识别、智能机器人、智能翻译等领域。准确快速地检测场景文本成为科研
学位
语音信号是生活中最为常用的沟通信号,其中包含大量语言和情感信息。随着技术发展,其被广泛应用于智能控制、生物医疗和电子金融等多种领域,语音信号分离技术是语音识别和语音增强等技术的基础,如何在复杂环境下,对观测信号中特定语音进行准确分离具有重要研究价值。针对语音分离技术主要有两种思路,一种是基于信号处理的非深度学习方式,亦可以称其为传统算法,另一种是基于深度学习进行分离操作。本文针对传统算法中适定盲源
学位
分布式光伏并网发电系统在缓解能源危机以及生态污染等方面都发挥着重要作用,为大电网的健康发展提供了新动能。然而伴随着许多光伏电力的并网,给电力系统工作的安全性带来了更高的技术要求,其中孤岛检测为光伏并网发电系统的关键技术之一。目前防孤岛检测方法大多数在单逆变器系统中效果更为突出。然而,如果仅仅应用单逆变器系统则很难达到当前的电力需要标准。本文就多逆变器并网系统展开分析,探究怎样对主动式频率偏移检测方
随着信息时代的到来以及电商行业的快速发展,越来越多的人通过互联网发表自己对某些事物或事件的观点。商家通过分析消费者在平台上的反馈能够更加准确且快速地了解消费者对产品的需求,从而改进目标产品,并制定更合适的销售计划,以实现收益最大化。消费者通过分析他人留下的评论信息对产品有更加深入的了解,从而更好地判断出对产品的需求度。基于方面级的情感分析任务作为自然语言处理领域的一个重要研究方向,能够更加细致的对
低电压大电流整流模块是同步发电机一体化直流输出系统的核心。单一电源模块难以满足实现低电压大电流输出,而且一旦电源发生故障,整个电源系统将无法正常运作,从而难以满足正常的供电需求。因此,本文利用多个并联的具有可控整流功能的电力电子单元,直接实现低压大直流电输出,其模块化控制提高了系统控制灵活性和容错运行能力。其中均流技术是并联电力电子电源模块进行电流均匀分配的关键技术,各个并联电源模块之间电流不均会