基于深度学习与虚拟数据的车辆识别与状态估计研究

来源 :吉林大学 | 被引量 : 1次 | 上传用户:sukeyjuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能化是未来汽车技术发展的重要方向,而环境传感感知是智能驾驶系统的重要组成部分。由于其低成本、采集信息丰富且对周围环境和其它传感器无影响等优势,车载相机一直是智能驾驶最常用的环境传感器之一。然而基于图像处理技术的目标识别和状态估计仍然具有很大的挑战。对车辆这一重要交通参与物的识别与状态估计一直以来是智能驾驶系统的研究热点。近些年来由于硬件计算性能的提升以及大量带有真值标注数据集的出现,数据驱动的深度神经网络在目标识别领域取得了巨大的成功。这些研究方法同样在车辆识别中得到了广泛的应用。这类方法以图像为输入,以目标车辆在图像坐标系下的2D包围盒作为输出。虽然这些研究方法同样适用于对车辆的识别,但其研究普遍针对通用型目标检测,并没有为针对车辆这种特定目标进行优化,这使得将这类方法应用于车辆2D包围盒检测时并不准确,也不高效。此外,通用目标检测器一般输出的是图像坐标系下车辆的2D包围盒信息,不能产生智能驾驶系统所需目标车辆的位置、姿态和尺寸等信息,而这些信息是支持汽车智能驾驶精准决策的关键参数。对目标车辆进行3D包围盒状态估计是更加有意义的任务。通常的做法是使用诸如激光雷达等其它带深度信息的传感器信号并与图像信号融合。然而激光雷达传感器价格昂贵并不实用,使用单目相机完成这个任务很难取得令人满意的精度,技术上具有很强的挑战性,也鲜有相关的研究。基于数据驱动的深度学习方法为车辆识别与状态估计提供了一条极好的解决途径。但此类方法需要大量带有标注的数据集进行模型训练。卷积神经网络越复杂,参数越多,网络可能有更高的拟合能力,但同时也需要更多的数据用于模型训练。然而,在真实世界中采集图像数据并对数据进行人工标注不仅十分繁琐,而且可能导致标注不精确和不统一。虚拟数据是基于计算机图形学技术,通过建模与3D渲染产生的模拟数据。相比于真实数据集,虚拟数据集不仅生成容易,且标注准确、可自动化。随着近年来计算机软硬件技术的不断发展,虚拟数据的逼真度也在不断提高,在模型训练上可一定程度上替代真实数据集。然而,目前的虚拟数据还远不足以完全替代真实数据并广泛应用于深度学习的模型训练,如何生成高逼真度且具有丰富内容变化的虚拟数据集还有待于进一步研究,其各个关键成像因素对于最终检测结果的影响机理尚需进一步探索。相比于2D包围盒的标注,在图像数据上进行3D包围盒的标注更加困难。虚拟数据则可进行自动的3D包围盒标注,并且标注结果统一且准确。虽然使用虚拟数据集进行3D包围盒状态估计的模型训练具有明显优势,但相关的应用却很少见,如何缩小虚拟数据与真实数据之间的域差,使得基于虚拟数据训练的模型能够在实际应用中获得良好的效果依然是一项挑战。针对上述问题,本文对车辆的2D包围盒检测、3D包围盒状态估计和虚拟数据集的生成与应用等开展了深入的研究。主要研究内容如下:1.本文在原始Faster R-CNN目标检测器的基础上开展了针对车辆2D包围盒检测的优化研究。在区域候选阶段,本文首先通过特殊的网络设计方法生成了多形状的感受野,使得感受野的形状更加适合于车辆2D包围盒检测。然后根据感受野的形状,以成像时的透视效应作为先验知识,优化了锚框的生成方式,使得锚框能够更加精确地覆盖真实车辆2D包围盒,减少了无效锚框的数量。最后,在候选区域分类回归阶段,本文根据候选区域的大小和各个特征图的特征步长,对候选区域进行了分配,使得特征图中所包含的信息量更加适用于最后的预测。相比于传统的未经优化的原始方法,本文提出的方法明显地提升了检测精度与检测速度。2.本文在之前车辆2D包围盒检测的基础上提出了一种新的车辆3D包围盒状态估计方法。本文首先利用当前单目视觉像素级深度估计方法生成深度图,通过几何运算方法生成了伪点云数据,并结合当前基于点云数据的方法对车辆进行3D包围盒状态估计。本文还通过伪点云位置数据进行法向量估计,并将其应用到车辆3D包围盒状态估计;实验证明该法向量数据提升了状态估计的性能。此外,本文还进一步提出了专门用于伪点云信号处理的自注意力模块,对伪点云位置信息、法向量信息与RGB信息进行融合,进一步提升了状态估计的性能。3.本文提出了一种基于域随机化的虚拟数据集生成与标注方法,并使用虚拟数据集全部或部分替代真实数据集用于模型训练。通过基于物理的渲染方法,虚拟图像能够获得较高的逼真度。同时本文采用域随机化方法将影响较大的成像因素参数在一定范围内进行随机化处理,以丰富虚拟数据集的变化,避免模型的过拟合现象。真实感虚拟数据与非真实感虚拟数据都被引入以发挥各自不同的优势。为验证本文提出的方法,本文设计了一组以同一车辆2D包围盒检测算法为测试基准的对比实验,结果表明本文提出的虚拟数据集相较于其它虚拟数据集有着明显的性能优势。此外,本文还详细分析了各个成像因素的随机变化对最终检测结果的影响,以及在使用虚拟数据集进行预训练然后采用少量真实数据集进行微调时模型所能达到的性能。4.结合本文提出的车辆3D包围盒状态估计方法与虚拟数据集,本文进一步研究了基于虚拟数据集的3D包围盒状态估计方法。由于源域虚拟数据集与目标真实数据集之间有着明显的域差,使用虚拟数据集训练出的网络模型在实际测试中通常难以获得良好的性能,这个问题在3D包围盒状态估计中尤为突出。本文一方面提出了对原始虚拟数据进行增强处理的方法,使得模型能够学习到可以对抗干扰的特征;另一方面提出了在特征提取阶段进行无监督对抗训练域适应的方法,对齐源域与目标域的特征分布,从而提升了基于虚拟数据集训练模型的性能。整个过程不需要真实数据集的3D包围盒标注。
其他文献
近年来,随着全球性宏观经济形势的波动,各国物价水平呈现出持续走弱或高涨的情况。这一经济现象使得学术界更为集中地关注了物价波动中外部冲击的作用。本文从物价波动中的来
研究了从药食两用植物栀子中提取熊果酸的工艺,通过单因素实验和正交实验及方差分析,结果表明:在85.4℃水浴中,以90%乙醇水溶液为提取液,液固比15:1,回流提取2次,每次提取2.5h,熊果酸的浸
音乐教育的非音乐性是指在音乐教学中违背音乐的本质特征,忽略和淡化音乐的根本价值功能,湮没了音乐教育的教学规律和学科特点的现象。这些问题的产生源自于片面理解音乐的本质
中外对私有财产刑法保护在立法模式、保护对象及保护手段等方面均存在一定差异,我国现行刑法对私有财产保护尚有不足之处.在我国刑法中宜将无体物、财产性利益的保护作出明文
<正> 汪奠基先生(1900~1979)原名三辅,号芟芜、山父等。湖北鄂城人。他是我国现代知名的逻辑学家。汪奠基先生是最早著书向国内传播现代逻辑的中国学者之一早在1927年,年轻的
综合考虑品牌延伸各要素功能和属性的相互联系和制约,对涉及品牌延伸的众多财务指标和非财务指标进行综合分析和评价,从而通过品牌延伸有效性评价指标体系,将DEA方法引入到品
目的:为控制巴中栀子的质量,建立高效液相色谱法测定巴中栀子中熊果酸含量的方法。方法:采用高效液相色谱法,以熊果酸为化学对照品,固定相:Ultimate^TM C.8键舍硅胶柱(4.6mm&#215;250m
铅锌尾矿养分含量低下、物理结构差、重金属含量高以及重金属复合污染等因素已构成金属矿区生态修复的重要难题。针对铅锌尾矿污染的特点,介绍了几种主要的铅锌尾矿修复技术:
域名作为互联网关键基础资源之一,网站建设、邮件服务等均依赖于域名。由于域名的重要性和广泛应用,其经常被攻击者用于网络钓鱼、网络博彩、传播淫秽色情等非法用途。本文将这些被用于非法用途的域名称为非法域名。减轻非法域名危害的首要方法是及时发现并对其进行管控,因此,如何挖掘非法域名及其组织成为当前的研究热点,并且具有重要的理论意义和研究价值。非法域名挖掘包括非法域名发现和非法域名检测两部分工作,其中发现工
本文论述了湖南茶叶的三大优势;同时指出了湖南茶叶产销上存在的几个问题,提出了茶叶开发工程的近中期目标和战略措施以及调减税赋、鼓励出口、搞活内销、巩固边销等政策保障措