论文部分内容阅读
无人驾驶和增强现实是两个热门的研究方向,并已实现了初步的商业化。对无人驾驶来说,图像深度估计能够显著降低无人驾驶的硬件成本和应用门槛;对增强现实来说,图像深度估计能够提高融合现实世界和虚拟世界的准确程度。红外线是一种不可见光,其具备显著的热效应和穿透能力。红外图像的成像机制较为特殊,其缺乏空间感和立体感。因此对红外图像进行深度估计将有助于增强对图像的理解。 本文的主要研究工作如下:(1)根据红外图像的成像特性,对深层卷积神经网络(DCNN)的结构进行了调整,并将其运用到单目红外图像的深度估计中,效果优于现有的机器学习方法;(2)但由于计算能力有限,用DCNN直接从红外图像中提取深度特征需要花费大量时间,所以本文提取人工特征用来训练DCNN。实验表明,相比较其它特征,纹理信息更适合用于训练DCNN进行深度估计;(3)为了提取更有效的特征用于深度估计,本文将深度学习网络与浅层学习网络相结合,分别构建了基于单通道和基于多通道的深度估计模型。实验结果表明,两种方法都可以提高深度估计的效果;(4)本文将近年来新提出的深度学习架构PCANet用于红外图像的深度估计,并分别采用灰度特征和纹理信息训练网络。实验结果表明,用纹理信息训练的PCANet网络的深度估计效果更好。