论文部分内容阅读
烟雾检测可为早期火警提供重要的线索。基于计算机视觉的烟雾检测技术比基于传感器的检测技术应用范围更广泛,成为了火灾检测与预警领域中一个重要的研究方向。其中单图烟雾识别是烟雾检测的基础任务之一,而烟雾特征表示方法以及识别模型是单图烟雾识别中的关键技术。若能对烟雾的内在结构进行有效表示,将提高烟雾识别与检测结果的精度与可信度,从而增加计算机视觉技术在火灾预警中的应用价值与实用性,并推动特征表示算法与识别模型学习的发展。烟雾的运动、形态、颜色、浓度等属性缺乏稳定性,极易受到燃烧物与环境的影响。烟雾的统一规律难以总结,这使得烟雾底层特征缺乏鲁棒性与表达力,最终导致烟雾识别的误报率偏高。因此需研究能有效保留烟雾内在结构的特征表示方法,同时寻找能提高识别效率的识别模型。一方面,现有研究表明,局部特征表示方法能有效地描述烟雾最稳定的纹理属性。传统局部特征表示方法有如下缺点:(1)依赖于手工设计,对领域先验知识要求高;(2)大多作用于单张图片,特征表达力有限;(3)对多尺度特征、高阶特征等扩展特征的融合方式过于简单,这会带来冗余、增加计算量、降低特征表示的效率。深度学习框架不存在以上缺陷,但缺乏可解释性与灵活性。综上所述,现有特征表示方法难以在表达力、智能性与灵活性间取得平衡。另一方面,基于生成模型的识别方式能保持烟雾的内在结构,并保留结果的不确定性,但未在实际烟雾识别任务中得到应用。本文深入研究单图烟雾识别中的局部特征表示方法。首先通过综述总结出现存问题,再确定以基于学习的方法为解决方案,让算法自动地学习出烟雾的内在、稳定结构来进行特征表示。此外,本文提出了基于生成模型的烟雾识别框架。从特征表示与特征识别两方面提高了烟雾识别的精确度,提高烟雾检测、火灾预警的实用性与推进其工业化进程。本文研究内容分为四部分,前三部分利用学习过程对现有的烟雾特征进行了不同方向的改进。(1)引入学习的高阶烟雾特征学习与表示研究引入学习过程的采样策略和特征表示方法。首先,利用滑动采样获得高阶局部差分,从中学习出采样模型来增加底层特征的紧凑型和降低高阶特征对噪声的敏感性。随后,从采样后的特征中学习出投影模型,利用此模型进行特征中层表示并增加特征的可分性。最终,采用非量化编码为中层特征保留更多统计信息。(2)跨尺度、多阶、多层级的烟雾特征学习与表示研究中高层特征的表示方法,利用学习过程获取跨尺度与多样性的特征。首先,构建尺度空间,利用3D采样窗密集地捕获不同尺度下的局部差分。随后,从所有训练图像的局部3D差分集合中全局地学出投影模型,利用该模型生成更具可分性的多尺度中层特征。接着,利用图内编码捕获局部纹理分布,用图间编码对不同投影方向的纹理分布建模,以此实现中层特征的多阶表示。以上特征表示框架可堆叠为层级结构,该结构可将烟雾图表示为多阶、多层级、跨尺度的局部特征。(3)多方向、多尺度的稳定特征学习与表示研究如何利用学习过程提取烟雾的稳定成分,以及如何处理多尺度与多方向特征表示方法中存在的问题。首先,利用Gabor滤波获得烟雾的多尺度与多方向响应。随后,提出跨通道的浓缩方法获得不随尺度与方向变化的成分。最后,采用跨通道与通道内的编码方式获得具有光照不变性与旋转不变性的特征。此外,为底层特征提出两种扩展方法:一是用基于3D卷积的全局学习增加特征的可分性,二是对稳定成分的索引进行编码来取得烟雾纹理的全局结构。以上特征表示框架经过堆叠便可形成基于Gabor卷积核的前向网络,该网络可将烟雾图表示为多方向、多尺度、多层级的稳定特征。(4)基于生成模型的高效烟雾识别框架对以高斯过程回归(GPR)为代表的生成模型进行了研究,将非线性的特征低维表示方法与GPR结合构成新的烟雾识别框架。此方法去除了烟雾特征间的线性相关性,同时保持了嵌在烟雾中的低维流形结构,最终提高了烟雾识别的速度并降低了识别误报率。