论文部分内容阅读
形状检测与提取是目标检测领域的关键技术之一,某种程度上代表了计算机视觉的发展水平,具有重要的研究意义和广泛的应用前景。但目标所处的复杂场景给快速鲁棒的形状检测与提取带来了巨大的困难和挑战。阴阳离散点计算是本文提出的一种应对这一困难和挑战的图像分析新方法。本文以复杂场景下线形状、面形状,以及自身具有复杂结构的线形状为研究对象,以对这些形状的快速鲁棒检测与提取为研究目标,从研究需求、方法提出、基本应用、改进应用、增强方法适应性等多个方面对阴阳离散点计算展开了相关理论和技术问题的研究。论文首先对复杂场景下目标检测、形状提取、形状匹配、自然手写文本行分割等图像分析领域面临的困难进行了分析,归纳总结出其共性问题在于所提取的低层次特征不稳定和低层次特征组织起来困难。而粒计算“构建问题的粒结构”和在“粒结构中进行问题求解”的方法论为结构化求解上述共性问题提供了一套理论框架。于是从粒计算的哲学思想和方法论出发,论文提出了特征离散点计算和阴阳离散点计算。特征离散点计算是粒计算在图像分析领域的具体实现与应用,而阴阳离散点计算则是以局部邻域内灰度变化显著与否为显著特征建立起的一种面向复杂场景下形状检测与提取的特征离散点计算方法。针对现有图像分析方法中低层次特征不稳定的问题,论文提出了阴阳离散点采样模型。该模型是一种采用局部自适应闽值的固定网格采样,其采样机制根据韦伯定律建立,因而能够自动适应图像光照变化。模型中体现了对重复性刺激的抑制,因而对噪声、纹理等干扰不敏感,能够自动增强目标、抑制背景。复杂场景中面目标边界和细长曲线结构在阴阳离散点采样图中不再是一些单像素时断时续的不稳定细线,而是由一批离散点聚集而成的稳定条带区域,为后续的阴阳离散点编组带来了很大的便利。针对现有图像分析方法中低层次特征组织困难的问题,论文提出了阴阳离散点编组方法。该方法包括基于中心线编组的形状提取和基于轮廓模板匹配的形状检测两类主要的编组方法。前者通过对阴阳离散点采样图中不同类型条带区域中的离散点特征进行分析,设计出一套基于特征点、直线段、中心线的三层检测系统,能够快速光滑准确地提取出条带区域的中心线及其类型,并通过格式塔法则对其进行聚类获取最终的形状结果;后者则以阴阳离散点采样图作为中间表达增强了场景图的稳定性,通过在阴阳离散点采样图中轮廓模板对应条带区域的方式降低了匹配难度,根据待匹配形状与轮廓模板之间差异变形的不同情况,设计了优选——变形——估计三种模板优化策略。上述编组方法的综合运用,能够满足存在仿射变形时大尺度形状特征的快速检测与提取需求。在基本应用方面,论文将阴阳离散点计算引入货车车厢故障检测系统应用当中。货车车厢故障检测系统拍摄到的图像存在着一定程度的几何变形和较大程度的非线性变形,对场景图中间表达的要求主要是稳定性,即尽可能不受光照变化、斑点噪声、几何变形的干扰。阴阳离散点采样模型非常好地满足了这些需求。论文运用前面建立的各种阴阳离散点编组方法,对货车车厢故障检测系统中相似部件分类和车轮定位等问题进行了深入研究,实验室噪声实验和近三年的现场应用实践证明了上述方法的实时性、准确性和鲁棒性。在改进应用方面,论文对阴阳离散点采样模型进行了改造,提出了增强阳离散点计算方法,并将其引入航拍图像面目标检测当中。首先通过增强阳离散点采样使图像中灰度比较均匀的区域在增强阳离散点采样图中更为显著,然后论文结合面目标检测的实际应用需求建立了特征检索、边界提取、间接获取三种通过增强阳离散点编组检测面目标的策略。相关研究成果在航拍图像中圆形油桶检测和港口舰船检测项目中得到了应用。最后,为了增强阴阳离散点计算的适用性,论文从阴阳离散点计算的大量实践中归纳出了特征离散点计算的实施步骤,并将其应用于自然手写汉字文本行分割当中,提出了一种反馈式分列行投影文本行分割方法。该方法在特征离散点计算的结构化问题求解框架下,通过行分割中特征点的选择、采样与优化,编组与反馈以及行边缘优化四个环节,对实验样本中绝大多数自然手写文本能够得到正确的行分割结果。在HIT-MW中文手写文本库取得与现有最好分割算法相当的结果,并大幅降低了分割算法的时间复杂度。本文对复杂场景下线形状、面形状,以及自身具有复杂结构的线形状这三类形状的检测和提取问题进行了深入的理论研究,详细论述了阴阳离散点计算方法,提出了特征离散点计算方法,并在多个实际项目中进行了检验和完善,为解决复杂场景下的目标检测面临的瓶颈问题,缩小计算机视觉与人类视觉水平之间的差距做出了一定的努力和贡献。