论文部分内容阅读
可见光图像在多媒体、机器视觉以及电视制导等领域有着广泛的应用。对图像中目标进行快速准确地探测与识别是可见光成像系统应用研究中非常重要的组成部分。在实际应用中,待探测目标通常仅占可见光图像很小一部分,大量的视觉冗余信息不但对目标探测的准确性和完整性构成挑战还会耗费有限的计算资源;同时探测目标的各种畸变形态也给目标的不变性识别带来困难。为此,本论文对基于可见光图像的复杂场景下视觉显著物体探测及体全息畸变不变光学相关识别方法进行以下几方面的理论和实验研究:在视觉显著物体探测研究中,依据自然图像具有非随机且高度结构化的特性,提出一种基于图像各向异性特性的显著图生成及物体探测模型。模型中,图像各向异性特性由一维加窗离散余弦变换(Discrete cosine transform, DCT)和广义Rényi熵进行表征,同时给出经一维加窗DCT后承载不同方向信息的Rényi熵图计算方法。对Rényi熵图功率谱在重对数尺度上加以分析,发现Rényi熵图不但适用于幂次定律(power law),而且其功率谱曲线还具有冗余与显著成分可分离结构。据此,在对冗余信息与显著信息进行分离的同时,进一步提出相应的显著图生成方法。最后利用种子生长算法完成对显著物体的探测。实验表明,该模型可在复杂背景下准确地探测到图像中的视觉显著物体。针对现有显著物体探测模型生成的显著图内显著物体边界不清晰,复杂背景得不到有效抑制这一状况,提出一种基于图像信息量测量(Information contentmeasuring)的非监督式视觉显著物体探测方法。通过寻找联合空间范围表示的局域密度最大值使得输入图像中那些空间距离相近又颜色相似的像素形成同质区域,由此对输入图像进行像素聚类。利用设计出的金字塔级数确定方法,由聚类后图像创建二值高斯金字塔。针对金子塔内各个尺度子图像,给出基于伪Wigner-Ville分布(pseudo-Wigner-Ville distribution, PWVD)和Shannon熵的图像信息量测量方法,并由此获得多尺度信息量图(Information content map)。设计出一种可以准确描述显著物体形态的显著图生成方法。从定性与定量两个角度与现有方法进行对比测试,该方法都具有较好的探测准确性与完整性。依据特征整合理论(Feature integration theory, FIT),提出一种基于图像视觉特征的显著物体探测模型。该模型初步模仿人类视觉注意机制,利用强度对比度(intensity contrast)、色彩梯度(color gradient)和方向性熵(oriented entropy)三个图像显著特征分别模仿人类视觉系统的强度、颜色和方向这三种初级视觉特征,并从局域、区域、总体三个层面对视觉显著物体加以描述。利用提出的非线性自适应特征整合方法对计算得到的三种特征图进行整合得到最后的显著图。该模型生成的显著图具有较强的显著物体与背景对比度。无论是探测结果的准确性还是完整性,都要优于现有的经典模型和前面两章提出的方法。针对体全息光学相关识别系统难以对可见光成像系统探测到的显著目标的各种畸变形态做出正确判决的现状,提出一种基于形态学和空间域综合鉴别函数(Synthetic discriminant function, SDF)的畸变不变识别方法。通过从宏观和微观两个角度对影响系统不变性识别能力的因素加以分析,结合形态学算法特性,提出一种可以较好提取目标边缘信息,抑制模式依赖行为(pattern-dependentbehavior)的形态学算法。以目标的边缘模式建立畸变图像库,结合现有的SDF方法,合成出旋转与尺度畸变SDF滤波器。实验表明该方法可对目标较大范围内旋转与尺度畸变进行有效的不变性识别。