论文部分内容阅读
作为计算机视觉重要研究内容的图像检索、图像分类、目标检测等技术都离不开特征提取与描述环节。好的特征提取手段及其描述方法,能够有效地提高图像检索、分类、目标检测和识别性能,而选择什么样的特征往往和具体的应用相关联。因此,特征提取与描述技术一直以来都是计算机视觉领域的研究热点之一。本文聚焦于图像分类中的特征提取技术,分别从图像的空域、梯度(包括梯度模和梯度方向)和频域设计了三种特征提取方法,即:梯度方向和梯度模矩阵、自相关直方图和局部相位模式,分别从图像中提取纹理特征、结构轮廓特征和模糊不变的相位特征,实现纹理图像、图像中行人/非行人和模糊图像的分类。灰度共生矩阵能够描述特定方向上间隔一定距离像素间的空间相关特性,但是提取的纹理特征不够精细和全面。图像纹理通过像素灰度绝对值表现出来,像素间的梯度既反映像素值变化的幅度,又反映像素变化的方向,不失为描述图像纹理的新手段。本文从图像的梯度出发,通过将梯度方向和梯度模值再量化后,根据梯度方向再量化后的取值范围,利用梯度模构建若干个梯度方向和梯度模矩阵,最后从上述生成的矩阵中提取一系列统计特征描述纹理图像。在对不同材质、不同尺度、不同角度和不同光照成像条件下纹理库中图像进行分类的实验中,梯度方向和梯度模矩阵和其它纹理特征提取算法相比较,分类精度较好。利用梯度信息包含梯度方向和梯度模的HOG特征,经过训练后可以得到目标近似的轮廓特征。受此启发,本文研究了一种从自相关信息中提取目标近似结构轮廓信息的特征提取方法。首先我们利用图像像素周边区域的自相关值获得局部区域内各像素周边区域的自相关平面,然后将自相关平面转换到划分为若干区间的极坐标系下,极坐标系的若干个区间由取对数后的极值和极角均分得到,计算自相关平面落在各区间的值,获得描述图像局部区域内各像素的局部自相关特征,最后按照保留最大值的准则,对图像局部区域内各像素对应的自相关平面进行合并,获得图像区域的自相关直方图。本文选择图像中的行人分类为应用背景开展了所提出特征的实验检验工作,先研究了自相关直方图特征选取不同参数时行人分类精度的变化,然后在相同的行人图像库上,比较了自相关直方图特征法和其它特征提取方法的行人分类精度,实验显示自相关直方图特征提取方法行人分类精度较好。针对实际应用中获取的可能是模糊图像的问题,本文提出了一种具有模糊不变性的特征,以利于提高模糊图像的分类性能。本文将每个像素周边区域的图像转换到频域后,证明图像模糊前后,图像在频域中相位正切值保持不变,通过提取图像在频域中相位正切值的变化规律----局部相位模式,最后将空域图中局部区域内各像素的局部相位模式构成局部相位模式直方图作为描述图像的特征。在不同模糊程度的纹理图像和人脸图像分类试验中,与其它提取模糊不变特征方法相比,本文的方法分类性能均最好,受图像模糊影响的程度较小。