论文部分内容阅读
图像语义分析方法是近年来研究的热点和难点,其目的是通过分析图像的低层特征来确定图像的语义标签。基于内容的语义分析方法在图像检索和图像处理领域有着广泛的应用前景,但是由于图像信息丰富而复杂,且计算机与人对图像的认识不同,使得图像中的物体类别信息难以通过数学工具在计算机中正确表达,相关的图像语义分析方法还多处于研究阶段。
基于图像语义分析方法的电子导盲是一个很有意义的研究方向,本文研究了在此应用背景下的图像特征提取方法和分类过程。在众多特征提取方法中,利用特征集来描述一幅图像的方法是其中的一个研究热点。在此基础上的基于空间金字塔匹配模型以及稀疏编码模型的特征提取方法都能有效地描述图像低层视觉特征,提高图像语义分析的准确率,但在这两种模型中,由于采用的了K-Means聚类算法,所以影响了模型的扩展能力,并且基于稀疏编码模型的方法需要耗费大量的时间用于字典的训练。故在本研究中,将密切关系算法应用到字典的构建过程中,大大缩短了字典的训练时间,并且当图像类别数增加时,不需对已经训练好的字典进行修改,而只需将新加类别的字典向量加入到已有的字典中。另外在利用3层AP模型训练字典时,能最大限度地压缩字典中向量数目,降低整个算法的空间复杂度以及算法的扩展能力。
目前常用的分类方法包括基于高斯混合模型的方法和基于支持向量机的方法。根据概率论理论,高斯混合模型可以模拟任意类型的概率分布,但在图像语义分析过程中,为了降低算法复杂度和提高算法准确度,需要寻找一种相对而言类特征较易于描述的特征空间,故本文章就目前常用的几种纹理特征提取方法进行了研究,结果表明,相对而言,利用离散余弦变换方法提取的图像特征更适合于利用高斯混合模型进行图像语义分析。
另外,文章中使用线性支持向量机对利用尺度不变特征变换和稀疏编码方法构建的特征向量进行分类,得到了令人满意的实验结果。