论文部分内容阅读
二十一世纪以来,伴随着科学技术的迅速发展,人们每天都要处理大量的信息数据(例如图像、视频以及文档资料等)以便进一步地分析和研究。图像作为常用信息的载体之一,在人们接收、传递和处理信息的过程中起着至关重要的作用。所谓图像分割是指将图像中具有相同颜色、亮度、纹理等“特殊意义”的不同区域分割开来,并使这些区域互不相交,同时每个区域应满足特定区域的一致性条件[1]。现有的图像分割技术在实际使用过程中存在着较大的局限性,如分割算法复杂度高、鲁棒性较差、人工干预过多、复杂背景下分割目标不准确等,因此,图像分割是机器视觉技术中的难题之一,也是近年来国内外学者研究的热点。伴随着数字图像采集设备的迅猛发展,当前数字图像的分辨率越来越高,图像的尺寸也越来越大。因此,一种快速、高效的图像分割方法显得尤其重要。本文的主要研究内容是基于图论与谱聚类的图像分割方法,利用改进的离散余弦变换(Discrete Cosine Transform,DCT)对图像预处理得到基于DCT的方形结构块(DCT-SBS),使用得到的DCT-SBS构造图节点,然后提取每个节点的颜色信息、纹理信息以及位置信息等,利用新的多特征融合方法计算图边权值,最后使用本文提出的基于DCT-SBS的图像分割方法实现图像分割。本文的具体工作如下:1.介绍了基于图论的图像分割基本方法,针对传统分割方法使用图像像素构造图节点时计算复杂度随着节点增加大大增加的问题,本文使用DCT-SBS构造图节点,不仅降低复杂度,同时节点保留了原始图像数据的结构信息。2.在计算图边权值时,本文提出了新的基于压缩域下多特征信息融合的计算方法,有效地将颜色信息、纹理信息以及位置信息用于计算图边权值。3.在传统谱聚类算法的基础上提出了一个通用的谱聚类算法框架及其求解过程,且该框架可以通过调整参数转变到不同的图像分割算法。4.将本文提出的算法与8种不同的图像分割算法进行实验对比。为了验证本文提出的图边权值计算方法的有效性以及谱聚类算法框架的综合性能,本文在Corel1000数据集、MSRA10K数据集上对本文提出的分割算法进行了验证,实验结果表明,本文提出的图像分割方法具有较高的分割准确率以及算法效率高等特点。在现实情况下具有一定的理论意义和应用价值。