论文部分内容阅读
数字图像的分类问题是图像处理中尤为重要的研究内容,目前关于图像分类的研究大多集中在专业图像领域,如遥感图像和医学图像等。这些图像通常分辨率较低、多为灰度图像、纹理构成较单一,并且数据量较小。而现阶段对于人类生活中接触最多,应用最广的复杂自然图像的研究则相对较少,所以本文将关注点放在自然图像上,研究内容为基于SVM-KNN的特征自适应加权自然图像分类,针对这一内容文章主要进行了以下三方面的研究工作:(1)研究了目前在模式识别系统中常见的分类算法,包括:贝叶斯分类算法,K最近邻分类算法,支持向量机、神经网络。系统介绍了每一种分类算法的基本思想,分类步骤,适用范围等方面。并对每一种分类算法的优缺点进行总结对比,从而结合本次实验的具体需求,选择采用组合分类器SVM-KNN,以便使其优势性能得到互补,提高分类精度;(2)研究了当前模式识别系统中常用的底层视觉特征提取办法。包括:表征颜色特征的空间颜色直方图、颜色聚合向量描述、颜色矩描述;表征纹理特征的Tamura纹理特征、灰度共生矩阵和Gabor纹理特征;表征形状特征的傅里叶形状描述符、边界特征、几何参数等。详细介绍了每一种描述方法的算法步骤,并对每一种方法进行了具体分类实验。选择提取72维的颜色直方图特征和40维的Gabor纹理特征作为实验中的底层视觉特征。总结整理了几种常见的高维数据可视化方法,将提取的颜色和纹理特征数据用平行坐标表示,发现在类与类间有较强区分性;(3)提出了基于SVM-KNN的特征自适应加权自然图像分类方法,采用SVM-KNN组合分类器即提高了原有SVM分类器的精度,又节约了KNN的运算成本。同时,对其中的K近邻分类器进行改进,一方面考虑到自然图像分类问题中颜色特征和纹理特征的分类贡献率不同,为特征赋予不同的权值。并结合基因遗传算法和梯度下降的迭代算法求得这个最优的权值解,且算法中用户可以根据自己的实际情况改变分类精度;另一方面,用夹角余弦值代替原有KNN算法中的欧氏距离来衡量待测样本和样本之间的相似度。实验数据证明相比于原始单一分类方法,文中的分类算法在平均分类正确率方面提高了2到7个百分点。