论文部分内容阅读
图像分类是根据图像中反映出来的各自特性,把属于不同类别的图像分类出来的图像处理方法。传统的监督式图像分类算法要求先对所有样本进行标记后,再训练得到分类模型。如今,随着信息社会的快速发展,可获取数据的量级也在不断增大,但为海量的样本进行手工标注则往往需要耗费大量的人力、物力与财力。基于此,本文拟结合主动学习(分类模型质量提升快)与半监督学习(无需手工标注)的优点提出相应的多类图像分类算法,以最大限度利用未标记样本的隐含信息提高分类性能。此外,考虑对海量数据建模的实时性问题,本文不再采用传统的速度较慢的支持向量机,改用基于单隐层前馈神经网络的极限学习机(Extreme Learning Machine, ELM)构造分类模型。相比传统的神经网络学习算法,ELM更简单,且其所有隐层结点上的参数均无需调整,而是随机生成,具有处理速度快,泛化性能强等优点,适用于本文所要处理的海量图像多类分类问题。本文围绕主动半监督极限学习机多类图像分类问题展开研究,主要研究内容包括:(1)图像预处理与分类器建模研究。采用词袋统计模型对图像进行预处理,从图像中提取SIFT特征,并对特征进行K-means聚类得到视觉单词本,再采用向量量化特征编码得到其词频统计直方图,进而得到图像的特征描述,并以该特征向量训练ELM分类模型。(2)结合最优-次优标记(Best Versus Second Best, BVSB)主动学习与基于距离度量的自训练半监督学习的极限学习机算法及其在多类图像分类任务上的应用研究。首先,考虑到上述两类学习算法均需对未标记样本的不确定性进行度量,故在理论分析的基础上,采用非线性变换的方法将ELM在输出节点上的实际输出值转换为近似后验概率表示,进而结合BVSB主动学习算法和基于最近邻度量的自训练半监督学习算法,提出一种适用于多类图像分类的主动半监督极限学习机算法,以保证在手工标注的训练样本尽可能少的基础上,使分类模型的性能得到快速的提升。(3)结合BVSB主动学习与基于流形正则化全局半监督学习的极限学习机算法及其在多类图像分类任务上的应用研究。考虑到前述算法在采用半监督学习时只用到了未标注样本的局部信息,故拟对其进行改进,在每轮主动学习完成后,利用剩余未标注样本的全局信息来进行半监督学习,以进一步提升分类模型质量的改善速率。