论文部分内容阅读
近年来,半监督学习成为机器学习领域中的研究热点,并越来越受到国际机器学习研究者的关注。其理论研究也越趋成熟,并且开始逐步应用于实际问题。
本文首先对半监督学习的相关背景知识进行了介绍,并回顾了几种经典的半监督学习算法,其中更详细介绍了目前半监督学习领域的热点——基于图的半监督学习算法。在回顾几种重要算法的同时,本文还对基于图算法的相关问题进行了探讨,如图的构造,图核的转换以及不相似信息的处理等。接着重点描述了本文的主要工作。由于在基于图的半监督学习中,类标签的数目和分布位置都会对算法的性能产生很大影响,基于此,本文尝试将不受标签影响的聚类分析算法同基于图的半监督学习算法相结合以减少初始标签数目和分布情况所带来的影响。另外,鉴于聚类算法聚类方向的不确定性,为减少这种不确定性,本文引入了与半监督学习密切相关的主动学习。综合上述思想,本文提出一种结合基于密度的聚类算法(OPTICS)和主动学习的基于图的半监督学习算法SOPA,并进而给出该算法的一个框架。实验证明,本文提出的算法能够有效减少初始标签数目和分布情况所带来的影响,使得基于图的半监督学习算法对初始标签的鲁棒性更好。