论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是一种有监督的通用高效机器学习方法,目前在许多领域得到成功的应用,然而对于一些实际的机器学习和数据挖掘问题如网页分类、医疗诊断、垃圾邮件过滤、图像处理等,很难得到大量的有标记训练示例,可用的往往是大量的无标记示例,用SVM来求解这类问题并不能发挥其优势。这类问题常常通过半监督学习(Semi-supervised Learning)方法如协同训练(Co-training)、直推学习(Transductive Learning)等技术来解决,因此将SVM与半监督学习方法相结合是一个值得深入研究的方向。本文将SVM与半监督学习方法相结合并以协同训练技术为基础,提出了一种基于差异性度量的协同回归支持向量机训练算法,称为协同支持向量回归机(Co-training Support Vector Regression,Co-SVR)。本文的研究工作主要包括以下内容:(1)对半监督学习方法进行了系统的分析,并介绍了几种经典的半监督学习方法。(2)提出了一种基于差异性度量的协同回归支持向量机训练算法,同时提出协同训练中同质学习器和异质学习器差异性度量方法,使协同训练的两个学习器能保证获得良好的泛化性能,并具有较高的协同训练效率。(3)在标准数据集、UCI数据集和真实的空气质量数据集上对本文提出的学习算法进行了验证,获得了良好的预测结果。本文提出的基于差异性度量的协同回归支持向量机训练算法,将机器学习中强大的学习方法SVM与半监督学习技术相结合,拓展了SVM的应用领域,所取得的研究成果不仅丰富了SVM的理论和方法研究,而且对于实际问题具有直接的应用价值。