论文部分内容阅读
高斯过程是一种随机变量的集合,集合中任意数量随机变量的组合服从联合高斯分布。高斯分布是由均值函数和协方差函数唯一确定的。一个高斯过程对应着一个协方差函数,也就是核函数。怎样选择协方差函数是训练过程的关键。一个常见的做法是将协方差函数用参数的形式来表示,并在训练过程中调节参数。经典的做法包括最优化方法,如标量共轭梯度法;以及采样法,如混合蒙特卡罗方法。它们都能有效地得到比较理想的协方差函数。高斯过程模型的主要优点体现在:1)它是一种非参数概率模型,不仅能对未知输入做输出预测,而且同时给出该预测的精度参数(即估计方差);2)可以以先验概率的形式表示过程的先验知识,从而提高过程的模型性能;3)与神经网络、支持向量机(SVM)等方法相比,高斯过程模型参数明显减少,因而参数优化相对容易,且更易收敛。本文针对高斯分类的主要内容有如下几点:1.首先介绍高斯过程基础知识,并概述了两种高斯二类分类下的近似算法:拉普拉斯近似算法和期望传播近似算法,2.分析了拉普拉斯近似算法和期望传播近似算法在分类下的不同影响。考虑到全局核函数和局部核函数的不同特点,我们提出了结合组合核函数的高斯分类方法。组合核函数的优点在于:不同核函数的学习能力和推广能力各有优劣,将不同核函数进行组合可以使得新的核函数即具有良好的学习能力又具有较好的推广能力。3.在高斯二类分类的基础上,提出基于二类分类的多类分类方法。同时把实验结果与支持向量机和拉普拉斯近似化方法下的多类分类进行比较。4.本文从粗糙集和高斯过程各自的特点出发,结合高斯过程和粗糙集提出了一种基于粗糙集的高斯过程分类方法,该方法充分利用了粗糙集在处理消除冗余信息等方面的优势,提高了训练精度以及可以减少高斯过程的计算时间。