论文部分内容阅读
高斯过程(GP)是一类非常重要的机器学习模型,多个高斯过程用门限函数组合成高斯过程混合(GPM)模型,此模型适用于大批量、多模态数据的回归预测。本文主要研究了高斯过程混合模型及其改进模型在时间序列多模态预测中的应用,具体研究工作如下:(1)经典高斯过程混合模型的混沌时间序列多模态回归预测传统预测模型将样本作为一个整体进行预测,忽略了样本的多模态特征这一重要信息。高斯过程混合模型是一种有效的预测模型,与传统模型不同的是根据样本多模态特征对样本进行“分而治之”。GPM模型的具体实现方法是将样本根据自身特征分类,每一类样本由独立的高斯过程模型训练,从而减少了协方差矩阵运算,精确的描述了多模态数据,提高了预测的准确度。选取了两组混沌时间序列Mackey-Glass、Rossler验证GPM模型的有效性,并与经典预测模型SVM、RBF作对比。实验结果表明选取合适的嵌入维数和时间延迟,GPM模型的预测效果要好于其他模型。(2)稀疏高斯过程混合模型的混沌时间序列多模态回归预测经典高斯过程混合模型相比于传统预测模型有预测精确度高、算法复杂度低的特点,但对于数据量较大的样本,稀疏高斯过程混合模型(Sparse-GPM)比GPM模型有更快的运算速度。Sparse-GPM模型是在GPM模型的基础上改进,将GPM模型的每个高斯过程用稀疏高斯过程代替,即用少量的输入样本(伪输入)替换原有输入样本,使得模型运算量减少。用Lorenz、Chua混沌时间序列验证了稀疏高斯过程混合模型,在预测结果中展现了模型的多模态预测方式,并将此模型与GPM模型的其他两种学习方法LooCV-GPM模型、Variational-GPM模型作了对比。Sparse-GPM模型在提高运算速度上有很明显的效果,并且在抗噪性能上也表现出一定的优势。(3)高斯过程混合模型在金融时间序列回归预测中的应用金融时间序列反应金融市场的内部规律,复杂且容易受市场的影响,金融时间序列的特殊性决定了序列的预测难度。鉴于GPM模型和Sparse-GPM模型的多模态预测方式,将这两种模型应用在人民币外汇汇率、标准普尔指数、上证某股票价格和全国居民消费指数这四种金融数据的预测上,并且将其与GP模型、SVM模型、RBF模型、LooCV-GPM模型、Variational-GPM模型的预测效果进行对比。实验结果表明Sparse-GPM模型、RBF模型的训练速度较快,GPM模型、SVM模型在预测精度上大体好于其他模型。