论文部分内容阅读
函数型数据分析(FDA,functional data analysis)最大的特征是它所针对的分析和处理对象是随机函数,而不再是以数据表等形式出现的离散型数据,经过不断的发展,函数型数据分析已经在气象学、生物学、考古研究、医学研究、金融学和犯罪行为学等研究领域有了较为广泛的应用。函数型数据分析(FDA,functional data analysis)主要处理光滑函数空间内的随机变量,即研究对象为函数曲线。在函数型数据分析中,函数型主成分分析(FPCA,functional principal data analysis)是最为常用的技术之一。本文的主要目的是对函数型主成分的分析以及对基于函数型主成分分析的函数型自回归模型(functional self-regression model)的探讨。函数型主成分分析类似于多元统计中的降维处理手法,对观测阵的协方差矩阵进行正交分解和线性变换。函数型自回归分析是在函数型主成分分析的基础上的进一步延伸,以各个主成分为自变量对研究对象进行回归预测分析。 在本文中,我们对河南省的1960-2000年的降雨量数据进行了研究分析。使用FPCA对原始数据进行分析,以降低维度和提取主成分为主要目的。对提取出来的主成分分析可以清晰地观测到研究对象随时间变化的时变特征。然后以提取的函数型主成分为随机变量,对研究对象进行函数型自回归分析,根据自回归模型给出预测结果。由于各个主成分之间的正交性,多重共线性问题不再存在,得到的回归模型的参数更为稳定;另外,由于函数型自回归建模选取的前几个主成分已经尽可能多的包含被解释变量的变化信息,所以很好的解决了普通回归分析中原始信息丢失的问题。值得注意的是,本文引入了一种简单有效的异常曲线检测的方法,对研究对象中一些异常样本进行剔除,提高了模型的预测准确性。在本文中,我们主要将函数型自回归模型应用于降雨预测,实际上我们构建的是一种函数型自回归模型的分析框架。这个分析框架适用于几乎所有类似的函数型数据。