论文部分内容阅读
随着科技的快速发展,高维数据广泛地出现在众多科学领域当中,例如基因工程、图像处理、基因芯片、蛋白质工程和金融领域等,而且高维数据收集也越来越方便。作为处理高维数据的工具之一大维随机矩阵的作用已逐渐得以彰显。Spiked模型是由Johnstone(2001)[31]提出的,现已发展成为大维随机矩阵中一个比较流行的模型,而我们所要研究的本质离群特征根正是spiked模型中的一个重要的概念。Spiked模型旨在研究“总体”存在离群特征根(spiked特征根)的情形下,对应离群总体特征根的样本特征根的各种性质,例如样本特征根的相变条件、极限以及中心极限定理等。Spiked模型由最初建立在样本协方差矩阵上,现在已经推广到Fisher矩阵、可分矩阵等其他随机矩阵并且在主成分分析、信号处理、回归分析等方面都有重要的应用。Spiked模型中本质离群特征根对应的样本特征根的极限性质更为特殊,在现实生活中用途也更为广泛。本篇论文中,为了更好地阐述本质离群特征根的概念以及对应的样本性质,首先我们将介绍spiked模型的概念及其在样本协方差矩阵、Fisher矩阵和典型相关矩阵中的理论发展的历程。其次,我们利用spiked模型本质离群特征根在样本协方差矩阵以及Fisher矩阵中的理论,导出最大特征根在备择假设下分布,进而得到Roy最大根检验中功效函数。再次,我们给出了广义spiked Fisher矩阵的定义,并导出了广义spiked Fisher矩阵的spiked特征根对应样本的极限以及极限的相变条件,最后给出广义spiked Fisher矩阵本质离群特征根的估计方法。本论文所研究内容主要分为五章。第一章,我们通过两个现实中的例子引出spiked模型并对文章的符号和结构安排进行说明。第二章,我们介绍一下spiked模型在样本协方差矩阵、可分矩阵、Fisher矩阵和典型相关矩阵下的定义以及回顾一下spiked模型在这些矩阵下理论的发展历程。第三章,首先,我们将介绍信号检测的模型并由此导出Roy最大特征根检验;其次,介绍一下Roy最大特征根检验在多元统计分析中的重要性;再次,利用spiked模型中本质离群特征根的样本在样本协方差矩阵与Fisher矩阵的理论结果得到最大特征根在备择假设下的分布,进而给出了Roy最大特征根检验的功效函数。最后,将我们的结果与现有的理论结果进行比较。第四章,我们将介绍广义Fisher矩阵的定义及其相关的理论结果,然后给出广义spiked Fisher矩阵的定义,导出了广义spiked Fisher矩阵spiked特征根对应样本的极限以及极限的相变条件,最后给出估计广义spiked Fisher矩阵本质离群特征根的方法。第五章,我们将对本篇文章进行一下简单的总结并对未来所要做的工作进行简单的阐述。