论文部分内容阅读
在过去二十年时间里,数据深度在多元数据分析领域里正成为越来越有用的工具,并得到了广泛的应用.统计深度的主要思想是在高维情况中,根据深度函数对给定的数据集或是分布得到一个中心向外的数据排序,并能由此定义出高维中位数的概念.
本文首先在第一章介绍了一些最常用的统计深度函数的定义,以及基于这些深度函数得到的分布位置参数的估计的稳健性.在第二章中我们改进了投影深度最深点的近似算法并提出了SPD(Spatial)深度最深点的近似算法,并且通过数据模拟可以看出这些算法的精确度较高,而且计算复杂度也不高.我们在第三章第二节中通过用稳健的投影深度中位数和SPD中位数代替样本均值改进了经典的LDA和QDA判别法;另外在第三节中还把投影深度和SPD深度引入到最大深度判别理论中,相应得到的判别法对判别函数的形式和总体的概率分布都没有任何要求.而最后一节我们用一些模拟的带污染数据集来检验这些基于深度的判别法则的表现,证实了它们相对经典判别法有着更强的稳健性.