基于数据深度的判别分析

来源 :南开大学 | 被引量 : 0次 | 上传用户:chenzulong198867
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去二十年时间里,数据深度在多元数据分析领域里正成为越来越有用的工具,并得到了广泛的应用.统计深度的主要思想是在高维情况中,根据深度函数对给定的数据集或是分布得到一个中心向外的数据排序,并能由此定义出高维中位数的概念. 本文首先在第一章介绍了一些最常用的统计深度函数的定义,以及基于这些深度函数得到的分布位置参数的估计的稳健性.在第二章中我们改进了投影深度最深点的近似算法并提出了SPD(Spatial)深度最深点的近似算法,并且通过数据模拟可以看出这些算法的精确度较高,而且计算复杂度也不高.我们在第三章第二节中通过用稳健的投影深度中位数和SPD中位数代替样本均值改进了经典的LDA和QDA判别法;另外在第三节中还把投影深度和SPD深度引入到最大深度判别理论中,相应得到的判别法对判别函数的形式和总体的概率分布都没有任何要求.而最后一节我们用一些模拟的带污染数据集来检验这些基于深度的判别法则的表现,证实了它们相对经典判别法有着更强的稳健性.
其他文献
本文提出的黑匣子及黑白匣子系统模型,是从统计学在集成电路设计以及诸多工业设计的应用中抽象出来的一个模型,对于黑匣子模型,需要找出响应变量与诸数量因子之间的数量规律,利用
本文分四部分对等价性理论做了介绍,集中讨论了两体问题的等价性模型、控制Hamilton系统和控制Lagrange系统的等价性和约化的关系以及最优控制问题的反馈等价性和约化的关系。
增生映象和伪压缩映象概念是在上世纪六十年代人们研究Banach空间中的非线性发展方程解的存在性问题提出来的。我们知道,许多工程和物理中的问题都可以抽象为上述非线性发展方
这篇文章考虑的是一个随机利率风险模型,其基础过程是一个复合泊阿松过程,而利率过程是另一个带正漂移的复合泊阿松过程。本文主要推导出了三个重要的精算量:破产时间,破产前瞬时
随着社会的不断进步和国民经济的持续发展,人们对于建筑的装饰和美观有了更高的要求,无论是外表还是建筑内部都需要进行装饰。新的形势给建筑装饰施工带来了新的挑战,因此,必须加
期刊