高维数据的异常检测研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:LZLZ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常数据检测问题是统计模型和估计领域中很重要而且很完整的一个方面。当处理高维数据,即数据的维数和样本个数一起增长的数据的异常检测问题时,由于样本协方差矩阵的逆矩阵的存在性问题,基于马氏距离的传统方法往往不能使用。因此提出了利用修正的欧氏距离的高维数据异常检测方法。该方法具有标量不变量的性质。在此方法中,介绍了一个新的概念-最小对角线乘积(MDP)估计,并利用此估计代替了传统方法中的最小协方差行列式(MCD)估计。检验所需的临界值由欧氏距离的渐进分布所确定,可使既能够控制第一错误概率,又能稳健地检测出异常数据。此外,在此基础上,还提出了单步改善的检测方法,使得异常检测更加有效。通过模拟,发现了在本文中提出的方法比现有的异常检测方法有更好的结果。最后,我们把本文的方法应用在来自机器学习实验中的实际数据。  
其他文献
无风险利率在资本市场是衡量资本的收益及其风险水平的基准利率。本文从投资组合方法、多因素相关方法以及模仿组合的方法研究了我国三个市场的隐含无风险利率。通过实证分析
利用有限群的共轭类的一些算术性质刻画有限群的结构是有限群理论的重要课题,也是有限群理论研究的一种重要方法.共轭类的长度和个数是有限群的重要的算术量,本文主要研究有限
研究了Hilbert空间H中的关于字典的贪婪算法的效率。改进了关于μ-相干字典的正交贪婪算法的Lebesgue型不等式,得到了正交贪婪算法可以提供接近最优的逼近,即当1≤m≤1/18μ时,
现代科学技术与社会经济的很多领域都遇到高维数据分析和监测,它的研究与应用价值也在不断扩大。本文主要考虑高维数据的独立性检验问题,所谓高维数据是指样本的维数和样本量本
非线性Schr(o)dinger方程是一类定义在d维空间的的复值发展方程。我们将研究这类方程的初值问题。特别的,我们主要关心方程的解的存在性,唯一性以及稳定性。我们将通过Duhamel
本篇论文讨论如何将局部极小极大正交(LMMO)方法应用于Banach空间中,并且将LMMO方法应用于解决非合作型椭圆偏微分方程组的Eigenpair问题。应用Rayleigh quotient公式,使得求解
分数阶微积分被称为现实世界和数学理论完美结合的一种崭新的数学工具,被广泛应用到粘弹性力学、统计与随机过程、信号分析处理等各个不同的领域.分数阶微积分方程比整数阶微
两性分枝过程的概念最早是由Daley在他1968年的《ExtinctionconditionsforcertainbisexualGalton-Watsonbranchingprocesses》一文中给出。自此以后国内外很多的专家和学者都
在2006年,D.Donoho,E.Candès,J.Romberg及T.Tao提出了一种全新的信息获取理论——压缩传感.低采样率的优点使得压缩传感理论一经提出,便引起了学术界和工业界的广泛关注,成为时下
目前,在金融、生物、化学、通讯等多个研究领域中随机微分方程理论都已被普遍地应用.但是在实际生活中,任何领域中都将会出现各种各样随机因素的影响.因此,借助随机扰动参数对微