【摘 要】
:
针对高维数据集,采用局部稀疏差异和局部密度差异的度量因子,给出一种相关子空间中的局部离群数据挖掘算法.该算法根据K最近邻(K-NN),确定数据集中各数据对象的局部数据集,并
【基金项目】
:
国家自然科学基金项目(61272263)资助
论文部分内容阅读
针对高维数据集,采用局部稀疏差异和局部密度差异的度量因子,给出一种相关子空间中的局部离群数据挖掘算法.该算法根据K最近邻(K-NN),确定数据集中各数据对象的局部数据集,并依据属性值的稀疏因子生成全局的稀疏因子矩阵和局部稀疏因子矩阵,从而有效地反映了数据对象的局部稀疏程度;根据局部稀疏因子矩阵,计算属性维对应的局部稀疏差异因子,并确定数据对象对应的子空间定义向量,从而体现了具有任意性相关的相关子空间;如果数据对象存在相关子空间,则采用高斯误差函数体现相关子空间中各数据对象的局部密度差异,有效地降低了"维灾"的影响,使得离群数据的度量与相关子空间的维度无关,并能够度量相关子空间的数据对象,否则设置数据对象的局部密度差异为0,表明其为正常数据;选取局部密度差异(离群程度)最大的若干数据对象作为局部离群数据;最后采用UCI和恒星光谱数据集,实验验证了该算法的有效性.
其他文献
目前,针对嵌套式数据集上的高效查询处理已成为Web数据检索的一个重要任务.不同于传统信息检索,嵌套式数据集既要存储数据又要存储结构,导致了针对该类数据集查询的低效性,特
厘清意识形态概念的流变,是开展意识形态研究的前提和基础。特拉西最早明确提出并正式使用了意识形态概念;马克思、恩格斯、列宁、葛兰西等马克思主义者从不同的角度对意识形
深基坑土钉墙支护结构是近年来发展起来的一种新型的挡土技术,由于其经济可靠而且施工快速简便,已经在许多国家得到迅速的发展和应用。尽管目前国内外对土钉墙支护技术的研究
Al-Mg-Si合金是一种典型的时效硬化型铝合金,但传统的工艺还不能充分开发Al-Mg-Si合金的时效硬化潜力,尤其经过自然时效的Al-Mg-Si合金,最终人工时效时获得的强度增加很小。
目的分析南宁市道路交通伤害发生的时间分布情况,为道路交通伤害的预防和控制提供参考依据。方法利用广西公安厅交警总队提供的南宁市道路交通伤害数据,采用描述性研究的方法
文章先阐述不确定性环境下领导者战略选择行为理论模型,之后从环境的不确定性出发,分析了环境不确定性的定义及其程度。给出了相应情况下,企业战略制定选择的原则和过程,并且结合
目的研究以培养自主学习能力为核心的授课形式对生物化学与分子生物学课程教学效果的影响。方法选择包头医学院2014级临床本科1—5班学生为对照组(211人),2014级临床本科6班
作为一名商人兼业余文人的海岩,两种身份他扮演的同样完美,为当代文学作了一个表率。他用公安题材写爱情,将荡气回肠的爱情写得一唱三叹,迂回婉转,而爱情的一唱三叹表现了故
<正> 笔者运用中医辨证论治,治愈妇女不孕症4例。现报道如下: (一)肝郁血虚张某某,28岁。工人。1981年8月5日初诊。患者婚后4年余未孕,多次求医罔效。妇科检查,否定绝对不孕
目的探讨卵巢良、恶性肿瘤组织中人端粒酶逆转录酶(hTERT)启动子DNA甲基化的表达差异。方法收集15例卵巢恶性肿瘤患者术中新鲜肿瘤组织标本,设为实验组;另取15例卵巢良性肿瘤