基于邻域粗糙集的混合型属性离群点检测方法研究

来源 :四川师范大学 | 被引量 : 8次 | 上传用户:xilotola
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点检测是数据挖掘领域重要的研究方向之一,其目的是找出在数据集中其行为很不同于其他数据对象的对象。它在入侵检测系统、信用卡欺诈、有趣的传感器事件、医学诊断、执法和地球科学等领域都具有十分重要的应用。然而,传统的几何距离法不能有效处理符号型属性数据集,经典粗糙集方法又不能有效处理数值型属性数据集。针对这些问题,本文以邻域粗糙集为统一框架,利用其对问题的粗糙表示与计算能力,重点研究了基于邻域粗糙集的混合型属性离群点检测方法问题。论文的主要工作创新点如下:(1)利用有序二分和近邻搜索思想改进了计算单属性邻域基本算法,它降低了传统无序逐一比较算法的实际计算时间复杂度。(2)为了有效处理混合型属性数据集,通过研究并优选混合型距离度量和具有自适应的标准差邻域半径,以构建新型的邻域信息系统。(3)基于前述工作基础,在邻域粗糙集中提出了基于邻域值差异度量、基于序列和基于邻域信息熵的三种离群点检测新方法。理论模型和UCI数据集实验均表明,三种新型算法能够有效处理符号型、数值型和混合型属性数据,且具有较好的适应性和有效性。
其他文献
传统BP算法存在着收敛速度慢,易陷入局部极小值等特点,这些缺点的存在使得BP神经网络的应用受到了很大的限制。分布估计算法是进化领域新兴的一种算法,有着很强的全局搜索能
在当代的生活之中,食品安全成了越来越多的人们所关注和在担心的问题。如今的社会之中,食品安全问题层出不穷,在提倡绿色食品、健康食品的今天,还是有许多食品存在着严重的安全隐
本文对Hermite矩阵空间上的保秩导出映射进行了研究。矩阵保持问题的研究是国际上矩阵论研究中一个十分活跃的领域,且在计算、统计、方程等许多领域有重要应用价值,在该领域研
现实中复杂的系统往往都是非线性的,可以看成许多子系统耦合而成。在耦合结构、耦合方式等因素的参与下,整个系统表现了丰富的动力学行为。研究这些行为不仅可以帮助人们理解自
近年来,在伴随现代社会的快速变迁,家庭结构的变化,环境的多样化,引发越来越多的学生产生厌恶看书阅读.关注学生的精神健康,作为灵魂的工程师,培养学生良好的心理,促进其人格
学位
本文讨论形如ut=F(u,ux,uxx)的非线性偏微分方程由可积系统{vx=P(v,u,ux)vt=Q(v,u,ux)定义的B(a)cklund变换u→v分类问题,证明了这样的非线性偏微分方程只能是Burgers方程ut=uxx+2uu
目前在我国的上市公司协议收购制度中,对中小投资者利益保护制度的不完善仍是突出问题之一。因此,应坚持加强中小投资者利益保护和保障市场长远健康发展的基本理念,规范协议
本学位论文主要研究子群的M-可补性对有限群构造的影响,子群H称为在群G中是M-可补的,若存在G的子群B,使得G=HB,且对于H的任意极大子群H1,H1B为G的真子群.进一步,若B是G的正规子群,则
本文主要研究三维变系数椭圆方程二次奇妙族有限元方法的超逼近.借助投影型插值算子的性质得出了二次奇妙族元第一型弱估计.另外,给出了离散导数Green函数的W1,1半范估计.最后,我们