基于聚类离群因子和相互密度的离群点检测算法

来源 :计算机集成制造系统 | 被引量 : 0次 | 上传用户:tlswedu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点检测作为数据挖掘的一个重要方面,有着很多的应用,近些年对离群点检测的研究很活跃,很多离群点检测算法被提出来,包括基于聚类的离群点检测算法,但是大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集选择一个合适的参数十分困难。为了解决这个问题,本文将NOF算法的自然邻居搜索算法和DDC算法相结合,提出了一种基于聚类离群因子和相互密度的离群点检测算法,该算法使用相互密度和γ密度构造决策图,把γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子COF找出离群聚类边界检测离群点,该算法不需要人工输入参数。最后在模拟数据集和真实数据集下进行实验,验证了算法能很好的进行聚类和离群数据的挖掘。
其他文献
目的探讨临床多站式考评(OSCE)模式应用于骨科住院医师规范化培训分期考核的效果。方法以2015~2016年在广西医科大学第二附属医院骨科参加住院医师规范化培训的40名学员为对
她是颁发诺贝尔奖的国度:她拥有丰富的森林和矿产资源:她就是北欧的瑞典王国。瑞典位于斯堪的纳维亚半岛东部,西邻挪威,东北接芬兰,东临波的尼亚湾,东南濒波罗的海,西南隔卡特加特和
为了进一步拉动食用菌的社会消费需求,推动我国食用菌产业和餐饮业的发展.发扬光大我国悠久的食菌文化.“第四届中国国际食用菌烹饪大赛·房山杯邀请赛”乘着2008奥运的东风
市场机会对于企业的生存至关重要,无论对于初次创业者还是二次创业者,能不能找到产品市场更是直接决定了创业企业的生死。笔者对创业者寻找产品市场的技巧做了粗略的分析研究
期刊
竞技体育是竞技各方竞争力体系的较量,支撑其持续竞争优势的是竞技体育的核心竞争力,由内部核心层、中间支持层、外在表现层构成。竞技体育的核心竞争力追求3大价值、符合5个
1.过分相信自我的判断。这是企业老板普遍存在的问题。对于任何一个人,如果把权力放给他,责任也加给他,他们都会作出恰当的判断。
随着2007年的到来.京城著名餐饮老字号又开始了新一年的举措。
与一把手和谐相处,赢得一把手的信赖,使自己能够游刃有余地开展工作,并在关键时刻脱颖而出,是每一个副手都必须面对的课题。
文章对《基础会计》实训教学内容和相关能力的培养进行了阐述,并就如何提高实训教学效果,培养学生动手能力提出几点建议.
位于北京市平谷区雪花啤酒厂附近新平南路的北京顺和缘酒楼成立于1999年。经过10年的市场经营,已成功梳理并总结出自己的传统风味体系"家常菜"。在不断改进,吐故纳新,自我完善