一种基于基尼指标的高维数据离群挖掘算法

来源 :太原科技大学学报 | 被引量 : 0次 | 上传用户:xiahou001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高维数据集中的离群点挖掘任务,给出了一种基于基尼指标和属性相关性分析的高维数据离群点挖掘算法。该算法首先采用属性相关性分析方法,删除高维数据集中的冗余属性,缩减了数据集的大小;其次采用基尼指标作为离群度量因子,从缩减后的数据集中,挖掘出不同离群程度的数据点;最后,实验采用天体光谱数据作为实验数据集,经实验验证,该算法对高维数据集中离群点的挖掘算法是有效的和可行的,其效率得到了明显的提高。
其他文献
随着生活消费水平的提高,人们越来越重视服装。现今它已成为和食品、化妆品并列的三大消费品之一。当你步入面料丰富,款式多样的服装大世界时,只要仔细观察你便会发现服装质
据有关部门分析,当前国际旅游市场对旅游产品的需求呈现出细分、多样、专项、灵活四大新特点。消费者市场正趋向细分化,越来越多的较小规模的专门市场,如退休的老年人、未婚
一元复始,万象更新。值此新年到来之际,我谨代表农工党中央,向各位老领导、全体党员、机关工作人员及离退休干部和职工致以节日的问候!对给予我们工作极大支持的中共党委、统战
在面向对象编程思想基础上,设计与实现了基于C#的液位过程测控软件。利用.NET程序集技术、多线程技术和数据库技术分别实现了用户控件和控制算法的封装、多任务的并发执行和
针对矿井下基于RSSI算法的定位系统容易受到其他节点信号干扰,以及在井下测量节点距离时,因受到井下环境影响出现的测距误差,进而影响三边定位算法的精确度和稳定性。论文利用接收到的已知节点角度信息,把在井下定位分割成各个定位小区来过滤其他节点的信号干扰,以解决因信号干扰造成的定位小区混乱。在确定定位小区之后,利用对重叠区域进行标记缩小定位范围,对标记最多次区域采用质心算法,以此来提高定位精确度和稳定性
3月26日,深圳易流科技有限公司最新产品一易流云升级发布会在深圳华侨城洲际酒店举行。易流科技CTO康冠林对此次产品升级做了详尽介绍。他从易流透明连接、大数据支撑、产业链
从研究和应用效果来看,多波多分量地震技术是海洋油气勘探开发中的一项十分有效,大有前途的技术。多波多分量地震地质层位对比是多波地震资料解释和应用中最关键,最基础的工作,对
为加强商业银行内部控制管理,保证会计工作独立性,充分发挥会计监督职能,该文对推行会计委派制的必要性、组织形式和具体操作等方面进行了研究和探讨,并对如何进一步发挥该制
时下,在我国兴起一股“折叠热”,一大批折叠商品问津市场。折叠商品具有良好的实用性。据统计数字表明,我国大、中城市居民平均居住面积不足8平方米,而消费能力都以每年15%的
本文针对分数阶系统,提出一种分数阶内模控制器设计方法。首先采用基于单纯形法的分数阶模型简化方法,对复杂模型进行简化处理。然后将内模控制器设计方法扩展到分数阶系统,