聚类分析中基于密度算法的研究与改进

被引量 : 0次 | 上传用户:biggertree
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析根据数据对象的属性及相关信息将其分组,使得组内的对象相互之间相似,而不同组中的对象不相似,它是数据挖掘领域一个非常重要的课题,同时聚类分析在统计学、生物学、信息检索、模式识别、机器学习等很多领域扮演着重要角色。到目前为止已提出了很多种聚类算法,基于密度的算法是其中一类非常有效的方法,这类算法可以检测数据空间中任意形状的簇。然而目前已有的一些基于密度的算法,如DBSCAN,DENCLUE,因为算法的全局参数问题而不适合处理不同密度的簇;SNN算法则由于需要从k最近邻相似矩阵中重构出共享最近邻图而在效率上有所欠缺。为了能够更有效率更好地检测不同密度的簇,本文提出了一个密度流模型并基于此的聚类算法DEFAT。密度流模型通过在数据对象间传递密度流,共享其局部密度信息,从而从全局的角度考虑对象间的相似性。基于密度流模型,DEFAT能够很好的区分不同密度区域,从而能够检测出不同密度和大小,形状各异的簇,同时还能够处理簇间有重叠的情况。在人工数据集和真实数据集上的实验表明,DEFAT无论在效果上还是在效率上,都优于现有经典的基于密度的算法。
其他文献
1 泸县养鸡业现状 泸县有着悠久的养鸡历史,鸡肉是当地人民的主要肉食来源之一。2006年,全县出栏鸡959.59万只,其中肉鸡375万只,养鸡产值占畜牧业产值的比重偏小。目前,泸县的养鸡
中国自改革开放以来,随着国民生产总值长期连年大幅度增长,中国人在物质层面的总体生活水平较过去有了翻天覆地般的改善。然而在取得经济方面巨大成就的同时,一些社会矛盾也
截至2012年底,我国的CO2排放量已为“世界之最”,伴随着经济的腾飞,我们正面临着巨大的二氧化碳减排压力。为了显示我国身为大国的强烈减排决心,2009年哥本哈根国际气候会议上我
普通高中教育是国家基础教育重要组成部分,普通高中教育的质量高低会直接影响我国基础教育的改革进程和发展状况。普通高中教师的工资水平对高中教育的发展有深远的影响。一般
探明克拉玛依地区的极端气温变化特征,为当地农业生产、居民生活和经济发展提供参考,利用1961—2012年的日气温资料,采用百分位阀值、线性趋势、Morlet小波分析、Mann-Kendal
我国城市道路交通中包含许多十字交叉路口,因此导致侧面碰撞发生频率较高。车身侧面结构与车身前后防撞结构相比较为脆弱,同时距离乘员较近。在车辆受到侧面碰撞后,乘员会因为侧
为掌握龙滩水库罗甸水域浮游动物生物量的垂直分布和季节变动规律,为龙滩水库不同层次中浮游动物的分布提供科学依据,2011-2012年分4季对龙滩水库罗甸水域浮游生物垂直分布进
<正>当今世界,国际形势正发生着深刻的变化,一国的综合国力和国际竞争能力越来越取决于教育发展、科学技术和知识创新水平。21世纪头20年对于我国高校发展来说是重要战略机遇
科技的进步使个体透过网络参加集体行动成为可能,甚至更快速和更广泛地影响着社会。对网络集体行动的研究要放在特定的社会语境下进行,研究澳门新型民间社团发起网络集体行动