基于聚类的增量数据挖掘研究

来源 :大连海事大学 | 被引量 : 26次 | 上传用户：wanjiawen841002

【摘要】

：

聚类分析向来是数据挖掘研究的重要方面，基于聚类的各种数据挖掘算法的研究历来也是研究重点。但是，目前大多数的聚类分析算法只是针对于静态数据集的操作，对于动态数据集却只能

【作者】

：

陈峰

【机构】

：

大连海事大学

【出处】

：

大连海事大学

【发表日期】

：

2007年01期

【关键词】

：

聚类增量式数据挖掘密度 DBSCAN算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

聚类分析向来是数据挖掘研究的重要方面，基于聚类的各种数据挖掘算法的研究历来也是研究重点。但是，目前大多数的聚类分析算法只是针对于静态数据集的操作，对于动态数据集却只能采取对整个数据集重新进行聚类的方式，因此随着数据量的不断增大以及对数据集实时数据挖掘的需求不断加大，增量式数据挖掘技术正越来越引人关注。基于聚类的增量式数据挖掘继承了已有聚类的执行成果，通过对新增数据的逐个或者批量考查，可在很大程度上避免大量的重复计算，减少了计算量，节省了系统开支，提高了效率，尤其数据量越大时，增量式的数据挖掘技术就越能体现出其优越性，也更能为有数据挖掘需求的用户提供及时、快捷、有价值的信息内容。本文首先主要总结、探讨了关于数据挖掘以及聚类算法等方面取得的已有主要研究成果，并详细阐释了基于密度的聚类算法DBSCAN的主要思想、算法流程，并给出了实例以演示算法。在此基础上，提出了基于DBSCAN的增量式聚类算法Incremental DBSCAN，由于Incremental DBSCAN采用了逐个考察新增数据的处理方式，为了达到更好的运行效率，进一步提出了Incremental DBSCAN的批量处理算法。最后，通过实验验证了DBSCAN与Incremental DBSCAN在聚类效果上的一致性，以及Incremental DBSCAN在大数据量环境下更加卓越的性能。

其他文献

小学语文多媒体课件教学的利与弊

在当前社会的大环境下,运用先进的多媒体教学已经是主要潮流了,而我们在运用多媒体的时候,需要对多媒体进行客观的对待,其中的好处和坏处都要理解,在日常的教学当中,在对多媒

期刊

小学语文多媒体课件教学利与弊

期刊

期刊

期刊