一种基于数据垂直划分的分布式密度聚类算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:Leechen17008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点集关系的基础上,对全局噪声点进行有效过滤,进一步设计闭三角链表结构存储各个结点的聚类中间结果,提出了基于密度的分布式聚类算法DDBSCAN.理论分析和实验结果表明,算法可以有效解决垂直划分的大数据集聚类问题,算法是有效可行的.
其他文献
在高质量的无线通信网络中,带宽不稳定和用户移动性成为影响移动事务处理的主要因素,导致事务冲突率上升、吞吐量下降和峰值情况复杂等结果.一种新的并发控制方法ASGT能够:①具有
信息化的社会,需要会学习的人才,需要有创新意识的人才,教育的目的是促进学生的终身全面发展.文章立足于中学地理教学实际,以新课标为指导思想,尝试构建出中学地理自主学习课
图书馆读者宣传是一项长期性的工作。文章结合实际论述了读者宣传的意义、内容以及开展高校图书馆读者宣传的方式方法。
通过对LSCSIMD体系结构的深入研究,提出了一种支持扩展配置存储器寻址空间的配置存储器组织结构(配置指令采用立即数寻址),该结构通过增加配置存储器容量,可以有效地降低配置延迟.