基于MapReduce的DBSCAN聚类算法的并行实现

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:twffhvknnh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DBSCAN是一种简单、有效的基于密度的聚类算法,用于寻找被低密度区域分离的高密度区域。DBSCAN是最经常被使用、在科学文献中被引用最多的聚类算法之一。在数据维度比较高的情况下,DBSCAN的时间复杂度为O(n2)。然而,在现实世界中,数据集的大小已经增长到超大规模。对此,一个有效率的并行的DBSCAN算法被提出,并在Map Reduce平台下实现它。首先,对已经预处理过的数据进行划分。接下来,局部的DBSCAN算法将对每一块划分好的数据空间实现聚类。最终,利用合并算法对上一阶段的聚类结果进行合并。实验结果验证了并行算法的有效性。
其他文献
<正> 近两年来各地都搞起了轻音乐、都很受观众的欢迎,特别青年一代的欢迎,我看这是好事情,主流也是好的。 对于轻音乐、抒情歌曲在其发展过程中出现的一些这样那样的问题,我
期刊
苏姗.哈克使逻辑哲学发展成为独立的学科。逻辑哲学的中心问题是对于逻辑系统与现实原型“恰当相符性”的不断探索。逻辑理论具有可修正性,经典逻辑的公理和规则本身需要不断
文章借鉴西方税务筹划理论,对税收筹划的概念及特点;我国企业实行税收筹划的必要性与可能性;我国税收筹划应遵循的基本原则、基本方法作了探讨。
情与景,是诗歌创作的两个要素。情因景生,景以情合,二者相互生发与渗透,并从而达成融合无间的状态,这就是所谓"情景交融"。乐景写衷情在古典诗词表现手法上也属于衬托的一种,
文章对数字集成电路设计中的时序分析作了一个概要的介绍。对一些时序分析算法进行了讨论 ,同时 ,指出伪路径是时序分析中的一个重要问题。因此 ,为了进行有效的时序分析 ,必
随着工业自动化技术的发展,PLC得到了迅速的发展和推广。它将现代控制技术和计算机技术完美结合,实现了对复杂工业生产或其他重要场合的智能控制。本文简要概述了PLC的特点和
冯×,女,30岁,工人,平素身体健康。患者头痛、头晕、乏力半年,对症治疗无效,逐渐加重,出现忧郁、恐惧、易激动、幻听、幻觉、迫害妄想等精神症状。因而用塑料布将窗户钉死,
为了利用基因工程技术高效制备具有治疗Ⅱ型糖尿病功能的垂体腺苷酸环化酶激活肽(PACAP)衍生物RMBYLL,并在体外研究其生物学效应,采用基因重组技术表达重组肽RMBYLL,纯化、制备