基于Storm的分布式实时数据流密度聚类算法

来源 :天津师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:yoyoluo5531
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于经典流聚类框架CluStream和密度聚类算法DBSCAN,提出了一种分布式实时数据流密度聚类算法DBS-Stream,并在Storm流式处理平台上设计了算法实现方案.该算法局部节点使用CluStream的两段式经典框架,在线微聚类中利用DBSCAN代替K-means初始化数据,在中心节点再使用DBSCAN算法进行全局聚类.该算法可解决任意型聚类问题,并可使局部节点快速更新数据.将DBS-Stream算法与CluStream算法进行比较,实验结果表明,本研究算法在聚类质量和通信代价方面均优于CluSt
其他文献
肿瘤细胞和肿瘤标志物的检测在肿瘤的临床筛查和诊断中起着非常重要的作用。电化学技术因具有很多如简便、快捷、价廉、灵敏等的优良特性,被广泛地用于小分子、大分子蛋白甚
本文主要以创新建筑施工管理的方法研究为重点进行阐述,结合当下我国建筑施工管理的现状为主要依据,从建筑工程施工技术的创新、建筑工程施工管理机制的创新、建筑工程施工管理
针对L型液压活塞式CNG子站压缩机在往复压缩天然气过程中,液压系统存在着换向冲击、噪声值大(90~106 d B(A))以及换向不稳定等现象,通过建模仿真与模拟样机试验相结合的方法,得到
[本刊讯]阿伦中学成立于2014年,现有42个教学班,在校生2207名,教职工217人,总占地面积12万平方米,建筑面积3.6万平方米。
"数与代数"是初中数学中的重要内容,不仅能能够提升学生解决实际问题的能力,还能够为高中和大学的学习奠定基础。本文首先介绍了运算能力的重要性,然后从四个方面论述了如何
文章通过对“十二平均律”发展的历史探寻,结合对J.S.巴赫键盘艺术的具体分析,就其确立“十二平均律”的艺术实践性问题进行深入研究。
Boost变换器因其升压特性、适用较为复杂的应用环境而广受欢迎。传统Boost电路最常用的控制模式为峰值电流模式与电压模式,峰值电流模式相对于电压模式具有更加快速的线性瞬
在现代社会,企业发展的核心竞争力主要是人才的竞争,而企业在雇佣关系之中,非常重要的一个环节则是薪酬体系,也就是说,薪酬体系是企业与员工之间的联系纽带,同时也是企业招聘员工的关键因素。因此,薪酬体系与其配置的科学性、合理性都格外关键、重要。薪酬体系不仅仅是推动企业战略发展目的实现的强有力工具,也是企业对外人才吸引的竞争工具与必然手段。本文以R房地产公司为研究对象,阐述了公司的薪酬管理现状并对其存在的
中小学校要不要教科研?教师有没有能力做教科研?这个问题无论是各级教育行政部门的领导,还是中小学校长以及教师,都有不一致的认识。有一部分人认为教科研太深奥,中小学教师作
由于到来的信息时代,建筑业信息化随着社会的发展所要求越来越高。作为未来建筑业信息化的重要发展方向,人们更加重视建筑信息模型。建筑信息模型在住建部发布的“2011年~201