Hadoop云平台下基于P-WAP的大数据聚类挖掘算法

来源 :长春师范大学学报 | 被引量 : 0次 | 上传用户:it8844
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统AP聚类算法性能会随着数据规模扩大和结构复杂化而快速衰减,为此在Hadoop云平台下提出基于P-WAP的聚类挖掘算法。用邻域相似度指标替代传统AP算法中欧式距离相似度,提高聚类算法应对大规模数据的能力,将样本集合中的数据集分配给Hadoop云平台中的数据处理节点,利用平台并行计算能力对待处理数据集进行加权聚类,优化算法性能。实验结果表明,所提算法在海量数据规模下拥有更高的聚类效率,在聚类准确率和时间复杂度控制方面效果更好。
其他文献
介绍了凝胶形成机理,总结了这些微量成分作为凝胶剂形成的油凝胶特性,为脂质伴随物油凝胶的发展提供参考依据。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
多年来,在六朝文学的研究方面,鲍照诗歌一直是研究的热点。大体而言,研究多从宏观着眼去谈鲍照诗歌的整体风格或艺术成就,鲜有对鲍诗的题材特征等进行探讨。因此,文章以鲍照
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
从介绍樱桃苗的快速繁殖流程出发,阐述了樱桃苗的快速繁殖主要步骤,包括苗圃地选择、建圃时间的确定及压条方法等方面,为加快樱桃繁殖速度,降低繁殖成本,提高苗木质量,促进樱
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
近期青年汽车的水氢发动机下线备受争议的同时,使得氢能源产业再次引发广泛关注,且近几年,氢能源的热度正逐年攀升。公开统计数据显示,目前已有20多个省市出台氢能和氢燃料汽
古诗文对于学生情感的熏陶、人格的塑造、文化的形成都有着不可估量的作用,因此古诗词的教学也就显得尤为重要。 然而在目前的古诗词教学中,却出现了一些令人担忧的问题。本
目的:观察补充ω-3脂肪酸膳食补充剂对代谢综合征患者脂代谢的影响并初步探讨其机制。方法:采用随机双盲临床对照研究方法,按入选标准纳入60名代谢综合征患者,随机分为2组,分