基于Spark的三支聚类集成方法

来源 :郑州大学学报(理学版) | 被引量 : 0次 | 上传用户:jacky1313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大规模不确定性数据聚类,提出一种新的基于Spark的三支聚类集成方法.该方法包括3个步骤:首先,将现有的聚类算法进行基于Spark的分布式处理;然后,以第1个聚类成员的聚类结果作为参照划分,对剩余聚类成员中的类簇做标签对齐;最后,利用投票法以及三支决策规则对标签对齐后的聚类成员进行集成,得到最终的三支聚类结果.实验结果显示,本方法能够有效处理大规模不确定性数据,相比传统基于Spark的聚类算法效率更高.
其他文献
针对单目视频序列中非刚性动态目标重建算法的非在线批处理问题,采用了基于模板的能量最小化方法,通过优化目标能量函数,得到模板与输入动态视频序列每一帧中目标的对应关系,
农产品流通已成为制约农业发展的“症结”,在社会主义市场经济条件下,如何解决这个问题? 一、农民要增强市场观念,按市场需求进行生产过去在计划经济体制下,国家对农产品实行
牛肝片形吸虫病又名肝蛭病,是指牛感染了肝片形吸虫而引起的以贫血、消瘦、肝炎、胆管炎、颌下水肿、肝实质或胆管内有虫体为主要特征的一种寄生虫病。本病对幼牛危害大,死亡
近年来,随着农用尿素产能严重过剩,普通化肥市场竞争愈加激烈。宁夏石化目前拥有三套尿素生产装置,年生成尿素能力超过200万吨。为了实现高质量可持续发展,不断提升企业竞争
对芦荟褐斑病菌的培养性状、生长温度和防治药剂进行了研究.结果表明30℃最有利于病菌的生长,分生孢子平均16.5×4.7um,菌丝体在PDA培养基上的生长分二种类型.各药剂间防
交通运输企业人力资源管理既面临该行业管理难度比较大,也深受新生代员工特性和技术进步的影响。只有建立完善的员工发展计划和人才培养模式,才能更好的激励高素质人才对企业
目的回顾性分析不同治疗方案对老年性乳腺癌患者生存率的影响,为临床个体化治疗提供理论依据。方法选择遵义医学院附属医院2006-2014年间收治的大于或等于65岁的乳腺癌患者73
对世界上实行完全个人帐户制度较为成功的新加坡,智利两国的老年社会保险进行比较,分析了两者在具体实施过程中,在制度的统一性、资金筹集、运营、退休金给付方式和管理等方面存
尖端技术领域“卡脖子”问题是我国在大国崛起过程中技术创新和技术贸易战略中遭遇的最大问题。技术贸易是欠发达国家实现技术进步的有效方法之一,但是构建技术贸易体系决策
鄂钢宽厚板厂使用的国产工作辊轴承,虽然使用前期出现过问题,但经过技术改进,成功解决了国产轴承不足之处,现已经能够满足使用要求,对比结果表明,创造了显著的经济效益和社会