基于Spark并行的密度峰值聚类算法

来源 :计算机应用研究 | 被引量 : 9次 | 上传用户:marymahoo1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对FSDP聚类算法在计算数据对象的局部密度与最小距离时,由于需要遍历整个数据集而导致算法整体时间复杂度较高的问题,提出了一种基于Spark的并行FSDP聚类算法SFSDP。首先,通过空间网格划分将待聚类数据集划分成多个数据量相对均衡的数据分区;然后,利用改进的FSDP聚类算法并行地对各个分区内的数据执行聚类分析;最后,通过将分区间的局部簇集合并,生成全局簇集。实验结果表明,SFSDP与FSDP算法相比能够有效地进行大规模数据集的聚类分析,并且算法在准确性和扩展性方面都有很好的表现。
其他文献
依托黑龙江农垦北大荒牛业种养加循环体系的调研,提出市场牵龙头、龙头带基地、基地联农户的种养加良性循环的绿色农业发展模式,最终形成三江平原绿色农业有效循环的发展模式
文学研究会究竟是一个什么性质的团体,它到底有哪些会员,它有哪些宝贵遗产,对这样的基本问题,过去,研究得并不够,本文将在这方面作些调查,提出一些资料,供深入探讨研究。
本文通过多年中专体育教学实践经验,认为要提高教学效果,必需从培养学生能力方面入手,并对如何提高学生能力的具体措施进行详细的阐述。
日前,由沙特阿美节能环保专家创新研发的石油采油废水处理技术作为EcoRightTM MBR得到认可。
为了解决语音识别中基于卷积位置信息的混合式注意力机制无法提取长期有效位置信息的问题,提出了一种捕捉长期有效位置信息的新型混合式注意力机制。首先,对当前时刻生成的注意力得分作卷积来提取多通道特征图,并通过全局平均池化来得到恒定维度的特征向量;接着,引入长短期记忆网络(long short-term memory,LSTM)单元作为外部记忆模块,并以生成的特征向量作为输入,生成下一时刻的位置信息向量;
农业是人类文明赖以发展的生存来源和物质基础,农业要发展,就离不开农业生产力的提高,依靠科技进步推动农业的可持续发展是新时期农业生产力革命的新途径。
鉴于红外制导导弹对战场平台构成的严重威胁,以及传统红外对抗措施效能的下降,引出了红外定向对抗技术措施,分析其工作原理、作战流程,介绍了国外机载红外定向对抗系统的发展
海洋石油钻井、完井采油工程装备,是勘探、开发井的钻井、完井采油必需的关键手段。掌握这些装备的技术及钻井、完井采油工艺技术,是获取海洋油气的关键所在。笔者积近四十年海
1沼肥在植保生态系统中的重要性农村发展沼气有利于统筹解决并协调燃料、饲料、肥料三者之间的关系,使大量的作物秸秆、人畜粪便和杂草落叶等原料经过沼气发酵得到充分合理的
1割台故障在收获过程中,如果田间杂草过多,收获初期作物及土壤潮湿,割刀高度距离地面较低,就很容易使泥土、杂草等堵塞割刀。有的驾驶员不注意掌握适当的进地初始收割速度,即