基于改进布谷鸟算法的K中心点聚类分析及并行实现

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:mnm159753
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近20年来,随着信息技术发展的越来越迅速,各个领域产生的数据量也越来越多,因此大数据的概念也随之引起了社会各界的重视。面对大量繁杂的数据人们逐渐发觉其是人类进步的重要资源,急需从这些海量数据中发现有价值的信息。数据挖掘是通过算法搜索出隐藏于海量数据中的信息的过程,通过这个过程可以从大量繁杂的数据中找到有价值的信息。其中K中心点聚类算法具有易实现、效率高等优点,因而被人们广为接受。随着人们对数据挖掘技术不断探究,数据挖掘领域有了众多的创新发展,将智能优化算法较好地应用到K中心点之中就是创新发展之一。布谷鸟算法作为进化计算范畴里新兴起的一种群体智能优化方法,引用了生物学进化论,参数更少,随机搜索更有效。本文首先对布谷鸟算法进行改进,之后将改进布谷鸟算法与K中心点进行结合,使其在指定初始质心的情况下完成聚类分析。最后将结合算法运用到Map Reduce框架下进行并行实验分析。具体工作如下:(1)简述了聚类分析、K中心点算法、布谷鸟算法、Map Reduce框架的相关概念、分析了两种算法的思想、流程、优缺点等。(2)对布谷鸟算法引入自适应发现概率。通过将布谷鸟算法中的固定值参数发现概率改为动态变化的自适应发现概率,使算法在前期加快收敛速度,后期提高收敛精度,更有效更快速地搜寻到最优解。(3)将改进后的布谷鸟算法运用到K中心点算法中,得到了基于改进布谷鸟算法的K中心点优化算法。此算法利用了基于自适应发现概率的布谷鸟算法以及K中心点算法在数据集中各自搜索寻优的优势,弥补了原始K中心点算法受初始质心影响较大和难免陷入局部极值的缺陷,提升了算法的效果。(4)将基于自适应发现概率的布谷鸟算法的K中心点优化算法运用到大数据平台上进行并行实验,表明该算法在大数据聚类分析方面有着优越的应用远景。通过算法在测试函数和数据集上的实验表明,改进布谷鸟算法具有更快的收敛速度和更好的寻优效果。布谷鸟算法与K中心点的结合算法具有更高的聚类质量和准确性,同时收敛速度也有所提升。最后结合算法的并行实验也进一步证明了该算法的高性能。
其他文献
本翻译报告是译者基于对《致法学专业学生信》(节选)的汉译撰写而成。该书作者为英国剑桥大学法学教授尼古拉斯·迈克布莱德和杰森·韦努哈斯。通过书信这一别具一格的方式,两位作者围绕何为法学、为何要学法学、如何学好法学等问题做了一番深入浅出的解释和介绍,是一本非常适合法学初学者的学习指南。本报告节选的翻译材料为书中的三封书信。译者通过反复研读原文,在凯瑟琳娜·赖斯的文本类型理论指导下,确定该文本类型为“信
本论文的主要工作是设计和合成了一系列含有茜素结构单元的杯[4]芳烃衍生物,通过紫外吸收光谱和荧光发射光谱研究了它们对金属离子的选择性识别作用。具体内容如下:1.以对叔
基于复杂网络框架的多主体系统研宄是系统协同控制研究课题中的一项重要内容,也是人工智能研宄中不可缺少的一部分。其中,多主体系统的一致性问题是协同控制中的根本问题。多
青年最有活力,最具梦想,最富创造力。青年是国家的未来,民族的希望,是伟大事业的建设者和接班人,是伟大梦想的实现者和助跑人。党的十八大以来,以习近平同志为核心的党中央,高度重视青年,对青年充分肯定、殷切关心、寄予厚望。习近平多次走进青年中间,与青年朋友谈心、给青年学生回信、倾听广大青年心声,深情嘱托当代青年,围绕青年和青年工作发表了一系列立意高远、内涵丰富的重要论述,形成了具有系统性、时代性与创新性
本文合成了含有苯并异硼唑磷酸酯化合物,并对其进行了结构以及性质等方面的研究。本论文由2-甲酰基苯硼酸、苄胺和亚磷酸二乙酯反应生成1-羟基-2-苯甲基-1,2-苯并异硼唑-3-磷
在连续数据的关联规则挖掘中,属性值的离散化是挖掘的一个重要环节。连续数据的最优离散化是一项挑战性研究。在关联规则挖掘过程中,离散化不确定性会不断传播和积累,从而直
生产管理是制造型企业的核心,是企业得以生存和发展的根本。随着经济的发展,企业之间的竞争日益激烈,主要体现在产品技术上的差异越来越小。企业如何提高内部管理水平和生产
近年来,以三聚茚为主体的树枝状衍生物研究成为一个热点。由于三聚茚类化合物本身具有特殊的高对称共轭结构,其在光学性质方面拥有得天独厚的潜在优势。所以研究三聚茚类衍生
2013年新三板市场扩容至全国范围,短短几年内新三板市场挂牌的企业数量已超过万家,成为我国多层次资本市场的重要组成部分。为了解决挂牌企业融资的问题,新三板市场借鉴A股市
体验经济的不断发展逐渐影响着当下人群的消费行为,人们的消费目标从产品本身转移到了产品的附加体验。在整个消费环境的驱使下,消费者对品牌服装产品开发设计提出了新的要求,品牌必须转型以迎合当下消费诉求、即关注产品中设计的附加价值。IP内容的植入是当前通过增加产品体验属性来提高附加值的有效手段之一,是将IP内容的不同层次对应服装产品设计诉求,并通过特定的设计方法将IP内容植入到服装产品设计当中,以消费者为