基于进化萤火虫算法的K均值聚类分析与应用研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:ffcsyangchh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K均值聚类算法作为一种经典的基于划分技术的聚类算法凭借着其原理简单、执行效率高以及易实现等特点而被普遍使用。但是,K均值聚类算法对初始聚类质心的选择非常敏感,不同的初始聚类质心往往会造成差异较大的聚类结果。与此同时,群体智能仿生算法的兴起为众多学者在数据分析上提供了新思路。萤火虫算法是受生物界中萤火虫种群生存特性的启发而衍生出来的。萤火虫算法具有全局寻优能力强、算法输入参数较少以及实现容易等特点,但是在算法迭代后期往往会在最优解附近产生较强的波动,此外,该算法一旦陷入局部最优则很难跳出。针对上述萤火虫算法存在的弊端,本文受混合蛙跳算法分组思想的启发,首先对萤火虫算法引入了随机分组的思想,之后对萤火虫算法引入了动态惯性系数和移动方向因子。最后将改进后的萤火虫算法和K均值相结合,完成了K均值聚类算法在指定质心情况下的聚类分析。最后对实验数据集利用结合算法执行离群点的检测,并完成时间序列模型的应用。具体工作内容如下:⑴萤火虫算法的全局寻优能力是最为重要的。本文为了确保并提升该算法的全局寻优性能,在原始算法的基础上引入了随机分组的思想。随着种群每一次的迭代进化进行一次随机分组,达到先小组寻优后种群寻优的目的。⑵对于原始萤火虫算法的位移公式,本文通过增加动态惯性系数和移动方向因子对其做出了改进。使得萤火虫个体在寻优的过程中可以更好的趋近最优解,同时更有能力跳出局部最优而趋向全局最优。⑶在将改进后的萤火虫算法的思想和传统K均值的理念进行融合的过程中。本文选取所要聚类数据集中的每一条数据为一个萤火虫个体,以簇内变差为目标函数,进行最优解的优化。最后完成了K均值在指定初始聚类质心情况下的聚类分析。⑷为了保证时间序列模型预测结果的准确性,本文首先利用上述的结合算法对数据集进行离群点检测并剔除离群点,之后利用牛顿插值算法进行数据填充。如此不仅保证了数据集的准确度,还保持了数据集的完整性。最后通过实验表明对以该方式处理后的数据集进行预测的可行性。通过对数据集进行实验的结果表明,改进后的萤火虫算法不仅具有较高的稳定性也具有良好的高效性,同时将其与K均值聚类算法相结合对数据集进行聚类分析时也取得了较高的准确率。最后在对加拿大北部地区的月CO2含量进行预测的应用实验结果中也表明了结合算法对数据集进行离群点检测的可行性。
其他文献
【案件来源】环境保护部环境监察局【案件点评人】颉秀娟、唐亚龙【案件类型】评价类【案件名称】塑料颗粒加工"三无小作坊"违法生产屡禁不止【违法企业所属行业】生产加工业【
通过投放高锰酸钾进行示踪探测确认梅州水库隧洞出口渗水主要原因是洞内水压力的作用,通过分析混凝土裂缝的形成、发展、限制的过程影响洞内水对洞外地下水加压作用的变化,初步
随着新课程改革的加快,高校特别重视大学生自主学习能力的培养,这是社会发展的需要,也是高校课程改革的主要内容.在化学教学中,要体现师生在教学过程中的互动,注重以学生为主
目的检测4种微小RNA(miRNA)含量对于诊断肝细胞性肝癌(HCC)的临床价值。方法连续性纳入2013年12月至2015年7月所收治的HCC患者为试验组,肝硬化及肝血管瘤患者为对照组。比较
新课程的改革背景下,为了提高教学质量,本校提出了"聚焦课堂"的教学理念,把课堂看做教学的生命。作为本校教师,思考的是如何改变自己的课堂教学艺术。《语文新课程标准》指出
<正>绿光,当我见到浓雾之中那道闪烁的绿光,顿时潸然泪下。——题记那是一道让他永远追随的绿光,在迷雾中闪烁的抓不住的绿光,美丽而又如此耀眼地照射在他心上。无意之中默默
初中语文作为九年义务教育中的重要课程之一,对学生的基础知识的掌握及语言能力的培养有着重要的作用。近几年,教育改革的呼声日益高涨,对学生综合应用能力的发展越为重视。
随着信息技术的发展,分布式指挥与控制已成为信息时代联合作战指挥的一种新方式。把握实施分布式指挥与控制主要环节的核心技术,运用物联网、大数据、量子通信、人工智能等前
在1982年全国推行家庭联产承包责任制,打破了我国农业生产长期停滞不前的局面。这次改革激发起全国各地农民的生产积极性,朝鲜族农民也为了走上“万元户”致富之路,非常积极
在当今世界,各国越来越重视本国科学技术的发展,国家间的竞争越来越表现为技术和知识的竞争。技术创新对一国经济的发展起着重要的推动作用,也影响着对外贸易的发展。我国技