【摘 要】
:
科学技术的高速发展以及存储技术的提高,使得人们获得的数据量急剧膨胀。“数据海量、知识匮乏”的尴尬状况使得数据挖掘应运而生。数据挖掘能从这海量数据中提取潜在的、对
论文部分内容阅读
科学技术的高速发展以及存储技术的提高,使得人们获得的数据量急剧膨胀。“数据海量、知识匮乏”的尴尬状况使得数据挖掘应运而生。数据挖掘能从这海量数据中提取潜在的、对人们有价值的信息,为我们的生产、生活带来很多方便。聚类分析是数据挖掘中的一个重要工具,利用聚类分析可以发现数据属性之间潜在的关系。K均值算法是一种典型的聚类算法,具有收敛速度快、局部搜索能力强等优点。但K均值算法存在着一些缺陷,比如对初始中心点明感,易陷入局部最优。本文针对K均值算法的不足作为出发点,提出了一些改进的方法,主要从以下几方面进行研究:在传统的K-means聚类算法基础上,本文提出了一种基于遗传算法的K-means聚类算法。遗传算法具有很好的全局寻优能力,采用竞争选择算子保存最优染色体,同时交叉算子和变异算法保证产生更优秀的染色体。通过一系列的遗传操作寻找到最佳的初始聚类中心,再执行K均值算法找到最终的聚类中心。提高了聚类的准确率,加快了收敛的速度,算法的稳定性也提高了。通过仿真实验,验证了GA-Kmeans聚类算法的有效性。将混合蛙跳算法与K均值算法结合,本文提出一种基于混合蛙跳算法的K-means聚类算法。混合蛙跳算法是一种智能优化算法,具有GA算法的全局寻优能力,还具有粒子群算法的局部寻优能力。利用混沌搜索优化初始解并且根据种群的适应度方差来判断是否进行K-means算法操作。提高了算法准确率,并且算法更加稳定。
其他文献
目的探讨经颈部入路切除胸上段食管非上皮源性肿瘤(ENET)的可行性。方法回顾性分析上海交通大学附属胸科医院胸外科2016年7月—2017年3月间连续收治的3例经单一颈部切口完成
大庆是一座以石油为主的资源型城市。自1998年以来,大庆和全国许多城市一样,逐渐告别了福利分房时代,实行了住房货币化,住房已经作为一种商品走进了人们的生活。这些年来,随
建筑工程管理是一项系统工程,分析安全、质量、进度等方面工程管理的内容和重意义及人、机、料、法、环五大方面主观与客观工程管理影响因素,明晰了当前工程项目管理存在的典型
橙皮苷具有多种生物活性,但其水溶性差,制约了它在食品工业等领域的应用。采用微胶囊技术对橙皮苷进行包埋,研究了该微胶囊添加到橙汁饮料中对产品品质的影响,确定微胶囊添加
社会工作专业的实践教学侧重于对理论知识的验证、应用和内化,具有较强的直观性和操作性,旨在培养、训练学生掌握社会工作的方法和技巧,其有现场情境性、综合性、以学生为主
<正> 对于国有企业改革,党的十五大报告是这样阐述的:“深化国有企业改革,是全党重要而艰巨的任务,要坚定信心,勇于探索,大胆实践,力争到本世纪末大多数国有大中型骨干企业初
胚胎干细胞(embryonic stem cell,ES细胞)是从早期囊胚内细胞团分离而出的多能性细胞。这些细胞能够体外培养无限增殖,维持自我更新,并且在特定条件下可以分化成为机体几乎所有类
<正>慢性萎缩性胃炎(CAG)伴肠上皮化生(IM)和不典型增生(ATP)是胃癌的癌前病变。胃癌前病变(PLGC)是胃黏膜从正常向胃癌转化过程中的一个重要阶段。阻断和逆转PLGC的发展,是
三峡库区蓄水后,由于水文条件发生明显改变,次级河流出现大面积富营养化现象,其显著特征就是藻类疯长引起水体Chla含量增加(在严重的累积区Chla浓度高达数百毫克/立方米)而透
目的:鉴定慢性坐骨神经损伤(chronic constriction injury,CCI)模型大鼠中免疫球蛋白重链结合蛋白(heavy-chain immunoglobulin binding protein,BIP)与Nav1.8蛋白的相互作用。为