【摘 要】
:
聚类分析作为一种无监督的分类方法是数据挖掘领域的一个非常重要的分支,被广泛的应用于各行业。K均值聚类算法作为聚类分析的一种主要算法之一,有简单、易懂等特点,但也存在
论文部分内容阅读
聚类分析作为一种无监督的分类方法是数据挖掘领域的一个非常重要的分支,被广泛的应用于各行业。K均值聚类算法作为聚类分析的一种主要算法之一,有简单、易懂等特点,但也存在一些缺点,如对初始中心点敏感、易陷入局部最优值以及需事先确定聚类数等缺陷。针对这些缺点,本文提出一种基于单亲遗传算法和k均值聚类算法的混和聚类分析算法,并通过仿真实验验证了算法的有效性。本文的主要工作有以下几个方面:首先,研究了聚类分析的有关性质、特点,详细分析了k-means聚类算法的特点以及改进策略;其次,详细分析了遗传算法求解聚类问题的特点;第三,引入单亲遗传算法求解聚类划分问题,对编码方式做了相应的改进。设计了一种新的种群初始化方法,提高了算法的效率。构造了新的变异算子,实现了对k值和聚类的优化。引入了k-means操作作为局部寻优算子。最后,验证了算法的有效性:对两组数据测试集,分别用k-means和基于单亲遗传算法的聚类算法进行性能测试。实验结果表明,基于单亲遗传算法的混合聚类算法具有较高的聚类准确率,收敛速度也显著提高。该算法具有明显的优越性
其他文献
近年来,由于解决工程实际问题的需要,复杂系统的可靠性分析受到了学者们的广泛关注。n中取相邻k:G系统是一类应用广泛的复杂系统,它被定义为n个部件按线型或坏型排列,系统正常当
本文利用发生函数理论和Riordan阵方法建立了一系列新的组合恒等式,并且利用渐近计数方法讨论了特殊组合和式的渐近性.主要内容概括如下:
第二章:本章利用Riordan阵方法
p-Laplacian算子边值问题在应用力学、天体物理和经典电学中有着广泛的应用背景。本文主要运用上下解方法和Leray-Schauder度的一些理论对带p-Laplacian算子的微分方程多点边
可靠性研究是以产品的寿命特征为主要研究对象,以评价产品的性能指标为主要研究目的的实用型课题。产品的寿命特征是一种随机现象,评价一种产品的可靠性指标最终需要归结为一
图像不变特征提取是图像处理、模式识别、计算机视觉等领域的热点问题,并有着广泛的应用。现有算法大体可分为两类:基于轮廓的方法和基于区域的方法。前者只利用目标轮廓,计算
约束矩阵方程问题在振动理论、电学、控制理论、非线性规划等方面有着非常重要应用,并已取得可喜的研究成果. 本文重点讨论了如下问题的正交投影迭代解法的预处理方法.
本文主要讨论了两类非线性波方程(组)的初边值问题,得到了解的存在性、唯一性、有限时刻爆破和衰减等结果。主要内容安排如下:第一章介绍此类问题的相关研究背景及发展概况,并
本文研究了一类浅水波方程的弱解,分别讨论了弱解在扇叶中的长时期行为。主要研究的方程有b族方程、CH方程与DP方程的双组份系统以及三组份CH方程。研究中主要的方法是基于此
以往在处理地下水数值模拟问题中,常常采用传统的数值分析方法,如有限元法、有限差分方法。而本文则采用一种新的数值方法——对称径向基函数配点法,对地下水问题进行数值模