【摘 要】
:
聚类分析是数据挖掘领域中一个十分重要的课题,既可以单独用来分析数据集中的深层信息,也可以作为其他数据挖掘分析算法的一个预处理步骤,因此研究如何提高聚类算法的性能具有重
论文部分内容阅读
聚类分析是数据挖掘领域中一个十分重要的课题,既可以单独用来分析数据集中的深层信息,也可以作为其他数据挖掘分析算法的一个预处理步骤,因此研究如何提高聚类算法的性能具有重要的意义。相比于传统的硬聚类算法,模糊聚类算法,有着更好的数据表达能力与聚类性能。基于目标函数的FCM算法是最为完善、应用最广泛的模糊聚类方法之一。然而研究表明FCM算法强烈依赖于参数的初始状态,算法容易陷入局部极值点而得不到最优模糊划分;另外,FCM算法要求在分析前给出聚类类别数C的先验信息,这给算法的应用带来极大的不便。
本文重点针对FCM算法对初始值敏感,易陷入局部最优及需要事先给出聚类类别数C等不足,提出了一种基于改进的模拟退火遗传算法的模糊聚类算法(SAGAFCM算法)。改进SAGAFCM算法先利用网格化和密度值法改进最大最小距离法得到最有可能成为聚类中心的点,从而较大程度上避免了初值选择的随机性,接着利用模拟退火遗传算法从这些候选点中选出最优的初始聚类中心点,最后以得到的聚类中心点作为FCM算法的初始值,得到最终的聚类结果。该算法实现了输入参数的知识领域最小化,即不要求用户事先给出聚类的个数和初始聚类中心。SAGAFCM算法中采用的模拟退火遗传算法以动态方式来确定聚类中心数,相应的染色体采用可变长染色体编码方案;另外,SAGAFCM算法中用到的适应度函数也对FCM中的目标函数进行了改进,同时考虑了聚类信息的耦合度和分离度。为了测试改进SAGAFCM算法的聚类性能,本文将其与FCM算法在多个数据集上进行了对比实验,验证了SAGAFCM算法在聚类质量和聚类稳定性上都远优于FCM算法。
其他文献
齿轮箱是机械设备中广泛使用的关键部件,对齿轮箱进行实时监测和故障诊断对于工业生产具有重大的经济和安全意义。本文以齿轮箱为研究对象,使用DSP处理器开发了一种在线监测诊断系统,并将分层时序记忆算法应用于齿轮箱常见故障的诊断识别中,旨在检测该方法在齿轮箱故障诊断上的使用效果。嵌入式故障诊断系统基于嵌入式硬件平台,将信号采集、数据处理与特征提取、故障分类识别集成于一体在嵌入式硬件平台上执行,可以实现自动
随着现代化水泥厂新型干法水泥生产工艺的日益普及,人们迫切需要对水泥产品质量进行有效的控制,从而能够有效节省成本和提高水泥熟料质量。现阶段水泥厂熟料优化策略大部分还
迭代学习控制(Iterative Learning Control,简称ILC)是近二十年发展起来的适应于具有重复特性的被控系统的一种新的智能控制方法。其基本思想是利用系统输出误差和先前的控制
锚喷支护是煤矿巷道的主要支护方式,支护质量的检测是保证安全生产的重要工作。锚喷支护质量的检测主要包括顶板离层位移的检测和锚杆受力的检测。本系统通过对锚杆应力的检
随着现代科学技术的不断进步,现代工业系统朝着规模越来越庞大、结构越来越复杂、集成度越来越高、功能越来越完善的方向发展,而这些系统一旦发生故障就有可能造成人员伤亡或
近年来,仿人机器人逐渐成为机器人研究领域的热点,它集中了电子工程、机械工程、计算机工程、自动控制工程、信息工程以及仿生学和人工智能等多种学科的最新科研成果,是机电一体
随着通讯技术的高速发展,智能手机已成为当下各大手机厂商必争之地,这也推动了智能手机的普及。然而伴随着智能手机功能的不断完善和加强,利用手机进行诈骗,诽谤和伪造等犯罪活动
近年来,模糊控制技术在工业过程中的成功实践促使模糊理论飞速的发展。采用模糊控制系统的实质就是将人类的知识嵌入到实际工程系统中。定量水分控制系统是保证纸张质量的重
由于具有结构简单、尺寸小、造价低、使用灵活、适应性强和不必冒生命危险等特点,无人机现已得到各国的广泛关注。无人机的编队飞行又具有单机飞行所没有的特点和优势,因此具有
BTT飞行器因其气动稳定性好,升阻比大等优点受到国内外广泛关注,很多学者都对BTT飞行器的相关技术进行研究,其中制导控制问题已经成为主要的研究问题之一。如何充分发挥飞行