【摘 要】
:
数据挖掘是从大量的、不完全的、有噪音的、随机的数据中获取潜在的、有用的信息和知识的过程。聚类分析是数据挖掘重要的组成部分,它是一种无监督的学习方法,不需要关于数据
论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪音的、随机的数据中获取潜在的、有用的信息和知识的过程。聚类分析是数据挖掘重要的组成部分,它是一种无监督的学习方法,不需要关于数据集的先验知识。聚类算法就是根据事物之间的某些属性,把事物聚集成类,使得不同类中的事物尽可能的相异,而同一类中的事物尽可能的相似。聚类分析已经被广泛地应用于生活中的各个领域。K均值聚类是典型的划分聚类,它因为实现简单,效率高而被广泛的应用,但该算法存在着需要事先给定簇个数、对初始中心点选择的依赖性和容易陷入局部最优解等问题。调和K均值算法(KHM)虽然有效减小了对初始中心点选择的依赖性,但它仍需要事先给定簇个数且容易陷入局部最优结果。针对以上问题,本文提出新算法结合蚁群算法的调和K均值算法(ACAKHM),引入了蚁群算法,蚁群算法的特点是可自主聚类,不需要给定簇个数,且它是全局寻优的启发式随机搜索算法,有较强的鲁棒性,易于与其他算法相结合。新算法充分利用了蚁群算法和调和K均值聚类算法的优点,先通过蚁群算法对数据集进行初步聚类,得到簇个数及初始聚类结果,再将蚁群算法得到的初始聚类簇中心点作为调和K均值聚类的初始中心点,选择较优的初始值,以达到获得较优聚类结果的目的。实验证明新算法有效解决了调和K均值算法中簇个数需事先给定及聚类算法容易陷入局部最优的问题。
其他文献
XML(eXtensible Markup Language,可扩展标记语言)为网络传输提供了一种便捷有效的数据格式,它是一种自描述的标记语言,能提供统一的数据说明方式,可以描述任意数据逻辑关系
随着3G时代的来临,手机智能卡完成的功能越来越多,已不再局限于简单的用户认证功能,各种增值业务如社保、公交地铁、汽车加油费用结算等贴近人们现实生活的应用也慢慢添加到
作为数字媒体的重要组成部分,数字音频越来越受到人们的重视。并且,伴随着嵌入式技术的迅猛发展,数字音频技术在嵌入式系统中的应用成为了当今的研究热点。嵌入式系统配置灵
策略生成是决策科学的难点,在现时的智能科学中还没有明确地解决矛盾问题,一般只是在既定策略中进行比较和选优,很少研究策略的形成及开拓决策策略集的问题。随着可拓学的不
当前,几乎所有的入侵检测系统采用的免疫模型都是基于传统的“自我和非我”(SNS)理论。该理论认为机体免疫系统对自身的抗原不产生免疫应答,而对外来的“非我”抗原产生免疫
传统的纸笔测验(Paper and Pencil Test, PPT)对于所有被试施测的是同样的试题,是“千人一卷”的测验,但是由于不同被试的能力水平差异较大,为了使试卷能够测出占总体大多数的中等
核磁共振成像(Magnetic Resonance Imaging, MRI)技术以其无创伤,软组织分辨率高,成像数据丰富等特点,已广泛应用于医学图像的获取,并在临床医学诊断上也起到越来越重要的作
色彩迁移是指将一幅参考图像的颜色特征传递给另一幅目标图像,使目标图像具有与参考图像相似的色彩。它是当前计算机视觉、虚拟现实与可视化等领域的一个新兴的技术,具有广阔
随着“互联网+”理念的涌现,加速了互联网等相关行业的发展,也带动了传统的行业和更多的企业以及个人加入到互联网中来,从而在互联网中产生了大量的信息。为了企业或用户更好
随着大数据时代的到来,Internet上的知识数量呈现指数级增长,其内容变得更加丰富、形式更加多样,如何将这些知识进行快速地、准确地组织和管理成为计算机相关领域的研究热点