基于初始中心优化的遗传K—means聚类新算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cxz2004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一个好的K—means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K—means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K—means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K—means算法(PKM)
其他文献
针对网络入侵与攻击行为特点,提出基于报文头和报文内容特征匹配的入侵行业分析方法,实验证明能有效提高匹配效率和准确率,具有一定的实际意义.
全球化时代,体育文化在我国的发展既可以凸显出本土体育文化优势,打造本土体育文化项目,也可以借鉴西方文化因子,创造具有中西文化个性的体育项目,但在经济全球化利益影响下,
在国家高度重视三农问题的时期,现代农业和休闲农业得到迅速发展。在两者发展过程中,将现代农业和休闲农业融合发展,让休闲农业从最大限度上积极推动现代农业发展,将休闲农业
论述了中文图书计算机编目查重的含义、重要性,分析了查重常见的几种方式,并联系实际探讨了查重工作中出现的问题和处理方法.
以CNKI中国学术文献网络出版总库为数据源,确定《图书馆界》被引频次超过5次的论文为研究对象,对发文年度、作者、地区以及主题等分布情况进行统计,客观揭示《图书馆界》的办