论文部分内容阅读
近几年来社区电子智能服务在中国有了突破性进展,有效地将现代信息技术和传统的社区服务紧密地融合在一起。而通过数据挖掘技术可以方便、快捷、直观的展现数据的深度应用,促进社区服务的智能化实现。聚类分析是数据挖掘领域中一个非常重要的研究内容,它主要是从数据库中的记录集中寻找数据的相似性并进行分类,从而发现数据库中隐含的有用信息。传统的聚类算法本质上是一种局部搜索算法,而遗传算法作为全局优化搜索算法,在数据挖掘方面的应用也得到了极大的重视。将遗传算法与聚类相结合,可以避免聚类陷入局部最优,得到更好的聚类结果。本文首先介绍了数据挖掘的基本概念和分析方法,重点介绍了聚类分析技术以及遗传算法的基本理论。针对聚类经典算法k-means算法无法自动得到最佳聚类数目以及对初始化敏感,易陷入局部最优的问题,提出了基于遗传算法的k-means改进算法。算法中采用浮点数编码和可变长染色体编码相结合的遗传算法进行聚类,遗传算法的交叉操作使得聚类中心集数目发生变化,在搜索过程中可以搜索到尽可能多的中心集方案,从而具有全局搜索的能力。最后,在前面研究的基础上,将改进的遗传优化聚类算法应用于社区智能服务系统中,取得了较好的结果。