论文部分内容阅读
随着计算机科学技术的快速发展,特别是数据库技术的广泛应用,数据挖掘领域成为热门的研究之一。浩瀚的数据海洋隐藏着大量对人们有重要价值的信息,如果能够通过有效的数据分析,提取出有实际应用的宝贵知识,将给人们带了许多方便。聚类算法分析成为数据挖掘的重要工具,对社会的经济发展和人们的日常生活都有着深远影响。本文以聚类算法的改进为出发点,探讨了算法的不足以及改进后的优势,主要从以下几方面进行分析研究:首先,在传统的K-medoids聚类算法基础上,本文提出了一种基于蚁群优化的K-medoids聚类算法。ACO是一种仿生优化算法,其具有很强的健壮性,具有比较强的全局搜索能力,求解效率高等特点。借鉴ACO算法的优点,提高了聚类的准确率,并且算法的稳定性也比较高。通过仿真实验,验证了ACO-Kmedoids聚类算法具有较强的可行性。其次,将粗糙集理论、ACO与K均值算法相结合,本文提出了一种基于ACO的粗糙集K-means聚类算法。通过ACO优化K均值算法,采用最大最小原则能动态地生成K均值聚类数和初始聚类中心,同时结合粗糙集理论的上逼近和下逼近处理边界对象。该算法具有较高的准确率和较快的执行时间,综合性能更加稳定。再次,为了改善K-medoids聚类算法收敛时间缓慢的问题,本文提出一种基于差分演化的K-medoids聚类算法。差分演化具有启发式的全局搜索能力,算法的鲁棒性很强。因此将K-medoids聚类算法的高效性和DE算法的全局寻优能力相结合,不仅能有效地克服K-medoids聚类算法的缺点,而且提高了算法的全局优化能力,缩短了收敛时间,改善了初始聚类质量。实验表明,该算法的稳定性较高,收敛时间较短。最后,根据云计算环境的特点,将蚁群优化的K-medoids聚类算法用到云计算环境中进行资源分配,本文提出一种基于云计算环境下的ACO-Kmedoids资源分配优化算法。该算法能够在云计算中快速、合理地路由,减少动态负荷并兼顾全局负载平衡,得到最优的计算资源,提高云计算的效率。最后通过仿真实验,分析网络带宽和节点时间延迟等因素对资源分配结果的影响,验证了此算法在云计算环境中的高效性。