基于蚁群聚类算法的集成学习研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:dark709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据聚类是重要的数据挖掘技术,聚类技术将末标记对象通过其相似度进行分组,使得组内对象的相似度最大而组问对象的相似度最小,从而发现对象的内在特性。然而,一些数据的结构和分布呈现高度的复杂性,数据挖掘也为聚类带来了大量亟待解决的问题。为此,聚类分析值得进一步探索的空间还很大。  群体智能是智能信息科学领域最有生命活力的一个研究方向,其具有分布性、鲁棒性、非直接通信和简单性等特点,在解决组合优化问题、知识发现、通信网络、机器人等研究领域显示出了巨大的优势和潜力。  蚁群算法是群体智能算法的重要内容之一。根据蚂蚁群体在不同方面的行为特征,蚁群算法分为受蚂蚁觅食行为启发的模型、受孵化分类启发的模型。本文重点研究了蚁群算法在数据聚类方面所做的贡献,针对传统的聚类算法效果不理想,基本蚁群聚类算法收敛速度慢等缺陷。本文提出了一种动态调整的蚁群聚类算法和改进的基于蚁群优化的聚类算法,动态调整的蚁群聚类算法通过参数的自适应调整,提高算法的自适应性和性能;改进的基于蚁群优化的聚类算法将两种不同的蚁群聚类算法进行结合,对初次聚类结果进行二次优化,提高算法性能。此外,动态调整的蚁群聚类算法使用了相对的聚类有效性分析方法,不仅可以发现数据集的最佳聚类数目,减少孤立点的数目,而且可以实现关键参数的自适应调整,提高聚类效果。  集成学习技术是利用基本学习器的多个版本来解决同一个问题,这样可以显著地提高学习系统的泛化能力。聚类集成的目的是融合来自多个聚类算法的结果以得到更高质量和鲁棒性的聚类结果。聚类集成的研究主要集中在聚类分量的生成和共识函数的设计两个方面,许多学者做了很多的研究,提出了基于共联矩阵法的聚类集成、基于超图的聚类集成、基于投票法的聚类集成等方法。本文在这些工作的基础上进行研究,并结合蚁群聚类算法,提出了基于超图的蚁群聚类集成算法和基于Bagging的蚁群聚类集成算法。前者使用动态调整的蚁群聚类算法生成聚类分量,后者使用基于蚁群优化的聚类算法生成聚类分量。实验表明,将蚁群算法解决聚类问题所固有的优势和集成学习解决聚类所特有的泛化能力结合,不仅提高聚类分量性能,而且提高聚类集成性能。
其他文献
从计算机诞生之日起,资源的稀缺性便一直困扰着计算机专家们,资源分配问题亟待解决。传统的资源分配方法大多采用工程控制手段,通过进行全局的计算,将资源分配到最适合的地方
蛋白质结构研究是生命科学的基础和重大核心问题之一。蛋白质的结构决定了它的功能,因此进行蛋白质结构预测对于深入了解蛋白质的功能,以及分子设计、生物制药等领域都有着很
随着经济的不断快速发展,我国的大气环境越来越不容乐观。近年来全国多地频繁出现雾霾天气,严重威胁到人们的生产生活和身体健康。大气污染源解析技术是分析污染物来源并计算污
随着大规模数据库的广泛使用和Internet的迅速发展,全球范围内数据库中存储的数据量迅速增大。如何从海量的、多样的数据中挖掘潜在的、有用的信息,成为当前知识发现的主要研
目前,蚁群算法和数据挖掘技术研究已成为国际智能计算领域的研究热点和前沿性课题。本文的主要研究目是:进行蚁群算法、数据挖掘技术、聚类分析技术研究;进行蚁群算法在聚类
随着基于可重构器件的快速发展和使用,基于FPGA的可重构技术逐渐成为国际上嵌入式计算领域中的一个新热点。由于可重构器件既有硬件电路高效计算的优良性能,也具有多次编程、易
随着互联网技术的飞速发展,数据与日俱增,用户更加关心信息获取的实时性、准确性和相关性,而面向文档的互联网已无法满足当前的需求。语义网是一个面向数据的网络,它把所有的数据
在教育资源信息化进程中,智能主机终端不断地被引入到基础教育课堂与课下教学中,但是多数情况下智能终端仅作为教育资源的辅助输出展示平台。由于智能终端编辑软件有较高用户知
远程教育是一种学生与教师分离的,采用特定的传输系统和传播媒体进行教学的教育方式。它的信息传输方式多种多样,学习的场所和形式灵活多变。远距离教育的优势在于它可以突破
数字水印技术是近十几年来提出的一种有效的数字产品版权保护技术。但目前每一种水印算法是不可能,也根本做不到抵抗所有的攻击。研究的目标往往是针对某一类的攻击而设计算