论文部分内容阅读
分类是模式识别及人工智能的重要研究领域,由于分类器的优劣缺乏统一的评价标准,因此寻求提高分类器的准确度和泛化能力成为一个主要的研究方向,为了充分利用不同分类器之间的互补信息,Suen C Y, Nadal C, Mai T A等于1990年提出了集成多个分类器的方法。集成分类器通过充分利用不同分类器之间的互补信息来提高集成分类器的性能。多分类器集成是集成学习的重要组成部分,相对于单个分类器来说,集成分类器可以充分利用不同分类器之间的偏好来显著地提高分类器的性能和泛化能力。目前,研究人员已经提出了很多优化改进集成分类器的方法,并且能很好的改善分类器的性能。虽然集成分类器可以很好的提高分类器的性能,但是对于一些不可分数据,传统的集成分类器的准确度会急剧下降。本文首先提出了基于场论的聚类算法(CABFT),并且通过弹性理论改进了基于场论的聚类算法(CABFT),提出了基于弹性理论的场论聚类算法(CABFT with TE)。然后通过使用核函数把训练样本中一些不可分的数据变换为高维的可分数据,然后再通过基于场论的聚类算法(CABFT)对高维数据进行聚类,得到高维数据的分布信息,最后根据训练样本的分布特点生成集成分类器,提出了基于核函数的集成分类器算法(CE with Kernel Function and CABFT),并且还通过弹性理论和边际变化理论改进算法,提出了基于边际理论的核函数集成分类算法(CEKF with MU),提高了集成分类器性能的效果。针对车载加固四单元iSCSI磁盘管理系统缺少自动管理的功能,本文在车载加固四单元iSCSI磁盘管理系统上实现了基于边际理论的核函数集成分类算法(CEKF with MU)和基于核函数的集成分类器算法(CE with Kernel Function and CABFT),实现了车载加固四单元iSCSI磁盘智能管理系统,该智能管理系统针对故障数据的不同处理结果采取不同的处理策略,达到了自动智能管理的水平,形成了一种行之有效的自动管理模式。本文研究如何通过使用核函数把训练样本中的一些不可分数据变换为高维的可分数据,并结合弹性理论和边际变化理论,达到提高集成分类器性能的目的。最后把提出的新算法应用到车载加固四单元iSCSI磁盘管理系统中,以实现磁盘管理的智能化。本文的创新性研究成果主要有:1、提出了一种基于场论的聚类算法(CABFT)。该算法利用非常相似对象之间的相似性提高算法的准确率,利用差异非常大的对象之间的差异性提高算法的泛化能力。2、提出了基于弹性理论的场论聚类算法(CABFT with TE)。根据弹性理论,提出了数据弹性的概念,根据数据弹性的不同可以更好的调整数据对分类器的作用,改进了基于场论的聚类算法(CABFT),提出了基于弹性理论的场论聚类算法(CABFT with TE)。实验表明基于弹性理论的场论聚类算法(CABFT with TE)比基于场论的聚类算法(CABFT)具有更好的聚类效果和泛化能力。3、提出基于核函数的多分类器集成算法(CE with Kernel Function and CABFT)和基于边际理论的核函数集成分类算法(CEKF with MU)。首先通过使用核函数把训练样本中一些不可分的低维数据变换为高维的可分数据,然后再通过基于场论的聚类算法(CABFT)对高维数据进行聚类,得到高维数据的分布信息,最后根据训练样本的分布特点生成集成分类器,提出了基于核函数的集成分类器算法(CE with Kernel Function and CABFT)。然后根据弹性理论和边际变化理论改进了基于核函数的集成分类器算法(CE with Kernel Function and CABFT),提出了基于边际理论的核函数集成分类算法(CEKF with MU)。实验表明这两个算法的性能都有较高的提升。4、提出了一种使用基于边际理论的核函数集成分类算法(CEKF with MU)的车载加固四单元iSCSI磁盘智能管理系统。该系统针对车载加固四单元iSCSI磁盘管理系统生成数据的特点,使用基于边际理论的核函数集成分类算法(CEKF with MU)分析数据,针对不同的分类结果磁盘智能管理系统采取不同的处理策略,达到了自动智能管理的水平,形成了一种行之有效的自动管理模式。