基于核函数的多分类器集成及应用研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:A58400794
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是模式识别及人工智能的重要研究领域,由于分类器的优劣缺乏统一的评价标准,因此寻求提高分类器的准确度和泛化能力成为一个主要的研究方向,为了充分利用不同分类器之间的互补信息,Suen C Y, Nadal C, Mai T A等于1990年提出了集成多个分类器的方法。集成分类器通过充分利用不同分类器之间的互补信息来提高集成分类器的性能。多分类器集成是集成学习的重要组成部分,相对于单个分类器来说,集成分类器可以充分利用不同分类器之间的偏好来显著地提高分类器的性能和泛化能力。目前,研究人员已经提出了很多优化改进集成分类器的方法,并且能很好的改善分类器的性能。虽然集成分类器可以很好的提高分类器的性能,但是对于一些不可分数据,传统的集成分类器的准确度会急剧下降。本文首先提出了基于场论的聚类算法(CABFT),并且通过弹性理论改进了基于场论的聚类算法(CABFT),提出了基于弹性理论的场论聚类算法(CABFT with TE)。然后通过使用核函数把训练样本中一些不可分的数据变换为高维的可分数据,然后再通过基于场论的聚类算法(CABFT)对高维数据进行聚类,得到高维数据的分布信息,最后根据训练样本的分布特点生成集成分类器,提出了基于核函数的集成分类器算法(CE with Kernel Function and CABFT),并且还通过弹性理论和边际变化理论改进算法,提出了基于边际理论的核函数集成分类算法(CEKF with MU),提高了集成分类器性能的效果。针对车载加固四单元iSCSI磁盘管理系统缺少自动管理的功能,本文在车载加固四单元iSCSI磁盘管理系统上实现了基于边际理论的核函数集成分类算法(CEKF with MU)和基于核函数的集成分类器算法(CE with Kernel Function and CABFT),实现了车载加固四单元iSCSI磁盘智能管理系统,该智能管理系统针对故障数据的不同处理结果采取不同的处理策略,达到了自动智能管理的水平,形成了一种行之有效的自动管理模式。本文研究如何通过使用核函数把训练样本中的一些不可分数据变换为高维的可分数据,并结合弹性理论和边际变化理论,达到提高集成分类器性能的目的。最后把提出的新算法应用到车载加固四单元iSCSI磁盘管理系统中,以实现磁盘管理的智能化。本文的创新性研究成果主要有:1、提出了一种基于场论的聚类算法(CABFT)。该算法利用非常相似对象之间的相似性提高算法的准确率,利用差异非常大的对象之间的差异性提高算法的泛化能力。2、提出了基于弹性理论的场论聚类算法(CABFT with TE)。根据弹性理论,提出了数据弹性的概念,根据数据弹性的不同可以更好的调整数据对分类器的作用,改进了基于场论的聚类算法(CABFT),提出了基于弹性理论的场论聚类算法(CABFT with TE)。实验表明基于弹性理论的场论聚类算法(CABFT with TE)比基于场论的聚类算法(CABFT)具有更好的聚类效果和泛化能力。3、提出基于核函数的多分类器集成算法(CE with Kernel Function and CABFT)和基于边际理论的核函数集成分类算法(CEKF with MU)。首先通过使用核函数把训练样本中一些不可分的低维数据变换为高维的可分数据,然后再通过基于场论的聚类算法(CABFT)对高维数据进行聚类,得到高维数据的分布信息,最后根据训练样本的分布特点生成集成分类器,提出了基于核函数的集成分类器算法(CE with Kernel Function and CABFT)。然后根据弹性理论和边际变化理论改进了基于核函数的集成分类器算法(CE with Kernel Function and CABFT),提出了基于边际理论的核函数集成分类算法(CEKF with MU)。实验表明这两个算法的性能都有较高的提升。4、提出了一种使用基于边际理论的核函数集成分类算法(CEKF with MU)的车载加固四单元iSCSI磁盘智能管理系统。该系统针对车载加固四单元iSCSI磁盘管理系统生成数据的特点,使用基于边际理论的核函数集成分类算法(CEKF with MU)分析数据,针对不同的分类结果磁盘智能管理系统采取不同的处理策略,达到了自动智能管理的水平,形成了一种行之有效的自动管理模式。
其他文献
“网构软件”是一种流行的网络资源整合模式,它由分布式的、具有主体化特征的软件实体组成,能够感知环境并通过动态演化来适应外部环境的变化。SOA是软件架构技术发展史上的
近几年,随着网络规模的不断扩大,网络中海量的资源给传统网络应用带来新的挑战。基于网络资源(包括CPU处理、存储、服务等)的不断增多,其组织、获取、分析、处理等操作也逐渐
为了支持海量数据的存储需求,随着存储系统容量的提升,元数据作为描述数据特性和存储位置的结构化信息,其存储需求也急剧增加。分布式存储系统的设计趋势是明确划分出元数据服务
RPC作为分布式系统中广泛使用的组件,对于其带宽利用率、吞吐率以及网络时延的要求越来越高。传统的基于TCP/UDP套接字实现的RPC组件其性能已面临越发严峻的挑战。目前高速In
随着医学成像技术的发展,很多CT设备采用加大X线剂量的方法,以获得更多、更清晰的医学图像信息。然而随着放射卫生学的发展以及公众自我保护意识的增强,人们越来越注意到X线检查
随着科学技术的飞速发展,计算技术、无线通信技术和微电子技术的日益成熟,无线传感器网络的应用领域也越来越广泛。无线传感器网络在应用中存在着多种威胁,如恶意丢包攻击、S
伴随着信息时代的来临,为了加强对信息资源的综合管理,需要对信息资源进行整合,形成一个更综合的信息资源库,用来提高对局部信息资源的共享与利用,这是未来发展的趋势。当前
Web服务具有开放性、跨平台性、松散耦合性、互操作性及高度动态性的特点,这些特点使得Web服务非常容易受到安全性方面的攻击,因而Web服务的发展空间和应用深度在很大程度上
随着基于Hadoop平台的大数据技术不断发展和实践的深入,Hadoop YARN(Yet Anouther Resource Negotiator)资源调度策略在异构集群中的不适用性越发明显。一方面,YARN资源调度
随着信息技术的迅速发展和计算机应用项目的大量推广,网络数据服务中心的数量大量增加。计算机系统的规模也越来越大,其系统性能也不断的提升,计算资源的种类越来越庞杂。在