论文部分内容阅读
传统神经网络结构复杂,学习速度慢,运行效率低,难以解决海量数据的处理。张铃教授等在对神经网络算法分析的基础上提出基于覆盖的构造性机器学习方法,该方法根据样本自身的特点构造神经网络,方法直观高效,可以有效地处理海量数据。 集成学习是一种新的机器学习范式,它的基本思想是使用多个学习器来解决问题。研究表明该方法能够显著地提高学习系统的泛化能力,因此从20世纪90年代开始,对集成学习的理论和算法的研究成为机器学习领域的一个热点。 本文在分析集成学习理论的基础上,将其引入覆盖算法,并结合商空间理论、粗糙集理论对覆盖算法的集成学习进行了研究,完成以下主要工作: (1)基于覆盖的构造性学习方法直接根据样本数据构造覆盖网络,克服了传统神经网络计算中网络结构难以确定、运行速度慢、局部极小等问题,适宜于多类别、海量数据的处理。本文将集成学习与覆盖算法相结合,提出了基于集成学习的覆盖算法,实验证明该方法能够提高覆盖算法的性能。 (2)商空间理论是研究不确定性问题的三大工具之一,其有严格的数学理论基础,提供了比粗糙集和模糊集更深刻的信息,引起越来越多的研究者的重视。本文将商空间理论中的合成技术的思想与集成学习相统一,把集成学习也看成是不同粒度的合成,提出基于商空间的覆盖合成算法,实验表明该算法在提高识别精度的同时还能增加覆盖算法的稳定性。 (3)Rough集是当前机器学习和知识发现领域研究的热点之一,它是一种处理模糊和不精确知识的数学工具,具有很强的知识获取能力,其主要优势在于他不需要任何预备的或额外的有关数据信息。本文将覆盖算法与粗糙集联系起来,把每一个覆盖集看作为一个属性集,将覆盖领域约简问题便转化为粗糙集的属性约简问题,提出了基于粗糙集的球形领域约简覆盖算法,实验表明这一方法在大大减少覆盖个数的前提下,还能有效提高覆盖网络的识别精度,增加了覆盖网络的泛化能力。