增量机器学习算法研究——基于模糊神经网络的增量学习

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zc198926
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,许多应用领域获取新的数据变得很容易。但是对于传统的批量学习技术来说,如何从日益增加的新数据中得到有用信息是一个难题。随着数据规模的不断增加,对时间和空间的需求也会迅速增加,最终会导致学习的速度赶不上数据更新的速度。机器学习是一个解决此问题的有效方法。然而传统的机器学习是批量学习方式,需要在进行学习之前,准备好所有的数据。为了能满足在线学习的需求,需要抛弃以前的学习结果,重新训练和学习,这对时间和空间的需求都很高,因此,迫切需要研究增量学习方法,可以渐进的进行知识更新,且能修正和加强以前的知识,使得更新后的知识能适应新增加的数据。   本文分别对奇异值分解和模糊神经网络的增量学习进行了深入地研究和探讨,主要工作及贡献如下:   1.提出无协方差的增量奇异值分解   传统的奇异值分解(Singular Value Decomposition:SVD)采用批量计算方法,需要在计算之前将所有数据准备好,因此无法满足在线处理需求。本文提出了一种无协方差奇异值分解(Candid Covariance Incremental Singular Value Decomposition: CCISVD)方法。该方法通过当前样本估计样本协方差阵,提出了从顺序到达的样本中增量求取协方差阵的第一个特征向量的方法,从而避免了样本协方差阵的求解,从理论和直观上分析了该方法的可行性。在求解其他特征值的过程中,从当前估计的特征向量的补空间中寻找样本,从而始终保证了求取的特征向量的正交性,节约了时间和空间成本。   2.提出免修剪连续增量学习模糊神经网络模型   模糊神经网络的结构识别很耗时。为了避免产生冗余规则,通过把修剪策略引入模糊规则的增加过程来提高学习效率,本文提出一种免修剪增量连续学习算法,利用误差下降率,来定义规则对系统的输出贡献,作为规则的增长标准,从而在规则的增长过程中避免产生冗余规则。同时,由于计算规则对系统的输出贡献是根据当前输入数据,从而实现了增量学习。   3.提出优化修剪的增量极速学习模糊神经网络算法   ELM(Extreme Learning Machine)是为训练单层前馈人工神经网络(Singular Layer Fuzzy Neural,SLFNs)的一个简单而有效的学习算法,该网络的神经元随机产生。理论和实验都表明ELM准确而快速。为了能实现在线增量学习,本文对ELM进行了扩展。该算法中,模糊规则的前件参数和初始规则数量随机产生,然后使用SVD对规则按照重要性排序,通过留一法(Leave-One-Out; LOO)选择出最佳的模糊规则数,最后模糊规则的后件参数通过基于风险最小化分析计算得出。仿真实验结果表明,与其他算法相比有较好的鲁棒性,在准确率和计算速度上都具有优势。   4.提出基于规则影响的自适应增量模糊神经网络模型   在模糊神经网络中,一个模糊规则可能初始时比较活跃,之后慢慢变得对系统的贡献很小。本文提出一种基于规则影响的增量学习模糊神经网络(Self Adaptive Incremental Learning-Fuzzy Neural Network),引入模糊规则影响的概念,基于当前数据计算模糊规则对系统输出的影响,作为模糊规则增长或删除的标准。并且将规则的增长标准同系统的准确性联系起来,只有该模糊规则对系统的贡献值大于某个阈值,才考虑增加一条新规则,同时还检测已有规则库中规则对系统的影响值,如果低于某个阈值,说明该规则已经变得不再活跃,则删除该规则。无论是新增规则还是已有规则都通过扩展的卡尔曼算法更新参数。通过仿真实验表明该方法能获得比其他高代价的技术更简单的结构、更短的训练时间和较好的泛化性能。   5.基于增量模糊神经网络和小波的人脸识别   为了能提高样本质量从而提高识别准确率,本文提出一种新的提取人脸图像特征的方法。首先使用Harr小波对人脸进行分解,小波变换后的高频部分是人脸很重要的特征,这部分将作为人脸特征向量保存起来。然后使用Fisher线性鉴别分析(Fisher Linear Discriminant,FLD)对低频子图进行再次降维。降维后的向量和保存的高频部分特征向量连合起来作为模糊神经网络的训练样本,使用本文提出的自适应增量模糊神经网络学习算法训练网络。仿真实验表明,这种经过预处理后学习的模糊神经网络,其识别率高于不使用Harr做预处理的网络。
其他文献
时滞、控制带约束是实际工业系统中常常遇到的问题,时滞的存在会使系统信息传递延时,而不考虑约束条件设计出的控制器往往达不到系统控制要求,甚至可以导致系统不稳定。另一
随着光伏、风电等可再生能源的规模日益扩大,分布式发电(Distributed Generation DG)技术得到了广泛的应用。微电网是通过不同的功率变换器将各种DG连接在一起构成的系统,因而合理地控制功率变换器能让系统稳定地运行。本文针对由光储构成的独立微电网系统,重点研究该系统基于虚拟同步发电机控制下的稳压稳频。直流侧电压的稳定是系统稳定运行的关键条件。利用光伏发电和蓄电池各自的特点,将两者结
高光谱遥感图像含有大量的光谱波段,有助于地物的详细分类与识别。然而,随着波段的增加,数据冗余度也相应增加,使得图像融合计算量增大,过程繁杂,以及融合图像边缘提取引发的弱边缘丢失。因此,本文主要针对高光谱遥感图像的融合与融合图像边缘提取,作如下研究:(1)针对传统高光谱遥感图像融合造成光谱失真、原图像细节信息缺失的不足,本文提出了基于波段背景清晰度的小波高光谱图像融合。首先,使用J-M距离和最佳指数
学位
随着计算机视觉和数字图像处理技术的发展,图像分割已成为各种图像处理和图像分析必不可少的步骤。因交互式分割相较于自动分割能达到更准确的结果,已逐渐成为了图像分割中流行
随着以太网(Ethernet)在诸多领域的广泛应用,许多原本独立的设备和系统开始与Internet互联,使越来越多的信息资源共享成为可能。基于嵌入式以太网技术的数据采集系统就为这种
传统的网络视频监控虽然解决了远程监控的问题,但在人力消耗和智能处理方面仍有许多改进的空间,国内外学者在视频监控领域的研究逐渐从PC控制转移到嵌入式处理器控制,利用嵌
血红蛋白浓度是人体生命特征中的一个非常重要的参数。传统意义上的血红蛋白浓度检测方法均为有创法,需要先对人体进行采血,然后利用血红蛋白浓度计等分析仪器进行分析,这样不但
模糊神经网络作为智能控制领域中一支倍受关注的分支,它是模糊推理技术和人工神经网络技术的有机的结合,这种结合既弥补了模糊推理技术在学习方面存在的缺陷,又使人工神经网
学位
混合流水车间调度问题(Hybrid Flow Shop Scheduling Problem,HFSP)是传统流水车间生产调度问题的一种推广,旨在根据生产中的各种约束条件对工件及各阶段的并行机器进行合理分配。与传统的流水车间调度问题相比,HFSP多工序、多阶段的特点更加贴近生产实际。此外,实际生产过程中还存在各种动态事件,机器故障是其中出现频率最高的干扰事件,对车间生产影响极大。因此,研究混合流水