论文部分内容阅读
随着信息时代的发展,爆炸式增长的数据采集、处理和分析对各行业来说都是巨大的挑战。机器学习凭借其对数据内在规律的把握而日益凸显出重要性。其间,也涌现出了很多优秀的机器算法,如人工神经网络、BP神经网络、支持向量机以及超限学习机等。其中,超限学习机是一种基于单隐层前馈神经网络的算法,它随机生成输入权重以及隐层偏差,直接计算得到输出权重,其学习速度相较于基于梯度下降算法的前馈网络学习算法速度快很多倍,并且实现了很好的泛化能力。用超限学习机训练单隐层前馈神经网络,可以同时使训练误差和权值达到最小。在节省训练时间和提高训练精度方面都取得了很好的效果,克服了传统的基于梯度下降算法中反复迭代调整参数以及陷入局部最优的问题,为训练单隐层的前馈神经网络提供了新的思路。然而,超限学习机在一些地方还存在欠缺。因此,本文对超限学习机算法进行了深入的研究,针对其硬件电路实现、随机产生的输入权重不稳定以及单个超限学习机处理不平衡数据分类的问题效果欠佳等方面分别做出了改进。首先推导出了一种基于忆阻器的新型激活函数并应用于超限学习机中。然后,用分段生成随机数的方法代替原来直接随机的方法以增强算法的稳定性。最后,提出一种基于分层交叉验证的集成超限学习机,解决单个超限学习机处理不平衡分类问题的不足。本文的主要研究内容有下面几个部分:(1)将忆阻器反向连接,在忆阻器模型中加入非线性窗函数。利用其忆阻值和电荷的关系实现了一种新的激活函数,也就是忆阻激活函数,并将其应用于超限学习机中。忆阻器作为新兴的非线性纳米器件为超限学习机的电路实现提供了可能,而用其实现激活函数也为忆阻器提供了新的应用思路。(2)改变了传统的直接随机产生输入权重矩阵的方法。随机产生的输入权重不稳定,同时会降低算法的准确率。本文令输入权重分段随机产生,一半矩阵在(0,0.5)随机产生,另一半在(0.5,1)随机产生,再将两个矩阵打乱重组后的矩阵作为输入权重矩阵。用两次随机来增加输入权重的随机性并增强网络的稳定性。并将改进后的算法用于灰度和彩色图像的压缩重建。(3)结合超限学习机算法、分层交叉验证方法和集成学习,提出了一种基于分层交叉验证的集成超限学习机。在网络训练的阶段加入集成算法可以有效改善单个分类器在不平衡分类中的不足。分层交叉验证即按样本比例抽样再进行交叉验证,可以最大化的让算法在训练中学习样本的分布特点。对来自KEEL数据库和加州理工学院数据库的不平衡数据实验表明,改进的算法综合了两种方法的优点,在不平衡数据的分类问题中效果很好,非常快速并且稳定。