论文部分内容阅读
机器学习领域中存在许多有效的学习模型,它们可被用于解决各种真实世界的应用问题。常见的机器学习方法有支持向量机、人工神经网络、K近邻算法、朴素贝叶斯、决策树等。其中,人工神经网络以其独特多变的网络结构和强大的关系模拟能力成为机器学习领域中最流行的方法之一。作为人工神经网络的学习算法之一,超限学习机具有简单、快速、有效的特性,它专门用于解决单隐层前馈式神经网络的模型建立。由于其潜在的优点,超限学习机已经在许多应用领域中取得了显著的效果,但它的学习模型和算法性能也面临着两个严峻的挑战:(1)网络参数随机生成的问题。超限学习机的网络输入连接参数和隐含层阈值随机产生,其网络输出连接参数通过分析计算。随机生成的网络连接参数容易导致超限学习机模型在解决实际应用问题中性能不足的现象。(2)小样本数据问题。在某些实际应用中,数据样本的获取是十分困难的,这样容易导致样本不足。在处理这样的小样本数据问题时,超限学习机容易出现过拟合的现象。上述两个潜在的问题是从超限学习机的算法层面上考虑的。目前,超限学习机在高光谱遥感图像中的应用也受到了广泛的关注。在应用层面上,传统的超限学习机仅使用基本的光谱特征进行学习,而无法深层次地利用其潜在的空间信息。因此,超限学习机在高光谱遥感图像中的应用上往往没有较好的性能表现。为此,本文从算法层面上开展超限学习机的改进算法研究以及从应用层面上开展超限学习机在高光谱遥感图像中的应用研究,并取得了创新性的研究成果:(1)有监督的网络参数生成方法:基于文化基因的超限学习机算法针对超限学习机的网络连接参数随机生成的问题,将文化基因算法引入到超限学习机中,以有监督的方式为其网络自适应选择合适的连接参数。通过使用由自适应差分演化算法和模拟退火算法组成的文化基因算法,网络参数的候选组合经过适应度值计算、全局优化方法和局部搜索策略的有效演化学习步骤进行优胜劣汰,最优的参数组合最后在竞争过程中保留下来并用于提出的网络模型建立。实验结果表明,在标准数据集上,提出的方法相比于其他先进的超限学习机改进算法,取得了良好的分类效果。(2)无监督的网络参数生成方法:基于自编码机的超限学习机算法目前关于超限学习机的网络参数生成方法均为有监督的学习方法,但是在一般情况下,数据类标的获取代价较高。在有监督方法的研究基础上,将自编码机引入到超限学习机中,以无监督的方式为其网络选择合适的连接参数。通过使用基于超限学习机的稀疏自编码机,以L1范数优化的方式求解网络输出连接参数,并将数据潜在信息编码于其中。然后通过矩阵倒置和向量平均的计算来为提出的网络模型决定合适的连接参数。实验表明,在不同研究领域的标准数据集上,提出的方法对比于其他超限学习机改进算法和有监督的超限学习机网络参数学习方法,取得了良好的分类性能表现。(3)小样本数据问题的解决方法:基于示例克隆的超限学习机算法针对现实世界中小样本数据的应用问题,将示例克隆技术引入到超限学习机中,通过以局部学习的方式减轻样本数据的不平衡分布,并减轻学习模型过拟合的潜在问题。示例克隆技术通过使用K近邻的算法思想为每个测试样本从训练数据中选择近邻样本,然后利用独特的计算方式确定它们的克隆数。最后使用超限学习机在原始数据集和近邻样本的局部克隆示例上进行学习。实验表明,在数据集和额外的真实图像分类数据集和真实文本分类数据集上,提出方法相比于先进的超限学习机改进算法和传统的机器学习方法,算法性能表现更佳。(4)光谱-空间遥感图像分类方法:基于超像素的核超限学习机算法高光谱遥感图像数据是由众多的光谱特征组成的。一般情况下,除了基本光谱信息外,遥感图像还包含潜在的空间信息。为了充分利用遥感图像中丰富的空间信息,提出了基于超限学习机的光谱-空间高光谱遥感图像分类算法,以提高遥感图像的地物覆盖分类精度。该方法使用超像素分割方法和主成分分析法进行无监督的空间特征提取,使用基于核的超限学习机作为分类器在光谱特征和空间特征组合而成的特征上进行遥感图像土地覆盖的分类识别。实验表明,在经典高光谱遥感图像数据中,与其他遥感图像分类方法相比较,提出的方法具有更好的土地覆盖识别能力。综上所述,本文分析了超限学习机算法的不足,在此基础上,从算法和应用两个层面对超限学习机进行了研究。在超限学习机的算法层面上,重点研究了关于网络参数生成的有监督方法和无监督方法以及关于小样本数据问题的解决方法;在超限学习机的应用层面上,提出了光谱-空间高光谱遥感图像分类的学习算法。研究中的实验证明了本文提出算法的有效性。