基于改进遗传算法的神经网络输入约简

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:e56urty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于神经网络的分类器是模式识别领域中广为使用的一种分类方法。为了得到精度很好的神经网络分类器模型,需要对神经网络的训练数据进行特征约简,删除冗余特征和无关特征。约简后的训练数据不仅可以优化神经网络的结构,减少冗杂的隐含层节点,更重要的是,它可以大大提高神经网络的训练速度,并降低神经网络的分类误差。特征最优组合问题是一个NP问题,会随着特征个数的增加而出现组合爆炸,其时间以指数级别增长,传统的优化方法难以胜任。为此,设计了一种通用的基于遗传算法的特征组合优化方法。该方法将特征组合视为一个个体,由多个个体组成一个群体,通过种群的选择、交叉、变异,逐代演化从而得到较优的组合。为了解决初始种群远离最优个体,导致的收敛速度慢、易陷入局部极少的问题,在种群初始化时,计算各个特征的信息增益,作为各个特征对类别的区分度,对于信息增益值大的特征,给予更大的被选入初始个体的概率。为了节省个体适应度值计算时间,采用Hash表保存每代具有不同基因序列的个体,以便进一步加快遗传进化的速度。采用机器学习公共数据库—UCI(UCI Machine Learning Repository)中的14个数据集,对每个数据集进行了10次实验,每次实验都以十次交叉验证方式得到结果,10次实验结果均值作为每个数据集的最终结果。实验表明,信息增益启发下的初始化种群方式,能够有效改进遗传算法的性能,提高初始种群适应度的整体水平,并加快遗传算法的收敛速度,快速得到较优的特征组合,从而优化了神经网络的结构,提高了神经网络的训练速度,降低了神经网络的预测误差。
其他文献
随着多核处理器成为主流产品和工业标准,如何在屏蔽处理器底层细节简化编程方式的同时充分利用多核处理器的并行资源,是并行程序设计领域的研究热点和难点。流编程作为一种高
随着移动定位设备和移动互联网技术的飞速发展,越来越多的网络对象被贴上地理位置标签和文本描述信息,这种对象称为空间文本对象。在实际应用中,用户可能在未来一段时间内查
正交区域查询一直是应用科学领域中的重要课题,尤其在数据库查询和计算几何中被广泛深入的研究,并已经在数据库查询、地理信息系统、计算机图形学、数据挖掘和多媒体信息检索
人脸识别已成为图像分析和理解中最成功的应用之一,其在安全监控、存取控制、人工智能、人机交互等方面得到了广泛应用。但由于年龄变化会引起人脸形状和纹理上的变化,并且对
随着信息技术的发展,对于大量数据的有效存储需求急剧增加,文件数据的安全性受到越来越多的关注。在此背景下,对数据存储与数据安全技术进行分析与研究,设计并搭建了数据安全
随着互联网技术的发展,Web技术使GIS功能得到扩展,具有广泛应用前景的WebGIS技术孕育而生。WebGIS以网络为平台,改变了传统GIS的运行模式,使之不再是少数专业人员使用的工具,成为
交通拥堵已严重的影响城市的发展进程。为了改善城市的交通服务水平,当今世界主要国家都在研究智能交通系统(Intelligent Transport System,ITS),而浮动车技术正是一种为适应
乳腺癌计算机辅助检测与诊断系统是早期乳腺癌检测的重要辅助工具。乳腺钼靶图像增强技术是其中的重要研究内容之一,其目标是提高乳腺癌的检测水平。针对图像中存在模糊、噪
量子纠错码是近年来兴起的用于克服量子信息在存储、传输和计算过程中所发生的量子消相干效应的新型编码技术。量子纠错码在量子计算机的实现、量子安全通信以及容错量子计算
随着信息技术的日益发展,如何处理海量数据成为目前的研究热点。Map Reduce分布式计算框架以其处理数据量大、简单易用、可扩展性强等特点成为进行大数据处理时的主要选择之