前馈神经网络工作机理分析与学习算法

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yxdongdong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工神经网络(ArtificialNeuralNetworks,ANN)是一个高复杂度的非线性系统,虽然从形式上模拟了人脑的学习结构,但由于所依赖的生物学理论基础尚不完善,因此人工神经网络不仅功能上远远没有达到预期的接近于人脑学习能力的目标,而且对于现有神经网络模型的工作机理也不明确,使神经网络模型的研究和性能的改进也就变得越来越困难,应用领域也受到一定的影响。本文以构建更有效的人工神经网络模型为目的,以神经网络的工作机理分析为基本出发点,采用非参数化的决策树(DecisionTree)与传统人工神经网络结合的方法,研究神经网络的结构设计方法,并进一步探讨了人工神经网络的增量学习算法,主要包括以下几方面的工作。 (1)对前馈网络的工作机理进行分析,首先证明了分类前馈网络和决策树的等价性,在此基础上,结合神经元的高维空间几何解释,对前馈网络模型的工作机理做了合理的分析,给出了如下的解释:在分类时,前馈网络通过学习正反例样本,对样本空间按照所属类别进行划分。对于一个三层前馈网络,其输入层起到形成决策界面(分割)的作用,隐层起到形成决策域(对决策界面“与”)的作用,输出层则是对决策域进行综合(对决策域“或”)的作用。并对影响神经网络泛化能力、增量学习能力的原因和因素做了直观的分析。 (2)提出了神经网络结构设计的信息论方法根据对分类前馈网络的分析,指出了前馈网络采用三层结构比较合理。针对离散和连续属性的分类问题,根据三个层次神经元的具体意义,提出了神经网络结构设计的信息论方法:基于决策树的神经网络(DecisionTree-basedNeuralNetwork,DTBNN)和基于熵的神经网络(Entropy-basedNeuralNetwork)EBNN设计方法。DTBNN是一种针对具有离散属性数据的分类问题的,利用决策树确定神经网络结构、权值和阈值初始值的系统的神经网络设计方法。该方法提高了神经网络的学习速度和学习结果的稳定性,实验结果也表明DTBNN的比熵网络的收敛速度快,且识别率也有所增加。EBNN则是针对具有连续属性数据的分类问题,把熵作为选择神经元的准则来构建神经网络结构的方法。EBNN神经网络的结构趋于简单、易于理解,并对神经网络某些参数可以进行合理设置。同时,EBNN采用分层、分类学习机制使神经网络的学习过程得以简化,解决了前馈网络的信任分配问题。EBNN在相同的神经元数目的情况下其容量要比全连接网络的容量大,因此也比全连接网络有更好的泛化性能,且该方法一定收敛。实验结果也表明EBNN的有效性。 (3)基于集成系统的神经网络增量学习,本文采用基于神经网络集成系统的方法实现前馈网络在有限的存储空间和计算复杂度下使神经网络学习新的知识时尽量保持知识结构的唯一性的增量学习能力。基于集成系统的增量学习方法以主动学习为基础,通过把新知识的样本作为重点学习的目标,结合神经网络集成系统的特性,在对原有知识结构不加任何修改的基础上实现了知识的增量学习。在LEARN++算法基础上,该算法借助于Boosting技术中主动选择样本的过程解决了神经网络的不能学习只有正例样本和小样本问题,并有效地选择了构成集成系统的个体网络,使其增量学习的泛化性能比LEARN++有很大提高。基于集成的增量学习算法增加的计算开销很少,几乎可以忽略;而所需的存储容量也在一个合理的范围内。基于集成系统的神经网络增量学习算法具有一定的普适性,也可以用于其他学习模型。
其他文献
不完全信息数据库与 SQL 语言的语义是数据库理论的两个重要研究方向,不仅具有重要的理论价值,而且还具有很高的应用价值。本文借助中介逻辑谓词演算系统 MFM,对不完全信息系
工作流技术是重要的协同应用支撑技术之一,它通过对业务过程进行建模、执行和管理来完成业务目标。工作流模型建立起来之后,模型正确性验证和工作流执行时的并发控制成为需要
对象管理组织OMG是独立于各厂商的非盈利性组织,其宗旨是要统一不同的商业产品和标准之间的数据交换及互操作性,从而改善各厂商的软件产品之间不兼容的情况。为此,OMG为分布
本文以2003年广东省关键领域重点突破项目:“互联网文化娱乐软件开发”为背景,在参与开发三维游戏引擎的过程中,研究了在三维游戏引擎中实现刚体运动模拟的若干理论与方法,重点研
随着互联网技术的迅速发展、互联网上信息量急剧增加,网络已成为人们获取信息的重要途径。用户渴望在膨胀的资源中快速检索出自己想要的信息的愿望,迫使传统搜索引擎向智能化、
频繁模式的挖掘一直是数据挖掘中的重要研究领域之一。随着计算机软硬件的发展,传统中的确定性数据可能存在缺失、出现噪声值,从而产生大量不确定性数据,如传感器、卫星图像
网络教育是随着现代信息技术发展而产生的一种新型的教育形式,鉴于目前的网络教学系统多数缺乏智能性、自适应性、自主性和各环节的互通性以及交互性,可以采用Agent技术对上
随着计算机互联网科技的不断进步,网络化教学已逐渐被教育工作者所认同,成为现今教育的一个重要发展方向。网络化教学评量也逐渐扮演着一个重要的角色。教学评量一方面为教师
计算技术和无线通讯技术的发展与结合使得一种全新的计算模式—移动计算模式成为现实。在移动计算环境下,用户使用便携式计算机通过无线通讯接口实现对信息网络的访问,而不受
XML(eXtensible Markup Language)是继HTML之后发展起来的一个重要的Internet技术。已经成为Internet上数据表示和交换的新标准。随着Web应用的迅猛发展,XML数据量与日俱增。