基于多神经网络集成的手写数字识别

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:ylzhou40
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。由于阿拉伯数字的世界通用性,并且数字的识别和处理也常常是一些自动化系统的核心和关键,所以对手写体数字识别的研究通用性强,且意义重大。在对多种手写字符识别的相关技术进行调查和研究后,本文提出了一个基于多级神经网络集成的手写数字识别仿真系统,面向脱机手写体孤立数字的识别。整个系统由四个模块构成:首先以图像预处理模块和字符特征提取模块作为模式数据输入的基础;其次采用多个BP神经网络作为识别的核心分类器,即分类模块;然后对这些神经分类器的输出结果进行融合判决来获得最终识别结果,即决策模块。本文的主要研究工作集中在特征提取和多分类器融合识别上。在特征提取方面,在对多种有发展潜力的特征提取方法进行实验分析的基础上,提出了一种全局特征和两种局部特征作为主特征,并组合一系列低维辅助特征的组合方法。实验证明这三组组合的特征向量对手写数字均具有高分类能力。在多分类器融合方面,将本文提出的融合方法与对其它多种融合方法进行了实验分析和对比。实验表明,利用多分类器融合策略均可以达到高精度识别,并且本文提出的融合方法略优于其它融合方法。本文第一章介绍了手写体数字识别的应用前景、研究现状以及研究方法,并介绍了模式识别的常用方法,说明了手写体数字识别的难点和其广阔的应用前景。第二章介绍了手写体数字识别中的预处理技术,包括图像的平滑、二值化、图像规范化,细化等技术,同时介绍了本文提出的细化后处理算法。第三章介绍了特征提取技术,以及本文的识别系统中使用的特征提取算法,并通过实验分析选择了最佳特征组合方案。第四章介绍了神经网络的原理和算法,并指出神经网络用于手写数字识别的内在机理和独特优势。最后,通过本文提出的数字识别仿真系统对MNIST手写数字图像库分别进行了三种单分类器识别实验和多级分类器的若干融合方法实验。实验表明单分类器最好识别率为98.14%,而多分类器融合方法的识别性能均高于单分类器系统,最高识别率达到了98.47%。最后,加入4%左右的据识策略时,得到99.60%的识别精度,错误率仅为0.38%,具备实用价值。
其他文献
烧结为高炉炼铁提供原料,烧结矿产量的高低、质量的优劣都将直接影响到炼铁生产的产量、质量及能源消耗。烧结终点是烧结结束时的位置,作为判断烧结过程的重要参数之一。烧结
由于无线传感器网络节点计算能力、通信能力和能量供应能力的局限性,大规模、高密度传感器网络对路由拓扑控制提出了很高的要求。良好的拓扑结构,能够提高路由协议和MAC协议的
随着货币的电子化发展,信用卡在银行业务中所占的比例越来越大。信用卡业务的开发、应用、服务、管理的水准直接关系到银行的经济收益。通过对信用卡业务数据的分析、挖掘,可以
近年来随着万维网甚至企业内联网内信息量的不断增加和人们对个性化搜索的需求的增大,文本体裁分类在计算语言学中的重要性逐渐得到体现,文本体裁自动分类问题已成为当前计算语
背景差分是目前视频领域中运动检测最常用的一种方法,主要思想是比较视频图像序列中的当前帧和背景参考模型来检测目标,但是受内外条件变化的干扰,存在虚警、相机抖动等许多
XML(可扩展标记语言),作为网络上数据表示和信息交换的工具,以其自描述性、独立于平台等特点,已经成为新一代的网络语言。随着XML的广泛应用,XML上的索引及其相关技术的研究
研究的目的是建立一套自动化程度高、技术先进的玻璃瓶在线检测系统。该系统要求实现两个基本检测功能:玻璃瓶直径测量和模号识别。在对尺寸测量和模号识别的相关技术深入研
勘探生产门户是用微软企业信息门户解决方案实现的。随着门户文档的上载,门户内目前各类文档数达到了53733个,勘探生产公司领导和员工提出了准确、快速地检索到这些文档的要求,
数字图像修补,是利用受损区域周围的图像信息给受损区域填充信息的一门技术,本质上是一种图像插值问题。它属于图像复原的研究领域,是图像处理领域的一个分支。在多余物体的剔除
Shor于1994年提出多项式时间内求解大因数和离散对数的量子算法,使得目前使用的基于大因数分解困难性提出的RSA公钥密码体制可以被量子计算机快速破解:Grover提出量子搜索算法,