【摘 要】
:
光学字符识别(OCR)是指将纸上的文字转化为计算机所能处理的形式(如ASCII码)的过程。手写体字符识别是光学字符识别的一个分支,手写体字符识别在邮政信件分拣、银行票据的自
论文部分内容阅读
光学字符识别(OCR)是指将纸上的文字转化为计算机所能处理的形式(如ASCII码)的过程。手写体字符识别是光学字符识别的一个分支,手写体字符识别在邮政信件分拣、银行票据的自动处理、手机和掌上电脑的输入等领域有着巨大的作用。由于手写体字符的随意性,使其识别难度大于印刷体字符。而诞生于上世纪九十年代的支持向量机是一种基于小样本的新的统计学习方法,在许多方面(包括字符识别),都取得了优秀的效果。但是,传统的支持向量机训练算法在时间复杂度上面的表现不尽如人意,如果训练样本的数量过大,消耗的训练时间和存储空间会急剧增大。针对这种情况,本文提出一种改进算法,即尽量选择那些有可能成为支持向量的训练样本来具有针对性地加以训练,从而可以减少时间与空间的消耗。 本文主要做了以下工作: 1 由于核函数的存在,使得训练样本之间的距离在由输入空间到特征空间的映射之中产生了变化。为此,本文分析了训练样本之间的距离在输入空间与特征空间的联系。 2 本文针对不同的核函数,探讨并证明了训练样本在输入空间和特征空间的两个空间的距离之间的联系,并在此基础之上,提出一种基于KNN(K Nearest Neighbors)属性的训练样本选择方法,通过减少参加训练的样本数来减少训练所需要的时间。本文探讨了算法所选择的样本数。由于选择的样本数要小于原训练样本集而包含的支持向量却与原样本集相当,从而在减少训练时间的同时保持了分类正确率。 3 在MNIST和UCI的数据库上对本算法与SMO算法进行了对比实验,得到的结果是在辨识正确率基本不变的情况下,消耗的时间大量减少。
其他文献
移动AdHoc网络(MobileAdhocNETworks,MANET)是一组具有路由功能的移动节点组成的分布式无线多跳网络,不依赖于任何预设的基础设施。MANET网络具有网络拓扑动态变化、无线传输带
当前,随着Web2.0概念的提出,AjaX技术作为富互联网应用程序(RichInternetApplications,RIA)实现技术中的一种,已成为web技术领域的研究热点。并且这股研究热浪在google推出google
变化是软件开发所面临的永恒主题,软件需求的变化给软件开发提出了很大的挑战。为了满足这种变化的需要,必然要设计一种能够和企业业务同步发展的软件体系结构。该体系结构应
近年来随着互联网的高速发展,人们进入海量的信息时代, XML以其强大的数据表达能力以及简单、开放性、可扩展等优点而逐渐成为互联网上信息发布和数据交换的标准。但随着XML
随着计算机技术、通信技术以及互联网技术的飞速发展,基于网络的Web应用软件随之快速风靡全球,并渗入到社会的各个应用领域,成为当前和未来的软件系统开发的主流。为了保证日益
在四面体网格剖分之前,首先要建立待剖分三维实体边界表面的离散化表达,亦即由三角网格来代表三维实体表面。此时,三维实体的“边界”是指“边界表面网格”,它既具有几何性质
现今计算机和互联网技术的迅速发展不仅带来了具有更强计算能力的计算机、更加便捷的信息交流方式,而且也对计算机软件的安全性和可靠性提出了更高的要求。目前软件安全性的保
在基于对等网络的流媒体数据技术研究中,高效稳定的媒体数据传输管理是一个重点研究内容。目前基于对等网络的直播技术已经日趋成熟,但由于点播平台固有的高度交互性特点使其
随着并行技术和并行语言的发展,处理并行语言的并行编译技术,将串行程序转换成并行程序的自动并行编译技术正在深入研究之中。语法分析是编译系统设计最重要的内容之一,而扩增式
在当前的网络信息时代,数据信息不仅庞大而且呈多样化。为了充分利用Web上的数据信息,信息集成已经成为一种必然的要求。XML作为兼具可扩展性及灵活性的通用数据传输格式,越来越