基于主曲线的脱机手写字符识别的研究

来源 :同济大学电子与信息工程学院 同济大学 | 被引量 : 0次 | 上传用户:uxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的发展和数据处理速度的不断提高,高数据流量的需 求性与传统的人工输入的低速度之间产生了巨大的矛盾,这在一定程度上减缓 了社会信息化的进程,因而作为信息化基础的数据输入成了计算机应用中的瓶 颈问题。研究开发光学字符识别技术实现各种文字数据自动高速地录入计算机 是解决这个瓶颈的关键。一旦实现信息的自动录入,将产生巨大的社会和经济 效益,而且字符识别的深入研究,必然会促进模式识别及其相关学科的发展。因 此无论在理论上还是在应用上,字符识别的研究都具有重要的意义。在整个光 学字符识别中,由于手写字符存在变形,粘连和断笔等原因,目前脱机手写字 符的识别技术还未成熟,它离实际应用还有一定距离,因此它在一个较长的时 间里是模式识别领域中研究的主题。 本文在对大量字符特征抽取和分类器设计方法分析研究的基础上,根据字 符非线性、非结构化的特点,综合应用主曲线、粗糙集等分析技术,提出了基 于主曲线的脱机手写字符特征分析与选取方法、主曲线与粗糙集相结合的分类 器设计方法。同时,从实验上来分析和探讨主曲线的一些重要几何性质,得到 一系列重要结果。最后在具体票据识别系统实例中,提出了有效的数字框定位 和数字切分方法,并结合分类器设计了票据识别系统,来进一步例证它们的应 用价值。总的来说,本文工作的主要创造性研究成果有如下几个方面: 首次把主曲线这一新的理论用于脱机手写字符识别,且提出了基于主曲线 的脱机手写字符特征分析与选取方法。主曲线是通过数据分布中间并满足“自 相合”的光滑曲线,是线性主成分的非线性推广;它能很好的描述模式特征、 保持结构信息以及具有几何直观性好、对平移和伸缩不变等优点,因此本文先 选用主曲线算法来提取字符的结构特征;然后通过分析,选取出字符的有效模 式特征进行分类;最后从实验角度把它与其它特征选取方法进行比较,从而来 深入分析及验证其有效性,不但为脱机手写字符识别的研究提供了一条新途径, 而且也是对主曲线实际应用的探索与补充。 提出的知识约简算法,并结合基于主曲线抽取的特征来设计分类器。粗糙 集理论的知识约简是从决策表中获取分类规则的有效工具。本文首先选取出训 练字符的模式特征;然后由算法形成决策表;最后利用我们提出的知识约简算 法来对决策表进行处理,自动获得分类规则。实验结果表明该算法取得了满意 的结果,实用价值较高。 把分类器用于票据识别系统的具体应用实例中,在具体实现中,我们提出 一种有效的数字框定位技术、改进多阈值动态二值化算法、边框处理方法,并 用于从票据中提取待识别数字串;然后给出有效的数字串分割算法来分割数字 串;最后结合我们提出的分类器设计了票据识别系统。通过具体实例来进一步 例证它们的应用价值。 在对主曲线提出的背景、发展、定义、基本概念和各种主曲线算法深入理 解地基础上,本文提出从实验角度对它的几何性质进行分析和探讨,例如自相 合性、正则性、存在性、唯一性、参数化、初值的选取对生成主曲线的影响。 这样把得到实验的结果和理论结论相比较进行分析,得到一系列重要结论。 关键词:主曲线,非线性数据分析,特征提取,特征选择,粗糙集理论,手写 体字符识别,边框处理,数字切分,票据识别系统
其他文献
随着人们生活水平的不断提高,健康越来越受到重视,因此各种体育运动也如火如荼的开展起来,其中的羽毛球运动更是有着广泛的群众基础。因此,羽毛球的需求量非常大,同时对羽毛球的质
本文以某厂硝酸生产装置为优化对象进行了离线稳态参数优化工作的研究。在研究过程中,作者首先深入该厂了解生产工艺,进行了大量数据采集和分析,并结合了该厂的实际生产经验,
随着微机械电子系统、组合导航技术、车联网和智能交通的发展,现代车载导航系统不仅要求导航具有高精度和高可靠性的定位功能,同时还必须具备高性价比、小型化和易集成等特点。
国外某公司研制的链条滴油润滑系统,结构巧妙、工作可靠,能够在确保润滑效果的前提下极大地节约润滑油,目前已在国外摩托车润滑中获得广泛应用。为了进一步扩大该系统的使用
随着社会与科技的发展,社会竞争的日益加剧,世界各国都在不断加大对武器研究的力度,其中微型飞行器是最受世界各国重视的侦察武器之一,它是在上个世纪90 年代发展起来的一种
降秩估计的基本含义是在估计过程中用降秩矩阵来近似被估计的信道矩阵。降秩估计和滤波在信号处理与通信系统中有广泛的应用,尤其是在处理数据和模型冗余、抗噪声和模型误差的
本文对Viola方法做了一些扩展和改进,并设计了一个快速人脸检测系统。首先,我们对Viola方法中所使用的矩形特征进行了扩展,采用了Rainer Lienhart等人提出的扩展的矩形特征。
能源的发展和利用越发成为人类社会发展的瓶颈,开发可持续发展的绿色能源势在必行。光伏发电因其独有特点成为最具前景的绿色能源之一,因此光伏发电成为学者们研究的一个重要方向,而并网逆变系统是光伏发电的关键环节。由于电网的感性负载和非线性负载大量使用,电网的无功消耗变大、谐波污染也日趋严重,这对电网线路及用电设备带来不同程度的危害。光伏并网逆变器输出有功功率的同时,可以对负载的无功、谐波电流进行补偿,实现
图像融合是指联合两个或两个以上的图像通过某种算法得到一幅更高质量的新图像。由于受物理条件的限制和成像环境的影响,单个传感器图像或者单幅图像往往不能提供人们所需要的