基于支持向量机的脱机手写相似汉字识别的研究

来源 :北京科技大学 | 被引量 : 6次 | 上传用户:jiguoqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然脱机手写体汉字识别技术具有广阔的应用前景,但是由于脱机手写体汉字自身所特有的复杂性,使得识别系统的实现具有很大的难度,目前还没有十分成熟的产品。研究表明相似汉字的存在是影响系统识别率低的主要原因之一,因此我们必须花大力气解决手写体相似汉字的识别问题。鉴于支持向量机在小规模细分类问题上的优势,本文以脱机手写体相似汉字为对象,深入研究了基于支持向量机的手写体汉字识别中的若干核心问题,做了以下几方面具有创新性的工作:首先,基于核函数的黎曼几何分析,提出了一种SVM自动模型选择方法。该方法先利用基于粗网格与模式搜索相结合的全局优化搜索算法,依据分类器性能评价准则来获得优化的SVM模型参数;之后再采用文中所提出的新保角变换,对核函数进行数据依赖性改进,进一步提高分类器泛化能力。其次,研究了两种不同形式下的特征选择方案:①针对单目标特征选择问题,提出了一种基于单目标改进GA算法与交叉验证SVM分类的特征选择方案;②针对多目标特征选择问题,提出了一种基于Pareto优势的MOGA算法与SVM分类的特征选择方案。这两种方案均属于利用SVM分类器反馈信息的Wrapper求解方法,能在不降低系统泛化性能的情况下,获得维数较小的特征向量。然后,针对DAGSVM分类器的存在问题,提出了一种新的基于结构优化的模糊多值DAGSVM分类器。根据分类器性能评价准则,给出了训练阶段离线获得结构优化DAGSVM的算法;在识别阶段,模糊多值DAGSVM分类器利用模糊隶属度函数与平均算子获得分类识别结果。与其它基于组合策略的多值SVM分类器相比,该分类器具有更高的识别精度和识别速度。最后,在分析客观相似汉字的相似特性基础上,建立了一个较为实用的手写体相似汉字样本库,为今后的进一步研究奠定了基础;提出了一种基于小波弹性网格提取特征、利用遗传算法选择特征和SVM分类相结合的手写体相似汉字识别方案,实验结果表明了该识别方案的可行性和有效性。
其他文献
电感耦合高频等离子体发射光谱法测定木耳膳食纤维多种微量元素的方法。采用湿法酸消解制备样品,硝酸:高氯酸(10:1),120℃恒温消化溶解,酸度控制<10%,满足ICP-AES测定的要求。经检测国
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
所谓知识经济,是人类在其发展历程中,由于科技迅速崛起带来的经济结构重大变革,是其积累到一定程度,以及知识在经济发展中的作用,增加到一定阶段的历史产物。知识的比重越来
所谓奠基作品,我认为,犹如民间所言三岁看老之谓也。在报告文学成长、成熟、危机等等的发展过程中,我们无不时时刻刻看到他身工》这一奠基作中蕴涵的潜在基因的影子与作用。当然
阐述了高速铁路接触网无交叉式线岔的相关内容,介绍了我国高速铁路接触网无交叉线岔的主要形式,并对高速铁路接触网无交叉线岔结构中存在的问题及其应用进行了研究。
<正> 在Excel中进行快速计算 适用版本:Excel97、Excel200、Excel2002 想知道一系列单元格的最大值吗?虽然您可以创建公式来完成这一工作,但还有一个更快的方法。 查看一系列
海外电力工程项目管理具有其自身特点,要求电力企业不断摸索和调整自身的管理模式,以应对外界越来越复杂的市场环境与竞争压力。F+EPC模式是应业主及市场需求而派生出的一种新型