传真收件人姓名字符识别技术研究与应用

被引量 : 0次 | 上传用户:lzt870702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传真文件收件人姓名自动识别系统属于专用OCR系统开发范畴。专用OCR系统的开发,将在很大程度上拓宽OCR技术的应用领域,提高相关应用领域的自动化程度。同时,由于系统所要处理的对象是特定的,在系统的实现过程中所遇到的一些新问题和所采用的新方法,对于OCR技术的研究具有一定的理论价值。在专用OCR系统中,传真收件人姓名字符的识别技术具有较好的应用前景及实用价值。本文针对传真收件人姓名字符的识别技术进行了研究与应用。在字符图像预处理方面,除对传统方法的研究外,根据传真收件人姓名字符图像的特殊性,经过多次实验,选取了适合于传真字符图像的二值化、噪声过滤、倾斜校正、字符大小归一化及细化等方法;针对传真收件人姓名字符可能存在书写线的特点,对书写线的检测和去除方法进行了分析,使用了一种基于数学形态学的书写线去除方法;在字符切分上,对于规格比较统一、字符分离清晰的字符区域使用最常用的基于投影分析的波峰-波谷法对字符图像进行切分,以便进行字符识别,针对投影法无法切分的粘连字符块,采用了一种根据字符笔画信息,寻找合适的分割点和分割路径的分割方法。在文字识别方面,本文基于不同的网络模型有其自身特点,利用多神经网络集成技术,建立了一种利用多特征的多级混合神经网络的识别系统来处理字符识别问题,并提高其识别率。识别系统的分类器由字符粗分类和细分类两级组成,本文的自组织聚类网络可以很好地给出模式在多维空间的概率分布估计,结合字符的笔划复杂性指数、四边码、粗外围轮廓等特征可以较好估计出字符的粗分类结果。BP网络有着优秀的非线性映射特征和对输入矢量的分类能力,使用BP网络和字符的轮廓特征、笔划穿越密度特征构建字符的二级细分类器可以分析相似字符的细微差别。实验结果表明,使用混合神经网络的传真收件人姓名字符识别方法对大字符集样本的识别率达到了91%左右,比使用单一神经网络提高了8%。在字符识别方面,本文还着重研究了支持向量机。支持向量机是属于高维数小样本的学习识别机器,这样在给出了更多特征维数后,可以由少量的样本,就可以达到很高的识别率。结合特征提取方法,我们提取了多达几百维的特征,用支持向量机识别,取得了较高的识别率。文中对四种常用的核函数分别进行了实
其他文献
<正>4月15~18日,亚洲规模最大的公务机展览会(ABACE)在上海举办。本届展会在参展商数量、展示飞机数量方面均创下历史之最,88架订单数亦可谓是一个不错的答卷。与往年不同的
目的探讨护理干预对高血压病患者生活方式的影响。方法回顾性分析2013年1月至2014年1月我院收治的210例原发性高血压患者的临床资料。结果 210例原发性高血压患者,经护理干预
结合中职学校的平面设计行业人才培养和学生的实际情况,Photoshop传统教学方法已经无法满足行业对平面设计人才的需求,单一的教学模式已经不能适应学生的学习需要。该文在理
采用析氢量动态测试方法研究了化学镀铟集流体铜钉与不同产地无汞、低汞锌粉相互作用的动态过程。结果表明:集流体铜钉经无氰化学镀铟处理后,能够降低与锌粉的接触电阻,抑制锌粉
目的探讨综合护理对腰椎结核患者术后生活质量及焦虑情绪的影响。方法将70例腰椎结核患者平均分为研究组与对照组。对照组采取常规护理措施,研究组患者在此基础上应用综合护
论文阐述了当今大数据技术在我国电子政务发展的必要性,通过对大数据技术的特征以及相关技术的介绍,详细分析了几种在电子政务领域中运用大数据技术的应用场景。大数据技术在
目的:对综合护理应用在手术室外科伤口感染预防中的临床效果进行探究。方法:选自我院2016年1月至2017年1月期间收治的60例临床患者资料进行探究,采用随机方法分成对照组和观察
目前,在众多竞争激烈的消费品市场中,化妆品市场的竞争可谓是达到了空前白热化的程度。许多有着雄厚资金和多年营销经验的市场领导者有时都不免有手足无措的感觉。对于没有市
权限管理系统是大部分应用系统重要的组成部分,系统权限的有效控制也是应用系统实施成功的保证。本文的研究正是结合“装配数字化系统”的权限管理和控制展开的。 装配数字
根据如今占优势的战略观点,人力资源实践(包括薪酬)在适当设计的基础上,可以推动企业从初创阶段到成熟阶段不断发展成熟。但对于适合于企业发展阶段的薪酬管理,及其如何顺应