英文科技文档中粘连下标的一种判定方法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:sophieyeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及,使用计算机处理日常工作和存储信息成为人们更多的选择。对图像格式文档文件的识别与检索引起了广泛的关注。适用于普通印刷体文档图像的OCR系统已经比较成熟,对粘连字符的处理成为其识别正确率的主要影响因素之一。科技文档中存在较多的数学表达式,它们是由特殊符号及字符组成的比较复杂的结构体。数学表达式中字符之间存在着二维关系,这使得粘连字符的处理成为正确识别数学表达式的一个重要部分。为此,本文作了一些尝试,给出了一种粘连下标的判定方法。本文主要包括以下内容:本文第1章简单介绍了神经网络方面的一些知识,概述了数学表达式识别系统的一些流程,包括数学表达式的定位,识别,重组。并且列出了粘连字符检测,分割方面的主要方法。在第2章,分析了粘连下标的主要特征,给出了一种新的投影方法。基于此,总结出了一种粘连下标的判定方法:首先,通过上述投影方法获取字符或者符号的轮廓信息,然后通过粘连下标特殊的轮廓特征进行判别。最后,给出了数值实验,表明该方法能够在不同类型字符中能够很好的检测出粘连下标。针对粘连下标判定方法中参数选取的问题,第3章中给出了一种模糊神经网络方法。该方法将第2章方法的参数作为权值,通过学习来获得比较合适的数值。当然,这种模糊神经网络方法也可以直接用来判定粘连下标。第4章考虑到粘连字符出现的概率问题,针对实际科技文档图像作了数值实验。主要是在数学表达式定位的过程中,运用粘连下标判定方法,检测文档中的粘连字符并标记出来。
其他文献
项目教学法以项目为中心、学生为学习的主体,在教师的引导下完成一系列的学习活动;使学生在这个过程中获得独立思考与解决问题的能力.本文探讨了项目化教学法在高职英语教学
近年来,随着应用领域中提出的众多问题,研究微分方程的解或者解的导数在区间内部不连续、边界条件依赖于谱参数的微分方程边值问题受到了越来越多研究者的关注.这些问题来源
从高等职业教育目标出发,阐述了构建高职教育能力型评价指标体系的重要性和紧迫感,并立足高职教育能力型指标的价值内涵,从理论基础知识掌握、专业技能、职业素养发展等三个
本篇文章紧密结合笔者的教学实践经验,从优化各个教学环节、建立和谐的人际关系、完善自身教学艺术以及加强心理学理论学习四个层面,试着研究和议论小学生数学学习积极性缺失
建构主义是认知学习理论的一个重要分支,建构主义教学理论认为教学应该在一定的环境和情境中,以学生为中心,让学生完成对知识的主动探索、主动发现和对所学知识意义的主动建
随着我国教育事业的蓬勃发展,新时期对高中物理教学提出了更高的要求.作为学生素质培养的重要学科之一,高中物理教学对于学生创新能力、逻辑思维能力以及实践能力培养具有十
信息技术课是一门应用性很强的学科,计算机应是学生必须掌握的基本技能,我们教师要充分利用课程内容,提高学生信息技术素养。但由于课堂实践性强,课堂纪律、教学程序、教学进
作为信息技术教师,担负着培养一代新人的重任,不仅要教会学生信息技术基础知识和操作技能,更重要的是培养学生的信息素养.这就要求我们根据学科特点,探讨行之有效的教学方法,
淡青的石质底色上,宝蓝色的水墨线条,无与伦比地勾勒出一只侧首俯卧的大肥猫,其形态之逼真,其情态之微妙,实非水墨大师不能成就。猫首猫身之间,有一道天然纹线,使猫的首身之
期刊
教师是新课标的具体实践者,是新课程改革的重要力量.因此,在新课改背景下,小学语文教师应重新定位自身,符合科学的给自己定位,扮演好新课改赋予的角色要求.