印刷体数学公式符号切分的研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:kelly2457
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前主流OCR (Optical Character Recognition,光学字符识别)技术虽然能够高速、自动地将印刷体文字信息输入计算机,但对于结构复杂、符号多变的数学公式仍然无能为力。数学公式是科技文献的重要组成部分,因此,数学公式识别问题已经成为模式识别领域炙手可热的课题。印刷体数学公式识别系统包括公式抽取、公式符号识别、公式结构分析和公式重构四个组成部分。其中,数学公式符号识别是公式识别系统的核心部分,分为符号切分和符号识别两个阶段,而符号切分又是关键的一个环节。本文针对印刷体数学公式符号切分展开研究。首先设计并实现了一个能够处理公式二维嵌套结构的符号切分算法;然后基于识别结果以及粘连符号的特点,给出了一种基于轮廓特征的印刷公式粘连符号切分方法,通过检测粘连符号的凹凸轮廓以及轮廓的宽高比,并结合给出的粘连符号切分算法对粘连符号进行切分。通过对不同印刷质量文档的实验表明,本文设计的符号切分方法能够取得较高的切分正确率和令人满意的处理速度。
其他文献
以某造纸厂所产生Fenton铁泥作为原料,制备絮凝剂聚合硫酸铁(PFS)及磁性聚合硫酸铁(MPFS)。研究表明,以20:1的液固质量比加入3 mol/L硫酸和干燥铁泥,在60℃下水浴搅拌50 min,
综述了N-乙基-N-羟乙基苯胺的合成方法,并对以N-乙基苯胺和环氧乙烷为原料的合成方法进行了探讨。
传承至今的古诗是古人留给我们的宝贵精神财富,是中华民族灿烂的文化瑰宝。学习和研究古诗,有利于继承和发扬中华民族传统文化,丰富我们的精神世界。对古诗的教学由来已久,但
绝大部分学生在初中阶段才开始正式接触物理知识,并系统地开始学习物理。而且物理相对其他文科类学科,对学生的逻辑思维能力以及运算能力的要求要高出许多。所以,在初中阶段
随着老龄化社会的到来,老年人的社会生存状况及其问题日益引起学者和专家们的普遍关注,涌现出不少关于老龄社会与老年群体的研究成果,但大多是把老年人作为一个同质性群体进
数字余辉是在同一视图中叠加多个波形,其中频繁出现的点位以较为鲜艳的颜色显示,偶尔出现的点位以深层的饱和颜色加以区分。这样,对于查看复杂或者频繁变化的波形有很大的帮
天然彩丝是通过转基因手段、遗传工程等方法让蚕吐出带有颜色的茧丝而获得的。天然彩丝由于具有绿色环保和保健等优良品质,其开发和应用必将受到人们的关注。本文研究了天然
钢丝滚道球轴承具有重量轻,转动惯量低,结构设计灵活,承载能力大,回转精度高等特点,常用于大直径回转机构。针织圆纬机的针筒回转直径大,整体结构紧凑,且要求回转精度、刚度、
<正>2019年6月(2019年6月1日0时至6月30日24时),全国(不含香港、澳门特别行政区和台湾地区,下同)共报告法定传染病964 457例,死亡2 118例。其中,甲类传染病中鼠疫无发病、死
自1612年起,后金统治者通过联姻、和亲的方式与蒙古诸部建立同盟关系。以满洲入关为分界线,早期满蒙联姻主要分为1612年-1643年、1644年-1689年两个时期。满蒙联姻与满洲、蒙