印刷体数学公式特殊结构的分析与重构

来源 :河北大学 | 被引量 : 0次 | 上传用户:arlunfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人们对信息传播和检索的要求越来越高。传统的纸质文献资料虽然是不可或缺的,但是已经不适应信息的快速传播。OCR技术实现了从纸质文献到电子文档的转换,促进了信息技术的发展,但是对数学公式的识别还处于不成熟的阶段。由于数学公式是科技文献中重要的组成部分,所以引起了很多研究者对数学公式识别的重视。印刷体数学公式识别过程主要分为四个部分:公式抽取,公式切分和识别,公式结构分析,公式重构。结构分析是印刷体数学公式识别的关键,重构是印刷体数学公式识别的重要步骤。本文通过对堆叠符号、帽子符号和矩阵等公式特殊结构的研究和分析,归纳、总结了这些公式特殊结构的特征和语法信息,设计了相应的结构分析算法,并采用深度遍历策略设计了数学公式特殊结构的递归重构算法。对印刷体数学公式特殊结构的分析与重构实验表明了算法的有效性。
其他文献
数据挖掘是指从大量的、不完全的、有噪声的、模糊的数据中提取出隐含在其中的、人们事先不知道的但又潜在有用的知识的半自动化的方法,它是解决“数据丰富、信息贫乏”的有
一个网站由许多个网页组成,网站上的信息分布在这些网页上,而不同用户对不同网页上的信息感兴趣,现在随着网络技术的高速发展,网络上的信息呈指数增长,所以人们要想在众多的信息资
随着Web技术的发展,互联网上出现了一系列基于内容的图像检索应用,即“以图找图”。石材图像检索系统是为石材行业开发的一个基于Internet环境的实用信息系统,该系统可通过石
随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效地获取有用的信息,已经成为研究的热点。目前文本聚类的方法主要有
社交网络作为互联网最热门的应用之一,随着流行和普及,人类的沟通交流已不再局限在相同的时间和空间内。快速发展的社交网络不仅是用户展示自我价值、表达利益诉求和维护人际关
运动对象分割是图像分割的一个重要分支。图像分割就是把图像分割成具有相同信息的子区域,运动对象分割是在图像分割基础上把视频图像或图像序列按照一定的标准分割成不同的
在各种临床诊断,治疗中使用的医学影像,都具有高分辨率、大存储量的特点,随着数字化影像技术的发展,进一步减少医学图像所占的存储空间,提高其在网络上的传输速度,就显得十分
深网是相对于表层网而言的,随着互联网信息的不断扩充和加深,越来越多的信息资源通过动态网页技术与数据库技术相结合的方式提供给人们。但是,传统的搜索引擎受技术等各种限制,无
进化非选择算法是通过借鉴生物免疫进化机制与免疫非选择机制而提出的,具有较好的全局搜索能力。可满足性问题是六个基本的NP完全问题之一,其他NP完全问题均可在多项式时间内
近几年来,以网络为载体的各种应用的研究和开发受到了广泛的关注。其中点对点通信系统作为其中一个重要的应用有着飞速的发展。这类系统涉及到网络组织架构、信道编码、网络