论文部分内容阅读
基于OCR开源框架的常用公式识别系统的研究与实现
【摘 要】
:
目前,部分书籍和出版物以图像方式存储,为了便于对这些资料进行重用、检索,以获得图像中的文本信息,需要把这些图像数据转换成文本数据。但是一些书籍和出版物中包含有许多数学公式,在转换过程中,公式因为其本身结构的复杂性,不能完全准确地转换成文本。在包含公式的图像文档中,公式常常被自然语言环绕,难以定位,而且公式不同于常规字符,其结构具有非规则性,不能简单地使用传统的字符识别方法对其进行识别。因此,实现一
【出 处】
:
北京邮电大学
【发表日期】
:
2019年01期
其他文献