论文部分内容阅读
数学公式图像的自动识别与理解,是文档图像处理与模式识别领域的世界级难题。数学公式是非常复杂的一种文档结构,难以被计算机进行自动处理。对数学公式文档图像进行精确地识别和理解的方法研究,具有广泛的应用价值和学术价值。这也是文档图像识别理解领域的一个重点和难点问题。随着数学公式图像识别领域研究的不断深入,结构分析系统的模型已经基本成熟。目前,以句法分析为驱动、结合版面和语法分析的结构分析流程正在被广泛的研究和使用。
本文在研究和改进结构分析系统的同时,提出了基于多层次基准线的结构分析方法,极大地减少了结构分析过程中搜索和判定的次数,优化了分析系统流程和效率。同时,本文重点着眼于结构分析子模块的关键技术的研究和评测,首次完整的研究和描述了版面结构分析、语法结构分析、和句法结构分析模块中的一系列关键技术和处理方法。特殊文档图像理解的评测是一个重要且困难的问题。本文给出了数学公式图像结构分析的评测参数和评测方法,并对本文所提出的系统进行了定性分析。本文中实现的系统具有完备性和容错性,可以适应科研人员(特别是数学领域的科研人员)对数学公式图像的处理要求,具有很高的应用价值。