数学公式结构分析系统设计与关键方法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:johnlu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数学公式图像的自动识别与理解,是文档图像处理与模式识别领域的世界级难题。数学公式是非常复杂的一种文档结构,难以被计算机进行自动处理。对数学公式文档图像进行精确地识别和理解的方法研究,具有广泛的应用价值和学术价值。这也是文档图像识别理解领域的一个重点和难点问题。随着数学公式图像识别领域研究的不断深入,结构分析系统的模型已经基本成熟。目前,以句法分析为驱动、结合版面和语法分析的结构分析流程正在被广泛的研究和使用。   本文在研究和改进结构分析系统的同时,提出了基于多层次基准线的结构分析方法,极大地减少了结构分析过程中搜索和判定的次数,优化了分析系统流程和效率。同时,本文重点着眼于结构分析子模块的关键技术的研究和评测,首次完整的研究和描述了版面结构分析、语法结构分析、和句法结构分析模块中的一系列关键技术和处理方法。特殊文档图像理解的评测是一个重要且困难的问题。本文给出了数学公式图像结构分析的评测参数和评测方法,并对本文所提出的系统进行了定性分析。本文中实现的系统具有完备性和容错性,可以适应科研人员(特别是数学领域的科研人员)对数学公式图像的处理要求,具有很高的应用价值。
其他文献
5.12汶川大地震,给我国的人民、经济、交通等带来了无法估计的损失。灾区多数的建筑物、公共设施、道路等已经完全毁掉,原来地图上的一些表征已经不足以表达目前的实际情况,
随着计算机计算能力的迅速增长,网格计算已经成为分布式计算的重要研究内容。目前,以网格为基础架构的e-Science协同环境下已经集成了大量的计算资源和数据资源,这些资源大多
近年来,P2P技术随互联网技术的发展而兴起,成为网络技术研究的热点。而基于P2P网络构建的存储系统,相比传统存储系统具有如下优势:不依赖中心节点、高容错、高扩展、高效率、低成
数据分类是一种重要的数据挖掘技术,常用的数据分类方法有决策树归纳分类、贝叶斯分类、神经网络分类和K最邻近分类等,采用的理论及算法有决策树(Decision Tree)、粗糙集(Rough
随着互联网的发展,Web不仅实现了全球的信息交换和资源共享,而且Web上的信息量也成指数级的增长。一方面,海量的Web信息为用户提供了获取信息的源泉;另一方面,如何高效的从海
连续属性的离散化一般是做为机器学习、数据挖掘的一项重要的预处理步骤,针对离散化问题,研究者们提出了诸多方法,例如早期的等宽等频算法及后来的利用遗传算法进行离散化等
近年来,计算机技术已经有效地应用于部队的设备管理工作中。随着部队设备综合信息管理系统的广泛使用,各分区系统的数据量将越来越大,同时军区数据中心也积累了大量的设备维修数
人类社会发展到现在已经进入到一个知识大爆炸的时代。为了应对知识的迅速累计,将知识信息化成为了必然的趋势。信息化的一个重要的特征就是强大的知识检索功能。在各种检索工
由于高性能计算和大规模分布式数据应用需要对输入/输出数据集进行大量共享式并发访问,本文提出并实现了LDDSS(Large-scaled Dataset DistributedStorage System)模型,以通过改
随着计算机处理能力的不断增强和网络通信技术的迅速发展,越来越多的计算机连接到了Internet上,在传统的客户机╱服务器管理模式中,服务器端承受着巨大的负载,而客户端基本上