复杂结构文档图像中数学公式的定位

来源 :南开大学 | 被引量 : 0次 | 上传用户:luxiliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着全球信息化的不断深入,信息检索变得越来越重要,而作为信息来源的信息分离也正成为信息化过程不可缺少的一部分,它是将人类几千年积累的知识电子信息化的关键技术。 本文研究了信息分离技术的一个子问题——复杂结构文档图像中数学公式的定位和提取。本文以科技文档图像为研究对象提出了复杂结构文档图像中数学公式定位的方法模型。模型将复杂结构文档图像中数学公式的定位归结为两个主要问题——版面成份分析和版面成份属性判定。 本文针对复杂结构文档图像的特点,将复杂结构文档图像中的数学公式分文两类四种,并针对每种数学公式的定位提出相应的方法。 本文在四种数学公式定位方法模型的基础上给出了一个具体定位系统的实现细节,这个系统可以很好地对复杂结构文档图像中的数学公式做出定位。 本文还对所实现的定位系统在准确率和速度两个方面进行了评测,给出了评测结果,并指出了定位方法需要改进的方向。
其他文献
近年来,复杂网络受到来自物理、生物、数学、计算机、经济等不同学科领域的研究者越来越多的关注,已经成为一个研究热点。利用统计分析方法,结合计算机模拟仿真技术,本论文对复杂
个性化信息服务旨在解决按照用户的需求传递信息的问题。随着信息科学与技术的发展,信息已经渗透到人们生活的各个方面。移动电话的普及和移动数据业务的发展带来了移动网络信
国际EPC总承包项目,即设计—采购—施工(Engineering,Procurement and Construction),是一种由承包商进行全部设计、采购和施工,提供一个配备完善的设施,转动钥匙(Turn key)即可运
词语对齐是跨语言自然语言处理领域的一个基本问题,许多基于双语语料库的应用(女NSBMT、EBMT、WSD、词典编纂)都需要词汇级别的对齐。 以往词语对齐方法对语言学信息在对齐
月球车是我国月球探测二期工程中最重要的组成部分,运动规划则是月球车具备自主能力的根本保证,也是月球车实现自主控制的难点。本文以六轮独立驱动的摇臂式月球车为研究对象,在
现场总线是自动化领域的计算机网络,是当今自动化领域技术发展的热点之一。它以总线为纽带,将现场设备连接起来成为一个能够相互交换信息的控制网络,是一种双向串行多节点数
多标签的数据类型是比单标签的数据的应用更为广泛的数据类型。相对的,多标签数据的分类比单标签数据的分类更为复杂且耗费更高,然而其训练的分类器预测的准确率比单标签的要
说话人识别是根据人特有的语音信号识别说话人身份的一种生物认证技术。说话人识别的关键技术包括两个方面:一是如何从数据量相当大的原始语音信号中提取出反映说话人声音特色
符号有向图(Signed Directed Graph, SDG)作为一种定性的推理方法,用节点表示系统变量,用支路表示系统变量间的直接影响关系,因无需系统的定量信息即可形象的表示故障的传播,而被广
并联机器人作为一种全新的机器人,具有刚度大、承载能力强、误差小、精度高、自重负荷比小、动力性能好等一系列优点,与日前广泛应用的串联机器人在应用上构成互补关系.这类