【摘 要】
:
文档图像理解就是把纸质介质上的信息转变为计算机能够理解和编辑的信息,以方便保存和使用。在OCR技术已经相当完善的今天,图像分析已经成为文档图像理解中的一个十分关键的问
论文部分内容阅读
文档图像理解就是把纸质介质上的信息转变为计算机能够理解和编辑的信息,以方便保存和使用。在OCR技术已经相当完善的今天,图像分析已经成为文档图像理解中的一个十分关键的问题。
随着版面复杂度的提高以及人们对于处理精度要求的提高,传统的版面分析方法和技术在处理各种复杂版面时遇到了各种问题,已经无法满足实际应用的需求,而单纯的修修补补也无济于事。版面的复杂性包括两个方面;一是版面内容造成的复杂性,二是各种干扰因素造成的复杂性。如何建立一个较为完善的系统并有效的解决这两方面的问题成了研究者关注的焦点。
本文从研究人类视觉的角度入手,在传统的版面分析技术基础上,以若干人工智能分析原则为指导,建立了对于复杂版面分析的系统模型。本文提出的系统模型有以下几个特点:一.基于完备性和正交性的系统设计原则保证的系统的可继承性和可扩展性,不但能够较好实现对复杂结构的理解,同时又能提升对一般版面的分析精度。二.改变了传统的过程式的处理流程,而代之以面向对象的处理流程,以区域分析为基础,保证了系统的可扩展性。三.改变传统的以文字信息提取为中心的方式,在对整个版面框架理解的基础上,完成对各个组成结构的理解,这样为版面理解和版面恢复提供了足够的信息。
同时,本文结合实际应用,对于几类比较常见的复杂版面分析系统给出了实例分析和评测结果。
其他文献
随着化石能源的逐渐枯竭和环境保护问题的日益突出,可再生能源的获取和利用开始受到越来越多国家的重视。风力发电作为一种清洁的可再生能源的获取手段,已经在世界各地迅速发
涡街变送器是20世纪70年代发展起来的一种新型流量仪表,由于它具有其它流量仪表不可兼得的优点,因而在市场中占有广阔的应用范围和发展空间。课题所研究的多变量涡街变送器是
随着Web2.0的发展和电子商务的兴起,越来越多的用户在博客及论坛上自由地表达着对各种产品和服务的观点。由此导致互联网上产生了大量用户评论信息,面对这些评论信息,一方面,
在文本分类问题的研究中,高维度的特征表示空间会严重影响文本分类的效率,特征降维是文本分类问题中重要并且关键的一步。目前特征降维的方法已经基本成熟,从特征抽取与特征
随着云计算技术在全球范围内的迅猛发展,用户将大量复杂的数据存储到云平台上。尽管云存储给用户提供了很多便利,但是安全和隐私问题阻碍着云计算技术被广泛应用。为了提高云
机械设备复杂的运行环境,多变的运行工况以及故障发生和演变过程的非平稳性,导致在状态监测与诊断过程中面临大量的非平稳信号的分析与处理难题;传统的信号分析方法以信号平
本文针对室内移动机器人的平台设计、体系结构、学习与导航等开展研究,主要工作及创新点如下: 第一,提出了一种的基于强化学习的多智能体混合式体系结构,即将I/O接口智能体、
互连网络(Interconnection Network)融合了计算机科学、信息化技术、通信工程、数学等多学科多领域的知识,是高性能并行计算机的主要研究课题之一。互连网络的结构多种多样,
随着现代航运事业的发展和现代海战的需求,简单的航向控制系统已被应用现代控制理论和微机控制的航向控制系统所取代。本文对航向控制系统进行了定量分析和研究,并给出了基于自
单相异步电动机由于其使用普通单相民用电源供电,且结构简单、成本低廉、运行可靠及维修方便等一系列优点,因而广泛的应用于各行各业和日常生活。但由于单相异步电动机运行时一般气隙磁场为椭圆气隙磁场,因此电机运行性能比普通三相异步电动机差。本文提出了一种能够提高电机运行性能的新结构单相异步电动机—助磁式单相异步电动机。并在对样机与普通电容起动单相异步电动机(或电阻起动单相异步电动机)的比较试验的基础上,对助