【摘 要】
:
文档图像理解(Document Image Understanding)是把纸介质上的信息转变成计算机能够理解和编辑的信息,以方便保存和使用.在OCR技术已经相当完善的今天,版面分析成为文档图像理
论文部分内容阅读
文档图像理解(Document Image Understanding)是把纸介质上的信息转变成计算机能够理解和编辑的信息,以方便保存和使用.在OCR技术已经相当完善的今天,版面分析成为文档图像理解工作中一个十分关键的问题.中文版面分析研究历史比较短,再加之中文在字符和排版方式上不同于英文使得中文版面分析有其自身的难点,所以对中文版面分析方法的研究是很有价值的.该文针对报纸等复杂版面提出了一个新的中文版面分析方法.该方法是自底向上和自顶向下方法的结合,吸取两种方法的优点.该文的一个突出特点是把造成中文版面分析困难的原因分为四类:1.字符的不连通性的影响;2.标题的影响;3.文字方向不确定的影响;4.复杂区域结构的影响.该文针对以上四类困难分别提出了解决方案,并将这些方案结合在一个完整的版面分析流程中.试验结果表明该版面分析方法有相当好的效果.
其他文献
本论文提出了一种新的智能控制器设计的思想和方法,将这种控制器命名为九点控制器。一方面从理论上对这种智能控制策略进行了研究,并对其静态和动态性能进行了探讨;另一方面以这
论文针对电动多叶光栅(DMLC)进行了系统与数据传输的设计.该项课题的主要任务是研究开发用于肿瘤放射治疗的医用设备.医生通过计划系统软件给癌症病人做出精确的治疗计划,电
微系统(MEMS)或微机电系统正以她神奇而强大的功能展示在世人面前.DNA测序、分子操作、兆亿容量的存贮器等等以纳米技术为特征的科技已临近我们了.微系统也好,纳米科技也好,
目前,我国糖厂锅炉的设备比较落后,大多数锅炉的控制、操作水平基本上停留在手工和简单仪表操作,自动化水平较低,根据糖厂锅炉自动控制的现状,本论文着重研究了糖厂锅炉的燃烧自动
测试驱动开发(Test-Driven Development,TDD)和按契约设计(Design by Contract,DbC)是保证软件质量和支持变化的两种新的软件工程方法.该文通过深入、详细的研究这两种方法的
颜色分级是机器视觉领域中一个重要研究方向,在理论研究和实际应用上都具有重大价值.该文围绕颜色分级在以下两方面进行了深入研究:(1)机器视觉系统设计与分析;(2)颜色分级方
该文利用面向对象的方法,设计出一个ATM交换机仿真平台,实现了呼叫接入控制、带宽分配、缓冲区管理的组态算法,并用实际数据进行了仿真实验,实时的显示各种算法的效果.大大方
以PC机为基础的集散控制系统,配以成熟的工控组态软件,是目前控制领域发展的一个重要方向。本文就利用Visual C++6.O语言支持的面向对象的程序设计方法OOP在WINDOWS环境下对基
为提高中国模型试验水平,该文结合三峡~葛洲坝水利枢纽联合调度运行水工整体模型及其自动化测控系统研制过程,对应用于水工模型方面的多种测量控制技术进行了深入研究.论文针
该文采用直流调速系统以满足系统所要求的大调速范围(1:400)和良好的起动、制动性能,并采用数字式直流调速器和测速码盘以满足系统对稳态运行精度的要求.由于系统工作的特点