DjVu系统中基于形态学的汉字图像预处理研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:liongliong441
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着光学、摄影等技术的不断发展,图像日益成为人们日常生活中不可或缺的部分。与此同时,新兴的图像处理技术尤其是数字图像处理技术不断涌现。作为数字图像处理的一个分支,文本图像处理在上世纪末兴起,并引起了许多研究者的关注。伴随着全球信息化进程的加快,网络逐步成为人们获取知识和信息等的最主要途径,在这种情形下,书籍作为传统的知识信息的载体已经不能很好的满足人们的需求了。为了推进书籍数字化的进程,并便于其在网络上的传输、阅读,贝尔实验室发布了DjVu技术体系。作为文本图像处理技术的新成员,DjVu以其较好的图像显示质量、较高的压缩比等特性脱颖而出,成为文本图像处理领域应用最广泛的技术之一。本文首先简要介绍了数学形态学的基本知识,主要从数学形态学的起源、数学形态学在图像处理中的应用以及数学形态学的四种基本运算三个方面展开;然后探讨了ShuChen等为了更好的实现汉字字符图像压缩而提出的基于形态学的误差图谱构造算法,并深入分析了误差图谱构造算法的连接部分膨胀浮动机制;最后根据汉字本身的特征以及数学形态学的相关知识,结合DjVu技术体系的特性设计了汉字图像的预处理方案。本文提出的汉字图像预处理方案即基于形态学的方向性膨胀连接修复算法,主要受到了Shu Chen等所提算法中膨胀浮动机制以及连接的相关定义的启发。该算法首先结合DjVu技术体系的存储特点,提取连接部分的图像特征,作为计算膨胀尺度的参数;其次,根据汉字自身的特征提出了相应的连接部分走向判定算法,判定算法大致将连接部分分为三类:横向、竖向和混合走向;然后根据走向的不同,有选择的计算膨胀区域;接着检测膨胀区域内是否存在其它相邻的连接部分,依据此作为判定是否存在连接的条件;最后,如果存在连接则根据不同的走向执行不同的连接修复策略。通过若干组图像处理结果的对照和分析,均表明该预处理方案能够很好的处理因噪点造成的汉字断笔画现象。
其他文献
网络文本信息飞速增长,对海量网络文本进行自动分类并从中找出我们所需要的信息是一项非常迫切的需求,然而,传统的全监督学习分类器要想有好的分类效果,首先需要人工标注数据,训练
随着信息处理技术与测绘技术的快速发展,数字矢量地图在地理信息系统、数字化城市和智能交通运输系统得到了广泛应用。数字矢量地图具有易编辑易传播的优点,极大方便了人们的日
布局问题(Packing问题),其研究背景包括印刷电路板(PCB)布局方案设计,航天器舱的布局方案设计,工厂机床摆放问题等。求解这些问题不仅要求待布物能放置在尽可能小的空间内,而且
作为计算机视觉研究领域里最热门和最有前景的识别任务之一,视频中识别人类活动的任务在过去的许多年来引起了研究人员的极大关注。不仅仅是因为这是一个人工视觉系统的基本能
20世纪90年代以来,互联网技术快速发展,网页页面样式也越发多样。现时的网页中,充斥着大量的导航、广告等与页面主体内容无关的信息,这些信息和网页的主体信息混杂在一起,大大增加
人脸标定技术是计算机视觉领域识别人脸几何结构的一门技术,它在人脸处理系统中扮演着重要的角色。后期人脸处理的很多任务,比如人脸识别、人脸姿态估计、人脸表情分析等,都
无线传感器网络是一种自适应很强的自组织网络,大量廉价的节点密集部署在监测区域,时刻监测着环境参数的变化,为人类提供很多关于环境的实时数据。如果说因特网改变了人类之
随着科技的发展以及信息时代的到来,不管是购物,还是科学技术,都离不开计算机。但是现在计算机网络上的信息越来越多,对数据的保护反而没有那么重视,所以信息安全必然成为了全社会
计算机硬件技术和软件功能的提升为分布式软件在嵌入式领域的应用提供了广泛的支持。然而在嵌入式分布式软件的开发和调试中存在着分布式软件运行的“不确定性”,难以同时对多
近年来,多类标分类问题成为学术研究的一个热点,多类标分类技术是解决多类标分类和类标排序两大任务的重要技术手段,为了更有效地解决多类标文本分类问题,一种新的基于聚类树的多