DjVu系统中基于形态学的汉字图像预处理研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户：liongliong441

【摘要】

：

随着光学、摄影等技术的不断发展，图像日益成为人们日常生活中不可或缺的部分。与此同时，新兴的图像处理技术尤其是数字图像处理技术不断涌现。作为数字图像处理的一个分支，文本

【作者】

：

翟景亮

【机构】

：

哈尔滨工程大学

【出处】

：

哈尔滨工程大学

【发表日期】

：

2012年期

【关键词】

：

汉字图像预处理数学形态学膨胀尺度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着光学、摄影等技术的不断发展，图像日益成为人们日常生活中不可或缺的部分。与此同时，新兴的图像处理技术尤其是数字图像处理技术不断涌现。作为数字图像处理的一个分支，文本图像处理在上世纪末兴起，并引起了许多研究者的关注。伴随着全球信息化进程的加快，网络逐步成为人们获取知识和信息等的最主要途径，在这种情形下，书籍作为传统的知识信息的载体已经不能很好的满足人们的需求了。为了推进书籍数字化的进程，并便于其在网络上的传输、阅读，贝尔实验室发布了DjVu技术体系。作为文本图像处理技术的新成员，DjVu以其较好的图像显示质量、较高的压缩比等特性脱颖而出，成为文本图像处理领域应用最广泛的技术之一。本文首先简要介绍了数学形态学的基本知识，主要从数学形态学的起源、数学形态学在图像处理中的应用以及数学形态学的四种基本运算三个方面展开；然后探讨了ShuChen等为了更好的实现汉字字符图像压缩而提出的基于形态学的误差图谱构造算法，并深入分析了误差图谱构造算法的连接部分膨胀浮动机制；最后根据汉字本身的特征以及数学形态学的相关知识，结合DjVu技术体系的特性设计了汉字图像的预处理方案。本文提出的汉字图像预处理方案即基于形态学的方向性膨胀连接修复算法，主要受到了Shu Chen等所提算法中膨胀浮动机制以及连接的相关定义的启发。该算法首先结合DjVu技术体系的存储特点，提取连接部分的图像特征，作为计算膨胀尺度的参数；其次，根据汉字自身的特征提出了相应的连接部分走向判定算法，判定算法大致将连接部分分为三类：横向、竖向和混合走向；然后根据走向的不同，有选择的计算膨胀区域；接着检测膨胀区域内是否存在其它相邻的连接部分，依据此作为判定是否存在连接的条件；最后，如果存在连接则根据不同的走向执行不同的连接修复策略。通过若干组图像处理结果的对照和分析，均表明该预处理方案能够很好的处理因噪点造成的汉字断笔画现象。

其他文献

基于半监督的网页分类

网络文本信息飞速增长，对海量网络文本进行自动分类并从中找出我们所需要的信息是一项非常迫切的需求，然而，传统的全监督学习分类器要想有好的分类效果，首先需要人工标注数据，训练

学位

文本分类网页分类半监督特征选择特征抽取

基于数字水印的矢量地图完整性认证研究

随着信息处理技术与测绘技术的快速发展，数字矢量地图在地理信息系统、数字化城市和智能交通运输系统得到了广泛应用。数字矢量地图具有易编辑易传播的优点，极大方便了人们的日

学位

数字矢量地图完整性认证认证水印定位水印恢复水印

求解平衡约束圆集布局问题的启发式并行蚁群优化方法研究

布局问题(Packing问题)，其研究背景包括印刷电路板(PCB)布局方案设计,航天器舱的布局方案设计，工厂机床摆放问题等。求解这些问题不仅要求待布物能放置在尽可能小的空间内，而且

学位

平衡约束布局问题启发式算法并行蚁群算法阶梯式优化策略

基于三视角几何约束的动作识别技术研究

作为计算机视觉研究领域里最热门和最有前景的识别任务之一，视频中识别人类活动的任务在过去的许多年来引起了研究人员的极大关注。不仅仅是因为这是一个人工视觉系统的基本能

学位

动作识别多视角几何三焦距张量三焦距子张量

基于页面模块识别的Web文章自动抽取方法研究

20世纪90年代以来，互联网技术快速发展，网页页面样式也越发多样。现时的网页中，充斥着大量的导航、广告等与页面主体内容无关的信息，这些信息和网页的主体信息混杂在一起，大大增加

学位

可视化信息页面分块信息抽取分类聚类

基于局部哈夫投票机制的人脸标定技术研究

人脸标定技术是计算机视觉领域识别人脸几何结构的一门技术,它在人脸处理系统中扮演着重要的角色。后期人脸处理的很多任务,比如人脸识别、人脸姿态估计、人脸表情分析等,都

学位

人脸标定外观模型投票模型多输出岭回归

无线传感器网络信誉系统安全性的研究

无线传感器网络是一种自适应很强的自组织网络,大量廉价的节点密集部署在监测区域,时刻监测着环境参数的变化,为人类提供很多关于环境的实时数据。如果说因特网改变了人类之

学位

无线传感器网络信誉系统信任值算法赎回惩罚机制时间遗忘

椭圆曲线标量乘算法改进及应用

随着科技的发展以及信息时代的到来，不管是购物，还是科学技术，都离不开计算机。但是现在计算机网络上的信息越来越多，对数据的保护反而没有那么重视，所以信息安全必然成为了全社会

学位

椭圆曲线加密算法标量乘时间复杂度混合坐标

嵌入式分布式软件中基于事件的集成调试框架研究

计算机硬件技术和软件功能的提升为分布式软件在嵌入式领域的应用提供了广泛的支持。然而在嵌入式分布式软件的开发和调试中存在着分布式软件运行的“不确定性”，难以同时对多

学位

嵌入式分布式软件集成调试事件模型逻辑时钟

多类标聚类树分类方法优化及并行化实现

近年来，多类标分类问题成为学术研究的一个热点，多类标分类技术是解决多类标分类和类标排序两大任务的重要技术手段，为了更有效地解决多类标文本分类问题，一种新的基于聚类树的多

学位

多类标分类聚类树并行化分类

DjVu系统中基于形态学的汉字图像预处理研究

与本文相关的学术论文