论文部分内容阅读
本文介绍了一种低分辨率下的运动字符的提取方法。这种运动字符的提取方法,采用了静态提取与动态提取相结合的方式。静态提取,是指当把一张写有汉字字体的白纸片,移入摄像头的视野范围的时候,系统自动对白纸片上的汉字进行切分提取。动态提取是指在摄像头的视野范围内,用笔进行汉字书写的时候,系统可以自动跟踪笔尖的轨迹,最终用于所写汉字的字符恢复。
在介绍运动字符的提取的实现方法以前,本文首先介绍了基于Directshow的摄像头视频采集程序的实现方法。这是进行一切基于机器视觉的各种研究的基础。经过试验,采用Directshow实现的摄像头捕捉程序,捕捉速度可以达到每秒28幅图片以上。这为进行任何基于机器视觉的项目研究,打下了良好的基础。
在实现运动字符的静态提取的时候,本文提出了一种基于灰度图像的边缘提取再进行二值化的预处理方法。这种方法有效地消除了普通消费级摄像头的暗角影响。另外,本文给出了一种基于连通域的多汉字切分方法。这种方法有效地克服了不同投影方法对多汉字切分的局限性。最后本文提出了一种基于汉字外界框的运动汉字定位的方法。
在实现运动字符的动态提取的时候,本文提出了一种基于差分运动图像分析的笔尖跟踪算法。在不建立背景模型的情况下,这种方法有效的实现了背景的滤除和笔尖序列的恢复。首先,本文介绍了在摄像头固定的情况下这种基于差分运动图像分析的笔尖跟踪算法的实现过程。通过对文字书写过程中的笔尖运动的特点的研究观察,提出了基于四方向投影的候选点的选择规则和基于差分图像的方向特征的笔尖候选点集合的缩小规则,以及基于笔尖运动速度的真实笔尖判别规则。在获得了笔尖序列以后,又提出了一种坏点的滤除方法,使得到的笔尖序列更加准确。其次,本文介绍如何在手持摄像头的情况下进一步完善这种基于差分运动图像分析的笔尖跟踪算法。在实现手持摄像头的笔尖跟踪算法的过程中,提出了一种基于抽样图像的图像模糊的方法和一种基于抽样图像的中值滤波的方法,并且有效地消除了因为手的抖动带来的背景相对运动的问题。实验证明,这种基于差分运动分析的笔尖跟踪算法是有效的。