论文部分内容阅读
随着科学技术的进步,人机交互智能接口技术在越来越多的设备上得到了应用.而使这些设备能够识别文字是人机交互智能接口技术研究的一个重要方面.人认识文字有两个过程,即用过眼睛将文字输入大脑,然后通过大脑对文字做出反应.同样,一台智能化设备识别字符也应该包括字符的输入和字符的识别两个阶段.该论文的工作是MOTOROLA国际研究基金项目"基于低分辨率摄像头的人机交互系统"的一部分,主要任务是设计一个在室内环境中,用手指在一个平面(如桌面、墙壁等)上写字,通过摄像头跟踪手指尖的运动轨迹,然后将运动轨迹连接起来形成文字并进行识别的系统.由于我们的最终目的是要将该系统在手机设备上开发出来,考虑到手机的存储容量问题,我们采用的图像序列为灰度图像.用手指输入文字是一种全新的输入方式,该文针对这种输入方式进行了研究.该文的主要工作包括:(1)对几种常见的脱机手写体汉字识别方法的识别准确率作了比较和分析.(2)对简单背景条件下的手指跟踪进行了研究,并设计了一个跟踪和识别的系统.在该系统中,为了提高处理速度,我们采用了动态图像相减的方法.由于相减后得到的结果图像区分度不明显,为了更好的区分前景物体和背景,我们对一些常用的二值化方法进行了比较,并提出了一种基于全局均值和局部方差的二值化方法.然后,我们利用模板匹配对指尖精确定位,将各幅图像指尖的准确位置依闪连接成字符后,再用脱机手写体汉字识别的方法进行字符识别.(3)在复杂背景条件下,先对一些常用的背景建模的方法进行了比较和总结,并在此基础上,提出了两种建立背景模型的方法,并通过实验证明了这些方法的有效性.(4)在复杂背景条件下,利用上述方法设计了一个手指跟踪和字符识别的系统.