论文部分内容阅读
购物小票是消费者购物时由商场或其它商业机构给用户留存的销售凭据,又被称作购物收据。它是消费者经济行为的一种真实记录,可以通过对它的分析为市场营销、经济发展策略等服务。通过分析购物小票,我们能够得到许多信息,如消费者的消费水平,消费习惯,对某些商品的喜爱程度等。同时,商家则通过分析小票得到更多的商业信息,消费者的亲朋好友也能通过分析小票了解消费者的生活状况等。本文是在结合市场需求和人们日常生活需要的基础上,对超市购物小票图像识别的预处理阶段进行了一定程度的研究,所做的工作主要有以下几个部分:对采集到的小票图像进行分类,并在进行图像的灰度化,二值化,平滑去噪以及倾斜校正处理之前,对部分小票图像上存在邮戳或划痕的情况进行了处理。同时对图像处理的各阶段算法进行了比较。对经过前期处理后的小票图像进行版面分析,本文根据购物小票的特点选用基于膨胀算法的版面分析方法对小票版面进行文本块的分割。对购物小票图像进行字符分割处理,提出了基于字符最大高度和宽度和基于连通域的两种分割方法,实验效果比较令人满意。对分割后的字符进行归一化和细化处理。本文使用了一种基于数学形态学的细化方法,并对该方法进行了改进,比较了两种算法的优劣。实验证明,改进的细化算法在交叉点处的处理效果更好,笔画更平滑。