论文部分内容阅读
民主选举是人类有史以来所发明的最为强大而有力的民主工具,是人民行使民主权力的必要过程。选票作为民主选举的依赖工具,是选民表达选举意愿发扬民主权利的媒介。但是面对着民主选举中产生的种类繁多且数量庞大的选票,如何快速且高效地实现它们的统计却是一个迫切需要解决的问题。在选票统计方法研究中,基于OCR选票图像识别技术的选票统计方法是目前相对较为可行的方法。而对于当前该方法在自动化程度、识别速度、识别正确率以及适用的选票类型范围等方面的不足,依然还有很多工作要做。基于此,本文的研究重点为针对该方法在以上这些方面的不足所做的一系列改进性研究,主要贡献如下:1、研究了选票图像的几何结构识别问题,提出了一种基于表格线游程的选票图像几何结构识别方法。选票图像几何结构识别问题可以归结于选票表格几何结构识别问题,因此通过检测并分析选票图像中的表格线就可以实现选票图像几何结构识别。表格线游程具有易于检测、存储和处理等优点,且通过表格线游程来检测表格线具有抗一定程度表格线倾斜和表格线断裂的能力,因此可以降低表格线错识漏识的发生概率,同时,也可以加快选票图像几何结构识别的速度。2、研究了选票图像的版面理解问题,提出了一种基于二叉树模型的选票图像版面理解方法。选票图像版面理解主要是指选票表格的几何结构识别和逻辑结构识别,本文以选票表格中的表格域为单位,定义了候选人信息域、选举符号信息域、投票单元、投票行(列)等逻辑结构,并构建起了选票表格的逻辑结构模型,最后通过一种二叉树模型实现选票表格的逻辑结构识别。方法能够有效地实现规则选票的版面机器自学习,提高选票图像识别的自动化程度。3、研究了基于OCR的选票图像识别方案,提出了一整套较为合理的选票图像识别方案。方案提高了选票图像的识别正确率,同时,也加快了选票图像的识别速度。且方案适用的选票类型的范围也较广。4、以“智能选票图像识别统计系统”为背景进行了系统开发实践,证明了本文研究方法的合理性和有效性。