论文部分内容阅读
手写体数字识别是信息录入系统的关键技术,广泛的应用于档案管理、金融和邮政等行业,本文设计和实现了一个基于手写体数字识别的考试成绩自动录入与处理系统。经过数十年的研究,虽然有许多识别方法,但是目前的识别技术尚不能达到100%的识别率,本文对系统的设计和实现进行了详细的介绍。
手写体数字识别的难点主要在于手写体数字特征信息少,不同的人书写习惯的不同造成数字的形状千变万化,且没有统一的书写规范;在手写体数字识别的应用中,对单字识别正确率的要求要比文字要苛刻得多。在对现有的手写体数字识别技术做了大量分析和比较后,本文采用了基于结构特征的识别算法。该识别算法是根据手写数字的结构特征进行识别,同时本文中还利用了手写数字结构特征的几何位置关系,进一步提高了识别的准确率和识别精度。
基于手写体数字识别的考试成绩自动录入与处理系统包括图像采集、预处理、特征提取、数字识别和识别结果统计分析几个部分组成。结合本系统的实际工作环境,为了实现考试成绩自动录入与处理系统并达到较高识别率,本文研究的重点如下:
(1)试卷中手写数字信息的提取。本文中所述的系统是针对考试试卷中的手写体数字进行识别,为了达到识别的目的就必须把手写数字信息从表格中提取出来。本文对试卷中的表格进行了定位,并对表格线进行提取,运用提取出的表格线重构出了表格结构,最终实现了试卷版面中的手写数字信息的提取。
(2)数字串分割。手写数字串的分割是手写数字识别领域的难题,大量研究者对其进行了广泛的研究,并提出了许多分割算法,通过对现有算法的分析,发现这些算法能够实现对各种字符的分割,但是对具体应用背景下的手写数字的分割缺乏针对性。本文针对系统的实际应用环境进行了手写数字串的分割,该算法对数字串的个数进行估计,克服了分割的盲目性。
(3)手写数字识别。实现手写数字识别是本文研究的主要目的,通过对现有识别算法的比较并结合本系统的实际应用背景,本文采用的是基于结构特征的手写数字识别算法,它是一种比较简单可靠的识别方法。
(4)识别结果的统计分析。对识别结果的分析是考试成绩自动录入与处理系统的重要组成部分。本文针对教育领域中对考试成绩的统计分析需求,对识别出的考试成绩进行了统计分析,包括:难度、信度和区分度等。
运用VisualC++实现了基于手写体数字识别的考试成绩自动录入与处理系统,并对识别系统针对不同的应用环境进行了大量的测试,在本文中给出了测试结果。经过测试,本文中所设计和实现的手写数字识别算法识别精度可达到97%以上;在系统实际应用中,识别速度满足教学实践的要求,熟练操作者的处理速度可以达到6份试卷/分钟,同时在批量处理过程中,交互式修改保证了识别的准确性和可靠性。