论文部分内容阅读
考试作为教育检测的重要手段之一,笔试试卷的评分占相当大的比重。长期以来,对试卷分数的评分以及学生成绩的管理工作主要采用以下两种方式:一种是制作特定答题卡然后对其进行扫描,一种是人工处理方法。但前者需要定制答题卡,且需特定的笔涂写,更重要的是扫描工具成本太高,无法广泛应用于所有考试批卷中,而后者采用人工方法进行统计分数与分析,不仅浪费时间、效率低下,而且容易出错。本文针对上述阅卷方式的不足,实现了基于OpenCV的试卷评分自动识别与分析系统的设计,为试卷的客观题阅卷和主观题分数统计提供便利。该系统的重点在于手写体数字与字母的识别,由于每个人写出的字符都不尽相同,且数字与字母的特征信息都比较少,字符与字符间并没有上下文关系,错一个字符都会对最终结果产生重要影响,因此需要保持很高的识别率;而且数字与字母识别面对的是大量报表与文件,如果速度过慢明显难以满足实际需要,因此在识别速率方面也有很高要求。本文对现有的识别方法做了大量分析与比较之后,最终选择支持向量机算法识别手写数字与字母,并验证识别结果的准确性。本文从对高拍仪获取的试卷图像进行预处理开始,包括对图像阈值化操作、采用Hough变换法倾斜矫正、根据边缘轮廓检测找到感兴趣区域、利用投影法提取手写字符、字符图像降噪及形态学处理等操作,最终得到待识别的手写字符。图像分割也是实现系统的关键点之一。试卷评分时会出现多位数字串,对非粘连字符串,用垂直投影法直接分割;对粘连字符串,提出基于轮廓特征的方法,先将字符图像细化得到其骨架,再利用状态机找到其波形链的波峰波谷突变点,即字符间粘连点,实现粘连字符串的分割。系统采用支持向量机算法对试卷图像中的字符进行识别。结合阅卷中的实际情况,分别训练出了数字分类器与字母分类器,通过交叉验证法选取了本系统适用的支持向量机的核函数参数,并提取字符的HOG特征,通过该特征对字符分类,从而实现了对手写数字和字母的快速、准确识别。本文最后给出了系统的软硬件环境,完成系统主程序与界面设计,介绍了其功能框架与操作流程,并对最终成绩的分布、难度、区分度、信度做出分析。经多次测试,本系统对手写字符识别的准确率超过96%,且阅卷速度可达到每分钟4份,满足实际应用的要求。