论文部分内容阅读
随着科技的快速发展和网络资源的不断丰富,电脑和手机端的教育在日常生活中越来越发挥着举足轻重的作用。目前许多在线教育软件可以提供题目搜索功能,用户使用手机对题目进行拍摄,系统对拍摄的图像中的文字信息进行识别与检索,找到题库中与拍摄内容最接近的题目,并将答案与解答步骤反馈给用户,或提供相似题训练等服务。可见如果能够正确识别出文字对于提高用户体验有着重要意义,而拍照下的题目照片的文本区域识别和题目类别识别的题目分类算法是图片字符识别至关重要的一步,提高题目分类算法的准确率对于进一步的题目文本识别具有深远的意义。为了实现这一目的,本文针对文本区域定位算法、分类算法、系统整体设计和相关应用进行了研究和实践,具体的工作如下:1.针对文本区域定位算法的设计和实现,本文采用了笔画宽度变化的方法对手机拍照得到的图像中的题目所在的文本区域进行定位,使得后续操作只针对文本区域,减少了分割与识别的工作量,提高了准确度。2.针对定位好的文本区域分类算法,本文使用提取不止一个特征的方法,对已经定位好的区域特征进行全面的提取。然后使用从二分类支持向量机转化而来的三分类支持向量机将文本区域分类为数学,语文,英语三种类型。3.设计和实现了题目字符识别系统,鉴于光学字符识别有比较广阔的应用前景,与此同时为了验证前面两种算法的有效性,设计实现了基于图像字符识别的手机拍照下题目文本识别和题目数据库检索的系统。本文实现的两个算法,文本区域定位算法的召回率为79.04%,笔画准确度为79.59%,像素准确度为90.39%。准确率和运算速度优于其他文本定位算法。定位好的文本区域分类算法可以将分类的平均准确率达到92.32%,比传统分类器性能优越。