【摘 要】
:
光学字符识别技术(Optical Character Recognition)是一类通过电子设备扫描文本,从而将文本上内容翻译成计算机文字的技术。随着大数据时代的到来,人类每年产生的数据正在以指数的形式增长,如何有效且快速的从文本,图像,视频中提取到用户感兴趣的信息得到了越来越多研究者的关注。传统的光学字符识别技术基于人为手工设计特征,对于复杂背景,光照,扭曲等环境下的字符识别效果较差。近些年来随
论文部分内容阅读
光学字符识别技术(Optical Character Recognition)是一类通过电子设备扫描文本,从而将文本上内容翻译成计算机文字的技术。随着大数据时代的到来,人类每年产生的数据正在以指数的形式增长,如何有效且快速的从文本,图像,视频中提取到用户感兴趣的信息得到了越来越多研究者的关注。传统的光学字符识别技术基于人为手工设计特征,对于复杂背景,光照,扭曲等环境下的字符识别效果较差。近些年来随着以深度学习技术为核心的新一代文本检测技术的出现,光学字符识别效果取得巨大突破。深度学习技术可以从海量数据中学习到最具有鲁棒特征的分类信息,极大提高了图像识别与目标检测的准确率。但是该技术极其依赖大量数据来修正卷积神经网络参数,提高模型泛化能力。本文针对答题卡中的手写数字检测与识别任务,采用深度卷积神经网络设计了一套自动累分算法。该算法由检测模型与识别模型合作完成统分任务,同时通过优化模型超参数与结构,提高模型的泛化能力与检测速度。并针对检测数字倾斜导致无法识别的问题,设计了一个倾斜校正算法,提高了识别算法的可靠性。本文的主要工作如下:(1)针对传统多位手写数字识别算法无法分割连笔数字以及预处理过程中造成的图像失真导致识别准确率低的问题,采用卷积循环神经网络算法(CRNN)训练了一个能够端到端识别多位手写数字的模型,该算法无需预处理,并通过实验证明了该算法识别准确率远远高于传统算法,并能够有效识别连笔数字。(2)使用了标注工具,制作了一个包含500张图片的印刷体文本手写数字检测数据集,并将其转换成VOC数据集格式。针对该检测任务分别训练了一阶段检测算法SSD,两阶段检测算法Faster-rcnn,通过对比两种算法速度与精度的差异,选择SSD算法来检测答题卡区域的手写数字。(3)通过K-means算法分析了数据集中目标大小与比例分布,优化了SSD算法参数,提高了模型泛化能力。并通过实验简化了模型结构,加快了检测速度。针对检测图片可能存在倾斜影响识别准确率的问题,利用最小二乘法完成倾斜图片的自动校正,提高了算法的鲁棒性。(4)利用训练好的CRNN识别模型与SSD检测模型,设计了一个试卷答题卡自动累分算法,并在PC端完成自动累分算法的调试。设计了一个可以在移动端调用该算法的APP,使得算法使用场景更加多元。
其他文献
现阶段,在线学习研究已经成为高等教育领域不可回避的话题,学生的主体地位愈发明显。为了更好的提升在线教育质量,应该多关注学生在在线学习过程中的感受和接受程度,而在线学习投入度作为评估在线教育质量的重要指标是最能够反映大学生在线学习现状的,该指标考察的是大学生在线学习的投入程度、接受程度和学习效果的情况。因此,有关在线学习投入度的研究对于全面了解在线学习模式下大学生的学业成就和评估高校在线教育质量有着
微波光子技术是两门学科的交叉与综合,其两门学科分别为微波和光子学。其不仅利用微波频段可以为无线通信提供较宽的频谱资源,而且还可以利用光纤优势,具有宽带宽、低消耗、抗电磁干扰等特点。该技术在军事、卫星、无线通信方面都有重要的应用,而本文在光载无线通信(ROF,Radio-Over-Fiber)基础上对光载微波信号的传输问题,展开一系列的理论和仿真的研究。为了解决光载微波信号在长距离模拟光链路中传输的
图像修复是对图像中存在的缺失区域进行修补或者是对图像中不需要的目标物体进行移除,使得修复后的结果能够保持图像的视觉合理性,人眼无法观察到图像曾经缺失或已被修复。随
只要有权力,一个人就可能产生腐败动机,做出越轨行为。因此,腐败治理成为世界的难题。腐败作为一种社会污染,一旦蔓延开来,就会蚕食心智,破坏公平,极易引发重大社会事件。中国改革开放以来,为了降低腐败的危险性,在社会进入重要转型期,党中央立于现实,围绕中心任务,采取多种举措反对腐败,进行廉政建设,使党的反腐倡廉建设有了新发展,迈入了新阶段。改革开放新时期,以邓小平同志为核心的中央领导集体,重设反腐倡廉路
随着移动通信技术和传感器技术的迅速发展,群智感知成为移动互联网领域的研究热点。移动节点利用智能终端嵌入的各种传感器感知数据并上传到感知平台,平台通过对数据的分析和
社交媒体平台包含了大量的文本数据,包括用户的反馈、评论、对话、意见等信息,这些信息是情感分析的基础。个体异常检测和情感建模是情感分析的重要组成部分,也是情感计算的
在协同任务环境下,借助工作流管理系统实现企业业务、信息和资源整合,使得多组织参与的业务过程执行更加高效。但是,由于资源服务数量巨大,种类庞杂,资源服务选取效率亟待提
传统测试中通过对比程序的输出结果与预期结果是否一致,来判断此次测试中是否发现了错误。但当一个待测程序的输入与输出关系很复杂时,将难以为待测程序构造预期输出。这即是软件测试中的Oracle问题。蜕变测试通过验证多个测试用例及其输出是否满足蜕变关系来判断程序中是否存在错误,从而缓解了测试中的预言问题。蜕变关系是蜕变测试的核心。为了确保蜕变测试的有效性,在蜕变测试中会构造出大量的蜕变关系。若所有的蜕变关
行为分析的目的是从视频中检测和识别正在发生的行为,使得计算机系统能够理解行为并对场景进行进一步的语义描述。然而,海量视频数据的背后蕴含的是参差不齐的视频内容,这无疑给视频行为分析带来了巨大的挑战与压力。当前已有的各种分析模型虽然能够较好地对视频中的行为进行分析和识别,但是仍然存在一定的局限性:行为分析模型多数局限于底层特征,难以表达行为发生的具体过程;复杂的背景噪声和光照条件的变化,使得视频中包含
随着信息技术的发展,人口和计划生育业务也依托信息技术建立人口计生信息系统(PIS)来科学高效的实行人口信息管理、计划生育业务管理、人口统计与分析等。但随着经济社会的不