面向OCR文本识别词错误自动校对方法研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:qingqing008800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对OCR识别后文本中词错误校对问题,提出一种同一特征多角度结合的OCR识别后文本中词错误的自动校对方法。方法通过上下文相邻词与窗口移动法相结合为句子中字词串计算置信度,设计置信度计算方法判断正误,给出疑似错误位置;利用统计语言模型与同一特征多角度相结合的方式对错误处提出改进建议。采用检察院纸质卷宗OCR识别后的文本数据进行了测试,实验测试集中共包含236处错误。实验结果表明,所提出的方法能够有效发现文本中错误,查错召回率达到88.56%,纠错的准确率达到79%,上述方法能够有效实现OCR识别后的中
其他文献
投资项目评价是企业投资决策的数量依据,如何选择评价指标体系直接影响评价的结果。本文主要比较了工业、农业、商业投资项目的核心指标体系选择与辅助指标体系选择,提出了企业
目的分析影响重型颅脑创伤术后昏迷患者后期生存质量的伦理问题。方法选取2013年8月—2016年4月我院诊治的重型颅脑创伤术后昏迷患者140例,所有患者均按照医院标准流程进行干
经国家新闻出版总署批准,教育部主管、四川大学主办的《BoneR esearch》(《骨研究》)英文学术期刊(CN51—1745/R,ISSN2095—4700)于2013年正式出版并全球发行,期刊网站www.boneresearc
《社区工作》课程是社会工作专业的十大主干课程之一,如何上好本门课程,笔者进行了很多探索,本文在实验的基础上,主要分析了分组教学在《社区工作》课程教学中的意义,希望对其他课
智能工厂设备故障分析与预测是精益生产的需求,有效地故障分析与预测对于合理地制定设备健康维护计划具有重要的指导意义。从智能工厂设备的历史故障数据出发,针对设备故障信息利用率较低,主要故障提取无代表性,各个故障对系统的交互作用体现不明显等问题,从分析某家电企业装配线单机设备的连接及工序入手,考虑连续生产工序上各单机设备故障之间的关系,提出连线生产组故障损失度作为相互关联设备故障分析指标。利用连线生产组
目的探讨房颤患者在迷宫手术中的麻醉处理,为提高患者的麻醉质量提供参考依据。方法选取我院2012年3月-2014年3月心脏外科收治的70例房颤患者作为研究对象,回顾性分析麻醉后患
20世纪80年代末、90年代初以来,中国全面进入社会转型期并启动了快速融入全球一体化的进程。同一时期,处于后“冷战”阶段的欧洲也同样面临全球化等社会发展的机遇与挑战,为促进
本文根据机械工业部确定的包装食品机械发展重点的要求,对如何开发方便锟钝生产线进行了科研、市场调查,并从生产设备的性能、规格、价格、市场等方面对国内外部分生产厂家的基
以往的人脸识别定位方法因受外界环境因素的干扰较大,存在定位误差较大的弊端。为实现高精度、高效率的人脸关键点识别定位,提出基于深度学习的人脸关键点识别定位方法。首先对深度学习方法中的深度信念网络进行全局训练,利用图像的LBP纹理特征得到人脸测试样本的关键点类标值,完成对人脸关键点的识别;设计人脸关键点定位的并行网络结构,结合并行卷积神经网络完成对人脸关键点的精准定位。仿真结果显示,上述方法在不同隐藏
目的探讨有效的外科甲状腺患者手术护理方法。方法将100例行手术治疗的甲状腺患者随机分成对照组和试验组,每组50例。对照组采用甲状腺手术围术期常规护理方式进行护理,试验