基于OCR技术的化验单识别方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:flyindirty2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗互联网的发展,人类医疗产生的健康数据正迅速增长,健康数据体现在就诊后的化验单数据。我国医疗行业医患之间的数量差异导致化验单的解读存在壁垒,高效且准确地解读化验单、管理个人的健康数据是目前健康医疗行业面临的挑战。论文针对解读化验单、管理个人的健康数据中存在的问题,提出基于OCR技术的化验单识别基本流程方法,包括预处理、模式识别、内容识别、识别结果纠错,具体工作如下。首先论文对化验单图像预处理,主要包括二值化、抗扭斜。研究了全局阈值法、自适应阈值法和OTSU方法三种二值化方法,通过对比实验,分析了不同方法的预处理效果,选取OTSU方法作为化验单图像二值化基本方法。随后通过模式识别技术,采用基于霍夫变换的直线检测方法提取化验单图像特征,根据直线特征分类化验单图像、处理化验单图像。再利用Tesseract开源引擎,训练数据、参数调优、识别化验单内容。论文最后对识别结果采取结合编辑距离和化验单医学词库的纠错方案,通过汉字图像相似度比较,确定最终纠错选项。论文通过化验单识别结果纠错前后的对比实验,验证了该纠错方案的有效性。
其他文献
<正>当前食品行业进入发展新时代,食品消费的升级为全球食品行业繁荣发展开启了新蓝海,对食品行业健康发展提出了新要求。《"健康中国2030"规划纲要》、《国民营养计划(2017
目的:研究血清半乳糖凝集素-3水平与冠状动脉粥样硬化严重程度的相关性分析方法:收集于2016年12月至2017年12月期间在河北省人民医院心血管内科住院的冠心病患者及怀疑冠心病
微信辅助教学的引入为高校教育技术创新提供了新的契机,在微信平台使用过程中,利用其信息传播、交流互动、知识分享等特色功能,是一种致力于扩大高校专业学习知识面、促进对
2016年新颁布的《刑法修正案九》中对侮辱罪进行了修改,新增了对被害人的因利用网络实施侮辱、诽谤罪举证困难可由司法机关提供协助的部分。侮辱罪入罪认定标准中的“公然”
随着城乡一体化建设的加快,大城市城乡结合部地区经济快速发展,人财物流动性不断增强,成为未来城市经济发展新的增长点,同时也成为违法犯罪的高发区和社会管理的重点、难点部
ECFA的实施,推动了海峡两岸经济合作日益深化,而跨境经济犯罪也如影随形,给两岸经济合作带来负面影响。为有效应对跨境经济犯罪,海峡两岸警方应在两岸经济合作委员会框架下,
存在决定意识。当前教育的现状在一定程度上决定着高考的重要性。如果不理会高考谈高中课程改革,在现阶段是行不通的。为此,高三阶段的复习备考,依然是广大高三教师和考生的重要
改革开放以来,我国农业和农村经济取得了举世瞩目的成就。但是,新世纪伊始,农业、农村经济发展仍然面临着一系列的矛盾和问题。相应的,农村经济管理也依然存在着这样或那样的
由于邻苯二甲酸酯类化合物的广泛应用,对环境造成了巨大的影响,因此对其的降解性研究刻不容缓。选取邻苯二甲酸酯类中的一种化合物——邻苯二甲酸二辛酯作为受试物,运用好氧