【摘 要】
:
汉字由于本身具有字体风格多样、字符集巨大、字符相似性高等特征,因此比英文字母更加难以识别,这就给识别研究带来了很大的挑战性。而中文票据则由于版面更为复杂包含各种印章、表格、不规则图案等,因此比普通的标准中文文档更具挑战性。目前市场上虽然有各种型号的OCR设备,号称识别率可达99.99%,但是在现实情况中,除名片、身份证等类的表面图案复杂度低、面积较小、不易弯折、字体结构比较单一的类别的目标物时比较
论文部分内容阅读
汉字由于本身具有字体风格多样、字符集巨大、字符相似性高等特征,因此比英文字母更加难以识别,这就给识别研究带来了很大的挑战性。而中文票据则由于版面更为复杂包含各种印章、表格、不规则图案等,因此比普通的标准中文文档更具挑战性。目前市场上虽然有各种型号的OCR设备,号称识别率可达99.99%,但是在现实情况中,除名片、身份证等类的表面图案复杂度低、面积较小、不易弯折、字体结构比较单一的类别的目标物时比较容易识别,其它类似于票据类的薄纸质类目标物,目前市场上的OCR产品对带有中文的票据类目标物识别效果都不算太理想,有待进一步改进。本课题结合一些传统图像处理算法和目前性能比较好的几个深度神经网络的算法,对传统中文票据识别系统做了一些改进和优化,本课题主要做了如下几点的工作:首先,训练样本的制作部分,训练数据集增广的方法除了采用了传统的仿射变换和加随机噪声的方法外,还引入了条件生成对抗网络,对训练样本做了比较好的扩充,将十分有利于后面识别模型的训练。其次,识别模型部分,采用了深度卷积神经网络,本课题将目前性能比较优良的几个神经网络分类算法架构,根据本课题的实际需求做了一下结构上的调整,通过实验我们得到了几个比较好的参数模型,并将它用于我们的最终项目中。再其次,识别模型的部署部分,我们引入了神经网络加速运算棒。采用了先在本地PC机上部署,然后上传服务器的方案,替代了以前客户端只负责上传票据图片服务器负责运算的方案。最后,识别后的结果纠错部分,在现实情况中由于光照不均或者票据图片有少量破损的情况不可避免的会出现,切割的时候文字难免会出现有残缺的情况出现,这里我们将自然语言处理的算法引入到纠错模型中,即LSTM网络与识别模型相结合的方法。
其他文献
<正> 一般概况国内机械行业应用的机械手绝大部分为专用机械手,附属于某一设备,其工作程序是固定的。通用机械手也已有发展,目前应用的都是开关式点位控制型,伺服型已试制出
<正> 干部分流是机构改革的一个重要环节,也是建国以来前6次机构改革的难点,更是机构改革必然要涉及的一个敏感问题。当前,从基层情况来看,绝大多数机关干部对即将进行的机构
<正>"今天对中国人民来说是一个不寻常的日子,因为今天西湖得到了全世界的热情关注,成功列入《世界遗产名录》。"2011年6月24日,在法国巴黎联合国教科文组织第35届遗产大会上
目前,我国已在银行、证券期货、保险等传统金融行业建立起各类自律组织,在一些新兴的金融领域如P2P、支付清算领域也有建设行业自律组织的需求,这些组织逐渐承担起部分监管职
黑龙江全省面积47.3万平方公里,广阔的土地上蕴含着丰富的旅游资源,尤其在乡村旅游方面,更拥有区位、自然资源等多种优势。助推黑龙江旅游产业扶贫对推动全省经济发展有着直接的意义。自我国精准扶贫进入攻坚期,很多问题接连出现,对我国决胜2020年的宏伟目标,造成了极大的制约。习近平主席2017年10月18日在党的十九大报告中明确指出把解决好三农问题作为全党工作的重中之重,实施乡村振兴战略且当前黑龙江省旅
目的观察加味补中益气汤(党参、黄芪、白术,等)在老年气虚血瘀型股骨粗隆间骨折围手术期的临床疗效。方法选取120例符合纳入标准的股骨粗隆间骨折患者随机分成治疗组和对照组
随着商品经济的发展和市场竞争的加剧,人们的生活水平和社会文化素质逐渐提高,市场营销理念也在逐步更新,文化营销作为树立产品个性,赋予产品灵魂的方式,在现当代社会起着越
<正>建设21世纪海上丝绸之路是中国深化改革、扩大开放,积极发展国际海洋合作关系的重要决策。目前,相关国家级规划正积极编制中,预期将进一步开放沿海和沿边枢纽港口、重点
<正> 十九世纪后半叶,预加应力的观念已经应用到钢筋混凝土上,最早对混凝土构筑物施加预应力试验的是美国P.H.Jackson于1861年进行的,1927年比利时R.Farber获得在混凝土硬化
优质农产品的供应是全世界都在关注的问题。水果是世界上最重要的农产品之一,尤其在中国,是仅次于粮食作物的第二大种植产品,这其中苹果又是产量最大,分布最广的水果之一。中国的水果产量居世界首位,但单位产值远低于欧美发达国家,这种情况在其他发展中国家中也很常见。有时,由于质量问题,苹果的经济效益不能满足我们的要求。苹果的分类过程对产品的附加值有着重要的影响。传统的水果分级方法依赖于人类的感知,其中水果的质