基于卷积神经网络的甲骨文识别研究与应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:aiming4636j
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甲骨文是中国最古老的文字体系,它是汉字的起源,也是中华民族优秀传统文化的根。甲骨文识别的任务是确定甲骨文的字符类别,它是完成甲骨文释读的必要前提条件。目前,对拓片上的甲骨文进行自动文字识别工作主要依赖专家的特征工程。工作内容复杂且工作量大,需要大量的人工成本和时间成本。所以对甲骨文进行自动图像识别具有重要研究价值。目前卷积神经网络在图像识别域已经取得了很大的成果。本文利用卷积神经网络中的ResNet-50网络模型对甲骨文字识别进行研究。通过改变卷积核尺寸以及对模型参数和算法进行调整优化,设计出了具有较好识别能力的甲骨文字识别模型。并将该模型与其他五种经典的卷积神经网络进行了对比实验。实验结果证明该模型可达到较高的识别精度,具有较高的甲骨文图像识别能力。本文的主要研究内容包括:第一,对用于实验的甲骨文数据集进行预处理操作。原始的甲骨文数据集包括300个甲骨文文字类别,每个类别统一分配120张图片,共36000张图片。数据预处理操作包括数据集扩充、图像去噪以及对其进行图像尺寸归一化。其中数据集扩充采用了图片剪裁和图像几何变换的方式,图像几何变换采取了旋转、平移以及弹性形变的方法。图像去噪使用了注意力生成对抗网络,构造去噪网络模型对甲骨文图片进行去噪处理。图像尺寸归一化使用的是双线性插值法,将数据集中所有的图片尺寸都调整为统一的224*224像素。扩充后每个图像类别中包含的图片数量为960张,是原有数据集的8倍。第二,提出改进的ResNet-50网络模型。由于甲骨文的字符为长方形,该模型改变了初始模型的卷积层中部分卷积核的尺寸,将部分正方形卷积核改为长方形卷积核。接着对ResNet网络模型的优化进行研究,通过基于控制变量法的实验比较各个方法对模型的优化效果,并确定最终的优化方案。最终的方案为batch_size值设为64、使用Adam优化算法、使用分段常数学习率衰减方式。优化后的模型识别准确率达到87.43%,比原始模型提升了7.38%。最后将改进的网络模型与其他五个经典卷积神经网络模型进行了对比试验。实验结果表明,本文提出的“改进的ResNet-50”网络模型具有最高的识别准确率。第三,设计并实现甲骨文识别系统。将前期工作进行整合,包括图像去噪算法、图像识别算法等,搭建了甲骨文识别系统。系统使用训练好的图像去噪网络对用户上传到系统的甲骨文图片进行去噪处理。然后将其输入到训练好的基于“改进ResNet-50”的图像识别网络中进行识别,最后将识别结果输出到前端页面中。
其他文献
背景:现代颅内动脉瘤的显微夹闭治疗日趋完善,动脉瘤夹也在神经外科临床实践中更新换代,新一代开窗型动脉瘤夹—Yasargil T-Bar夹,在治疗某些复杂型动脉瘤时体现了其独特的优势,同时也为神经外科医生进一步探讨、研究复杂动脉瘤提供了方向。目的:研究Yasargil T-Bar夹在颅内动脉瘤夹闭术中的实效性、外科技巧及临床经验。资料和方法:回顾性分析了吉林大学第一医院神经外科2018年1月至201
目的:探讨合并急性肾损伤(Acute kidney injury,AKI)的尸体供者(deceased donor,DD)供肾用于移植的临床应用效果。方法:回顾性分析吉林大学第一医院泌尿外二科2015年1月至2020年1月间收治的390例尸体供者和763例受者的临床资料,根据供者AKI发生情况,将受者分为AKI组和非AKI组;按照KDIGO诊断分级标准,将AKI组分为KDIGO 1级组和KDIGO
我国证券市场起步较晚,在对会计信息披露违规的监管方面还是存在着许多不足,给一些有不好动机的管理人员留下了信息披露违规的漏洞,上市公司的会计信息违规披露行为使中小股东的投资方向直接受到影响,经济利益受到损害,此外证券市场的秩序也会受到一定程度的扰乱,阻碍资本市场的正常发展。伴随着市场经济的发展和资本市场的繁荣,虽然我国相关部门也在不断加大监管力度,然而会计信息披露违规的现象依旧存在,上市公司会计信息
当前国内大多数城市公立医院都已实现了信息化建设,信息技术在医院管理中的广泛应用和现代医院管理科学的飞速发展,医院信息化管理的重要性已得到社会的普遍认同。医院内外环境均需要信息支持,数据互联互通信息共享。信息化和大数据互联互通在医院经济运行中的应用和管理尤为突现。财务管理为医院的重要工作,管理能力高低同医院良性发展直接相关。基于大数据技术,
期刊
背景:胼胝体是处于人类大脑中线位置的重要的白质结构,其功能为在人类进行活动时协调双侧大脑半球的运作,胼胝体的联合纤维在大脑半球中占据着重要的地位。胼胝体肿瘤在临床上最常见的是胶质瘤,其余类型的肿瘤有淋巴瘤、脂肪瘤等。胼胝体膝部及体部最常见于肿瘤生长,而临床上较少遇见胼胝体压部肿瘤。通常认为胼胝体功能重要,部位较深,手术难度较大,因此,对此处肿瘤行手术治疗被风险是大于收益的。然而伴随影像学技术的提高
推进课程改革几年来,我们结合实际,对临川传统教育文化的继承与发展进行了深入的研究,我们确定推进课改的总体思路是:按照"弘扬临川文化,谋划和谐发展,成就幸福人生"的教育发展理念,确定"一个中心"—以实施素质教育为中心;强调"两个统筹"——城区学校与农村学校的统筹发
期刊
随着计算机技术的不断发展,人类社会中的各个方面开始与之产生紧密联系。人们日常生产生活中产生的海量数据大多以电子化的形式存储在关系型数据库中,在对这些数据进行访问时,往往需要编写SQL(Structured Query Language)来对数据库进行操作。但是,SQL本质上是一种计算机编程语言,编写SQL需要一定的专业知识,此外,还需要了解所访问的数据库模式。通过自然语言来与数据库进行交互查询数据
目的:探讨硬腭粘骨膜、掌长肌腱、鼻唇沟皮瓣这一“三明治结构”在全下睑再造中的可行性。方法:收集2015年至2020年于吉林大学第一医院治疗的因外伤或肿瘤切除导致重度下睑全层缺损行全下睑再造的13例患者的临床资料,对其进行回顾性分析,年龄范围23~61岁,平均年龄为42.2岁,10例为男性(71%),3例为女性(29%),病变部位:左下睑7例,右下睑6例,所有均累及眼睑全层,修复下睑缺损的面积为3c
血栓性疾病,如中风和缺血性心脏病,依然是全球死亡率及致残率最高的疾病。血栓的形成是一个复杂的、动态的、多步骤过程,涉及到生物化学反应、力学刺激、血流动力学等多个方面。近年来,人们已经从这些方面出发做了大量的研究,以期全面地理解血栓的形成机理,更好地预防及治疗此类疾病。然而,无论是从实验、数值还是理论角度,这都存在着巨大的挑战。实验上,受体内测量精确性限制,观察结果的可靠性往往难以保证;数值上,受血
背景:甲基鸟嘌呤-DNA甲基转移酶(MGMT)的高表达是导致胶质瘤对替莫唑胺产生耐药的重要原因。近些年来有研究表明Wnt/β-catenin和NF-κB通路与MGMT介导的替莫唑胺耐药相关。生酮饮食在实验和临床研究中表现出较强的抗胶质瘤作用,但是其对于胶质瘤治疗过程中增强替莫唑胺疗效的研究相对较少。生酮饮食可以调控NF-κB和Akt通路,但是其对于MGMT影响的相关研究较少。目的:探究生酮微环境对