基于深度卷积神经网络的甲骨文字识别研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:liujiao395495759
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甲骨文是中国迄今为止发现的最早的成熟文字系统,是汉字的来源,也是中国优秀传统文化的根源。现在甲骨文的研究已经进入信息时代,2019年在安阳市举行的纪念甲骨文发现120周年国际学术研讨会的开幕式上,甲骨文大数据平台——“殷契文渊”正式发布。该平台是甲骨文知识共享平台,对全世界的学者免费开放。由于目前甲骨文资源大多是图片,不利于该平台的数据进行输入、存储、检索、传输等,所以作为该数据平台研究团队中的一员,对甲骨文字进行识别研究工作愈加重要。本文主要研究拓片上甲骨文字的识别,文字识别的传统方法主要是基于“数据预处理+人工特征提取+分类识别”框架,对印刷体文字的识别率较高,而对于手写体的识别率并不高。甲骨文是殷商时期的手写体文字,异形体较多,数据样本少,并且拓片上的甲骨文还有背景噪声,所以识别有一定的难度。近几年,基于深度学习的脱机手写文字识别技术得到充足的发展,深度神经网络具有极强的图像多层次特征提取能力,能够描述文字图像不同级别的数据特征。因此,本文利用深度神经网络进行甲骨文字识别研究,设计具有较好识别能力的深度卷积神经网络甲骨文字识别框架。实验结果证明该模型能够较好地表达甲骨文字特征,达到较高的识别精度。本文的主要研究内容包括:(1)构建用于网络训练和测试的甲骨文字数据集。花费了一年的时间从甲骨文的十部著录中裁剪经专家确定的拓片上的甲骨文字图像,并裁剪该拓片上的甲骨文字,且对甲骨字进行标签标注,构成甲骨文字拓片数据集OBIS163。该数据集中的甲骨文字类别共有163类,每类共有300张原始图片,选出其中的250张原始图片作为训练集,剩余的50张原始图片构成测试集。(2)对数据集进行预处理操作。对数据的预处理操作包括数据增强、图像去噪和对其进行归一化操作。其中数据增强采用的是图像几何变换的方法,包括旋转、形变、缩放、遮盖等;图像去噪使用的是前馈神经网络去噪的方法,构造去噪神经网络对甲骨文数据进行去噪;最后采用零均值归一化方法对其进行归一化处理。(3)构建基于深度卷积神经网络的甲骨文字识别网络。首先了选取四种经典的神经网络在甲骨文字数据集OBI-CNN上进行识别实验,结果显示测试集的Top-5识别率最高只有70.71%,故提出了一个能同时兼顾甲骨文字识别速度和识别精度的网络模型,命名为OBI-CNN。该模型根据甲骨文字的特征设计,由于甲骨文字是用锐器雕刻而成,故字体多为条形,而非汉字的方形,故将部分方形卷积核更换为长条卷积核,且将两个条形卷积的特征图进行叠加,加深网络深度的同时也减少了网络参数数量,使甲骨文字特征更加明显。实验结果证明,改进后的网络能够更好地提取甲骨文字的特征,识别率达到了84.45%,比改进前的网络提升了13.74%。(4)甲骨文字识别系统的搭建。以PyQt5作为界面开发工具,在深度学习框架Pytorch基础上通过对甲骨文字特征提取、分类识别等不同环节的相关算法进行整合,把训练好的网络模型作为甲骨文字深度特征提取器,将其加载到Windows系统上做成甲骨文字识别系统,方便用户的使用。
其他文献
伴奏制作是音乐工作中非常重要的元素之一,而和弦编配是伴奏制作的关键环节,通常需要较多的音乐天赋和深厚的乐理知识才能胜任。目前该工作大多交由人工来完成,单调枯燥且门
随着社会经济的飞速发展,人与人之间的交互行为愈加频繁,每个人都不是生活在自己“孤岛”上的独立的“自然人”,而是与社会有机联系的“社会人”。法律为了适应社会的这种进
近些年来,卷积神经网络在许多与计算机视觉相关的任务(如目标检测和图像识别)上均取得了显著的成就。但是多数卷积神经网络的优异性能都以计算和内存成本的显著增加作为代价,
随着互联网、大数据、云计算、物联网等信息技术的快速发展,以深度学习为代表的人工智能技术发展迅猛,在各行各业都取得了前所未有的成功。在过去的十几年中,深度学习吸引了
全国汽车保有量急剧增长,大量的汽车旧件相伴而生。汽车旧件的不合理处置方式,会引发环境污染、资源浪费等问题。旧件回收管理是汽车企业实现降本增效的重要方法,是实现循环经济的关键之一。对汽车零部件供应商而言,环境效益是评价企业运营绩效的重要指标之一,旧件回收管理对企业树立品牌形象,提高品牌竞争力具有重要作用。目前汽车产业价值链协同平台上的已有一套投入实际使用的汽车售后服务管理系统,多年运行汇聚了大量汽车
虚拟CSR共创(Virtual Corporate Social Responsibility Co-creation)是指企业战略性地运用社交媒体邀请利益相关者共同参与、实施企业的CSR活动。比如阿里和腾讯等企业通过
全球变暖不仅影响森林凋落物质量和数量,还会影响降水量和降水格局等。降水是土壤水分的重要来源,地表凋落物是土壤有机碳的重要来源,二者对陆地生态系统碳循环具有重要意义。为了研究亚热带季风气候区降水和凋落物变化对土壤呼吸的影响,本试验以重庆缙云山常绿阔叶林为研究对象,通过人工遮雨和增加降水的方式来探究土壤呼吸对不同降水和凋落物输入的响应,包括8种不同处理方式:保留凋落物和零降水(CZ)、保留凋落物和自然
空气质量在中国日常的讨论中已经占据了越来越多的专注度,污染物浓度爆表,出门带口罩,人们感受到了污染所带来的诸多不便。但是我们要知道空气污染是一个全球性问题,但是环境
立体显示技术广泛应用于教学、军事、医疗、广告媒体等多个领域,是虚拟现实(VR)的关键技术;它模仿人眼立体视觉将空间中的物体以三维方式记录并再现。心理暗示和双眼生理知觉是产生立体视觉深度的两种方式:传统二维图像显示是通过人的心理暗示感觉空间深度和层次。而裸眼立体显示是生理3D显示,它比传统的平面图像显示更逼真地再现场景的深度信息,能使观众有身临其境的生理视觉感受。裸眼3D技术指观众无需佩戴任何辅助设
深海管道作为海洋工程中重要的运输构件,在复杂环境和循环荷载的作用下,应力集中部位极易发生损伤破坏。基于压磁效应的磁检测技术可以通过铁磁性构件表面的压磁信号来表征构