【摘 要】
:
古籍文献具有重要的历史和学术研究价值,不同版本的古籍文献中文字的差异性比较是古籍文献与古籍汉字相关研究的重要内容。传统的人工比对方式效率低、准确性差。随着信息技
论文部分内容阅读
古籍文献具有重要的历史和学术研究价值,不同版本的古籍文献中文字的差异性比较是古籍文献与古籍汉字相关研究的重要内容。传统的人工比对方式效率低、准确性差。随着信息技术的发展,利用计算机辅助古籍文献文字差异性研究是古籍文献研究的必由之路。然而,古籍版面由人工书写而成,文字形态多变,文字粘连与重叠等现象频繁出现,给古籍文献差异性自动比较带来了极大的困难。针对上述问题,本文以《四库全书》文渊阁与文津阁的版面图像作为处理对象,对古籍文献差异性比较方法及其关键问题展开研究。(1)古籍版面图像文字区域提取首先,通过连通域分类信息和利用LSD(Line Segment Detector)直线检测算法所获取的直线信息,对版面边界位置的连通域进行过滤,从而得到版面版框区域;进而搜索直线信息,获得版框近似边缘位置,并通过校正策略对其进行校正,以去除版面图像内的版框,利用垂直投影分析方法解决文字与界行的粘连问题并去除界行,得到古籍版面图像的文字区域。(2)古籍版面图像文字切分应用Deeplab V3+语义分割模型,设计基于Deeplab V3+语义分割模型的古籍版面图像文字切分方法,以解决版面内垂直方向与水平方向的文字粘连重叠问题。首先,设计古籍文字版面图像语义分割标注方法,将文字近似轮廓分割成四种不同类型的多边形区域,建立古籍文字版面图像语义分割数据集,进而利用该数据集对语义分割模型进行训练,并应用于古籍汉字图像切分,得到语义分割结果;然后,设计语义分割后处理算法,利用最近邻合并规则,得到古籍汉字单字图像。(3)古籍版面图像差异性比较应用VGG(Visual Geometry Group)卷积神经网络模型,设计基于VGG网络的古籍版面图像差异性比较方法。首先,建立针对古籍汉字图像特点的VGG网络模型,利用构建的古籍汉字图像库对其进行训练,得到古籍汉字差异性比较分类器;其次,设计古籍文献版面差异性比较算法,利用所建立的古籍汉字差异性比较分类器,对版面中对应的古籍汉字图像进行比较,从而实现两幅古籍文献版面图像的差异性比较和标注。实验结果表明,古籍版面图像文字区域提取算法准确率为89.5%,古籍文字图像切分算法准确率为93.3%,古籍版面图像差异性比较实验中,其差异标记准确率为87.5%,表明该方法有效提高了版面图像差异性比较的准确性。
其他文献
燃煤电站排放的PM2.5给大气环境和人群健康带来严重威胁,控制燃煤电站PM2.5的排放已迫在眉睫。利用声场或蒸汽相变作用,促进PM2.5长大为粒径较大的颗粒,以提高常规除尘装置的
目的:观察耳鸣合并情感障碍者与非耳鸣者静息状态下功能磁共振成像(resting-state functional magnetic resonance imaging,rs-fMRI)的差异,分析耳鸣严重程度与脑功能改变的
近年来,互联网上充斥着越来越多的信息,各种媒体每天在网络上发布大量的新闻。在金融领域当中,由于人们对于企业信誉等更加看重,会更加关注网络当中的相关新闻。同时,大量金
本翻译实践来源于世界自然保护联盟(IUCN)官网,是2015年度IUCN管理的年度评估。笔者负责《评估》第一章至第四章的翻译。IUCN是一个以保护自然环境为宗旨的国际组织,而中国与
学校是开展教书育人活动的主要场所,学校安全与否对于学校教学工作的开展以及师生安全有着重要意义,甚至会影响到社会的安定。随着互联网和人工智能技术的发展与普及,物联网智能安防系统因其智能、高效、功能丰富等特点,成为了许多学校加强校园安全管理的重要手段,极大地推动了我国“平安校园”建设工作的开展,TJZY大学就是在这样的背景下,积极开展校园物联网智能安全工程建设的。鉴于校园物联网智能安防工程项目需要耗费
半导体光催化技术可以利用“绿色”廉价的太阳光,将太阳光能转化为化学能和电能。在合适的条件下,可直接利用低密度的太阳光降解和矿化水和空气中的各种污染物,反应条件温和
氧化固醇结合蛋白(OSBP)及其相关蛋白(OSBP related proteins,ORPs)共同构成ORP家族,保守存在于酵母、植物、哺乳动物中,它们在信号转导、脂质代谢和非囊泡运输等过程中都发挥着重要的作用。该家族属于脂质转运蛋白(LTP)超家族,所有家族成员都具有一个保守的OSBP相关结构域(OSBP-related domain,ORD),能够结合固醇及甘油磷脂。研究表明氧化固醇可以抑制
蛇形机器人是由串联的连杆构成的具有高冗余度的机器人,具有丰富的应用场景与研究价值。但是其复杂的相互耦合的结构使得对其的研究有难度。本文通过蛇形机器人的结构特点来
目的:运用DTI技术通过基于解剖图谱的分析(atlas-based analysis,ABA)方法探究终末期肾病(end stage renal disease,ESRD)伴睡眠障碍(sleep disorder,SD)并长期进行维持性血
目的:探讨脓毒症合并肝功能障碍患者血清肉碱谱的浓度与肝功能障碍程度、病情严重程度及最终预后转归的相关性。方法:采用回顾性观察研究的方法,收集2015年9月至2018年12月期