基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:Rita519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息的高效检索在当今信息快速增长的时代变得越来越重要。对珍藏在世界各地的宝贵历史资源进行快速检索定位,合理挖掘和使用这些潜在的有效历史信息是信息检索领域的一个重大研究课题。信息检索技术一方面能帮助我们快速地查找有用的资讯,减轻用户的搜索压力;另一方面也让我们迅速了解到前人有价值的研究工作。传统的基于光学字符识别的检索技术虽然在信息检索领域上取得了一系列丰硕的成果,但随着检索的信息越来越复杂,搜索的对象失真程度越来越大,传统的光学字符识别技术已经不适合未来快速准确检索的应用需求。本文将以深度学习理论作为主要的工具,结合目前的信息检索算法,从基于匹配的角度和基于识别的角度两个方面对历史文本上的手写英文单词检索进行研究。主要的研究工作和贡献包括如下:1.完成了英文单词图片的多特征提取,其中包括梯度直方图特征(Histogram of Oriented Gradients,HOG),局部二进制模式特征(Local Binary Patterns,LBP)和基于空间金字塔的多尺度梯度直方图特征(Spatial Pyramid HOG,SPHOG)。2.实现基于度量学习的单词匹配算法。使用两种不同的网络结构:多层感知器(Multilayer Perceptron,MLP)和卷积神经网络(Convolutional Neural Network,CNN)衡量两张英文单词图片的相似度。在使用CNN时,分别采用双通道卷积神经网络,Siamese网络和Pesudo-Siamese网络进行对比实验。3.结合卷积神经网络和双向长短型记忆递归神经网络(Bidirectional Long Short Term Memory Recurrent Neural Network,BLSTM),实现基于文本行的无分割单词检索。使用CNN自动学习文本行图片的时序特征,然后利用BLSTM对文本行的英文单词进行无分割地识别,从识别的角度实现英文单词检索的功能;4.在两种不同规格的数据集George Washington和IAM脱机数据库上进行试验,实现基于匹配和基于识别的检索任务并和其他流行的模型算法进行比较;同时还对卷积神经网络提取的特征进行可视化。
其他文献
地面气象观测与广大人民的日常生活息息相关,随着经济和科技的不断发展和进步,投入了自动气象站,实现了探测的自动化,但是在实践过程中,地面气象对比观测仍然存在数据的差异
绝经后骨质疏松症是原发性骨质疏松症中的常见类型,目前随着我国人口老龄化的不断加剧,此病在中老年妇女人群中的发病率越来越高。绝经后骨质疏松症若不及时诊治,日积月累,在
教师观的演变可以反映出不同时代教育状况的变更。本文以比较的视野,对传统社会、近代工业社会及后现代视野下教师观中的教师地位、教师作用及师生关系作了比较分析。在此基础
企业文化建设的效果来源于落实,企业文化的落实靠管理,而落实的保证在于领导干部的言传身教。只有强化企业文化建设,才能提高企业的市场竞争力,取得更好的社会效益和经济效益
为了进一步的提升企业对于资源的有效配置,更好的帮助企业获得全面发展,我国的企业都开始加强全面预算。水电施工企业作为我国经济发展中的基础企业,水电施工企业由于存在全
戏班,既是戏曲艺术的生产者又是直接面向观众的传播者。戏曲艺术的形式、种类、风格都是由戏班和戏班艺人们经过长期艺术实践创立的。所以戏班不仅能够体现出戏曲的生存状况,
在企业的生产经营中,政工工作发挥着无法替代的作用:一方面深入落实贯彻党的方针政策,为企业发展提供了明确的方向,保证企业稳步前行。另一方面有效地解决了企业内部的矛盾,