论文部分内容阅读
信息的高效检索在当今信息快速增长的时代变得越来越重要。对珍藏在世界各地的宝贵历史资源进行快速检索定位,合理挖掘和使用这些潜在的有效历史信息是信息检索领域的一个重大研究课题。信息检索技术一方面能帮助我们快速地查找有用的资讯,减轻用户的搜索压力;另一方面也让我们迅速了解到前人有价值的研究工作。传统的基于光学字符识别的检索技术虽然在信息检索领域上取得了一系列丰硕的成果,但随着检索的信息越来越复杂,搜索的对象失真程度越来越大,传统的光学字符识别技术已经不适合未来快速准确检索的应用需求。本文将以深度学习理论作为主要的工具,结合目前的信息检索算法,从基于匹配的角度和基于识别的角度两个方面对历史文本上的手写英文单词检索进行研究。主要的研究工作和贡献包括如下:1.完成了英文单词图片的多特征提取,其中包括梯度直方图特征(Histogram of Oriented Gradients,HOG),局部二进制模式特征(Local Binary Patterns,LBP)和基于空间金字塔的多尺度梯度直方图特征(Spatial Pyramid HOG,SPHOG)。2.实现基于度量学习的单词匹配算法。使用两种不同的网络结构:多层感知器(Multilayer Perceptron,MLP)和卷积神经网络(Convolutional Neural Network,CNN)衡量两张英文单词图片的相似度。在使用CNN时,分别采用双通道卷积神经网络,Siamese网络和Pesudo-Siamese网络进行对比实验。3.结合卷积神经网络和双向长短型记忆递归神经网络(Bidirectional Long Short Term Memory Recurrent Neural Network,BLSTM),实现基于文本行的无分割单词检索。使用CNN自动学习文本行图片的时序特征,然后利用BLSTM对文本行的英文单词进行无分割地识别,从识别的角度实现英文单词检索的功能;4.在两种不同规格的数据集George Washington和IAM脱机数据库上进行试验,实现基于匹配和基于识别的检索任务并和其他流行的模型算法进行比较;同时还对卷积神经网络提取的特征进行可视化。