基于深度学习的近重复文本图像检索研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:delicious_bupt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近重复文本图像检索在文本图像分析与理解中起着非常重要的作用,而且在很多领域有着迫切的实际应用需求。传统近重复文本图像检索方法需要人工事先确定近重复图像之间存在的变换类型,并根据变换类型选取合适的特征来描述图像。由于传统方法受人工影响大、主观性强,本文聚焦于基于深度学习的近重复文本图像检索问题,研究内容主要包括以下两个方面。首先,本文提出一种基于分类卷积神经网络的近重复文本图像检索方法,使用卷积神经网络作为特征提取器,将所提取的特征用于检索。通过实验对比研究了不同卷积神经网络的不同层的特征经过不同池化方法处理后在描述图像方面的能力,并使用两类数据集对网络进行微调,比较不同微调数据集对检索性能的影响。其次,本文提出一种基于三分支孪生卷积神经网络的近重复文本图像检索方法,能自动学习近重复图像之间存在的各种变换。网络输入为一个三元组,包括一个查询图像、查询图像的近重复图像以及查询图像的非近重复图像。通过采用三元损失使得查询图像和近重复图像之间的距离小于其与非近重复图像之间的距离。网络训练好后,可以将任意图像输入网络的一个分支提取其特征,所提取的特征对近重复文本图像之间存在的各种变换具有良好的鲁棒性。由于目前没有公开的近重复文本图像数据集,本文建立了两个近重复文本图像数据集,包含中文与英文两种语言,近重复文本图像之间在光照、视角以及分辨率等方面均有较大的差异。在两个数据集上进行了大量的实验并且与现有方法进行比较,实验结果验证了本文提出方法的有效性。
其他文献
虚拟手术是以医学图像数据为基础,通过三维重建技术构建出虚拟器官组织模型,同时通过触觉交互系统模拟出真实手术过程中手术器械与虚拟组织器官的交互场景,提供给用户真实体验和沉浸感的一类虚拟现实系统。在虚拟手术系统中需要建立高度逼真的软组织器官几何模型,同时在手术中常见切割、缝合、抽吸等操作后常常伴随着出血场景,这也是虚拟手术仿真中的难点。针对虚拟手术中几何模型真实性不高和虚拟手术中血流可视化仿真不真实的
交通标志检测是智能驾驶中的关建技术,对于无人驾驶以及汽车辅助系统都有较大的研究价值。自然交通场景中汽车行驶速度快,对于检测的速度要求较高。而交通标志相对于道路上的其他物体其体积较小,检测难度大。本文对于上述交通标志检测的两个重要问题运用深度学习技术进行研究,以求能研究出能同时满足交通标志检测任务中速度与精度的模型。具体的工作内容如下:(1)针对交通标志检测难度大,精度要求高的问题,本文在精度较高的
图像语义分割是计算机视觉的研究热点,可以有效地实现对图像的高层次语义理解。根据是否对训练数据进行标注以及标注的程度,图像语义分割可以分为基于全监督学习、基于弱监督学习和基于半监督学习。其中,半监督图像语义分割因其要求对部分训练数据进行标注的灵活性和便捷性,近年来受到越来越多的关注。尽管半监督图像语义分割具有广阔的应用前景,但在现有的方法中处理光照条件不好、小尺寸目标的分割、图片中具有相同语义的多个
疲劳驾驶是造成交通事故的几大主要原因之一。针对噪声影响下疲劳驾驶识别模型性能大幅度下降,难以在实际应用中达到理想效果的问题。本文致力于解决如何在任意通道脑电信号遭受噪声影响下保持疲劳驾驶识别模型的稳定性问题,建立了基于深度卷积神经网络去噪并动态构建功能脑网络的疲劳驾驶识别框架。框架中提出了残差卷积脑电波降噪网络、以奇异值熵和分形维数为特征的动态功能脑网络构建方法和基于B样条曲线的图空间卷积功能脑网
量子计算具备快速处理数据的能力,这对经典密码体系造成了威胁。随着量子保密通信在理论基础和物理实验方面的迅速发展,学者们开始关注和研究其中的不同方向。量子信息隐藏就是其中的一个新研究方向。本文设计了两种基于混沌映射的量子水印算法并实现其量子线路。主要研究工作如下:在量子小波变换中,图像的像素可能为带符号的十进制小数而不是整数,因此本文提出了对带符号十进制小数的广义表示法来承载量子图像中的像素。基于带
【目的】为了明确人工加速老化法测定黄瓜种子活力的适宜处理时间。【方法】以3个种批的黄瓜种子为材料,在45℃、75%相对湿度下分别处理0、2、4、6、8、10、12及14 d,分析发芽率的变化,确定人工加速老化的适宜时间。以30个黄瓜品种为试验材料,分别进行标准发芽和人工加速老化试验,测定相关发芽指标。通过隶属函数和聚类分析对30个黄瓜品种的耐老化能力进行综合评价及分类。【结果】人工加速老化处理黄瓜
本文分析了乡村振兴战略背景下,农业产业发展存在的问题,针对性指出了相关的解决对策,以期为此后农业产业运行提供更多助力。
近几年,伴随着我国旅游业和教育业的高速发展,商用客车的市场需求也逐渐增大,对个性化设计要求较高的商用车生产企业,如果不能把客户的需求及时准确的转化为订单要求,产品的设计和生产周期就会延长,交货期就难以满足客户的要求。因此,研究开发一套能够快速准确描述客户需求,并将其转化为正式订单的系统,对商用车企业具有十分重要的实际意义。商用车行业的复杂性决定了对该行业信息化的复杂性,实现原型企业信息化显得尤为重
互联网飞速发展,大数据时代降临,庞大的数据资源推动了各个产业的量化进程,但同时也带来了信息过载的负面影响。推荐系统的出现正是为了解决信息时代的信息过载问题,个性化推荐技术的发展则提升了用户获取所需信息的体验。大数据时代下,数据量庞大但数据内容稀疏是推荐算法进行数据分析时遇到的经典问题,为了提升推荐性能以及用户满意度,挖掘更多用户与项目之间的联系是推荐算法研究学者的关注热点。推荐系统中,评分数据往往
Android恶意应用检测是保障用户信息安全的重要方法。为提高Android恶意应用检测的准确性,从特征选择、不平衡学习、对抗攻击三个角度进行了研究,提出了面向Android恶意应用静态检测的特征频数差异增强算法、基于不平衡学习的Android恶意应用检测方法、基于特征选择的Android恶意应用对抗样本生成和检测方法,通过实验及开发的APK检测工具和网站验证了方法有效性。主要研究工作和成果包括: