基于目标检测的单样本图例检测方法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:amincrazy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有常见的目标检测算法仅针对一般场景具有较好的检测性能,然而不适用于一些特定的复杂场景,例如施工图图例检测。施工图场景下的目标检测会存在如下问题:1)图例检测是一个典型的单样本学习(one-shot learning)问题,样本极少;2)需要具备高准确率和一定的实时性;3)不同施工图的图例种类不同,无法统一;4)需要自动化地完成图例提取、样本制作和模型训练;这些问题给图例检测带来了极大的挑战,如何从复杂场景中实现图例的识别与检测则成为更加重要和困难的问题。本文主要针对施工图场景下的目标检测算法展开研究,提出一种基于孪生卷积网络结构的Siamese SSD目标检测框架(Siamese Neural Networks with SSD,简称Siamese SSD),来解决单样本学习问题。Siamese SSD目标检测框架的主要创新点如下:1)提出了Siamese特征提取网络,通过孪生网络结构提取检测图和模板图的特征图,然后使用互相关(cross-correlation)操作进行特征图融合。通过图像配对技术输出检测图和模板图,解决单样本问题。2)改进了SSD目标检测框架。图例相对于施工图很小,本文改进了多尺度特征图大小和锚点框(anchor)数量,并改进锚点框尺寸(scale)从而在加快速度的同时大幅度提高图例的检测准确率和检出率。3)目标预检测网络。使用Adaboost结合haar特征来预先筛选可能有图例的区域。由于图例具有尺度不变性、简单结构等特征,Adaboost-haar方法可以具有很高的检出率。借助该方法,可以大幅缩小检测范围。4)自动化样本提取。使用目标检测、文字识别、文字切割等技术可以自动化地完成图例区域定位、图例提取、样本制作等操作,利于实用。本文通过两组数据集来检验Siamese SSD目标检测框架的性能。首先,比较了Faster R-CNN、YOLO、SSD、R-FCN和Siamese SSD在PASCAL VOC数据集上的性能,包括准确率和检测速度。其次,比较了Faster R-CNN,YOLO,Adaboost和Siamese SSD在施工图数据集上的性能,包括精确率、检测速度、迭代次数与错误率的关系等。同时实验验证对SSD的改进的有效性。两种实验结果均表明,本文提出的Siamese SSD算法能够较好地解决单样本学习、小目标检测、大分辨率图像等问题,目标检测准确度较其他算法有明显提升、有效地提高了图例的检测精度,是一种新型实用的单次目标检测方法。
其他文献
随着无线网络技术的迅猛发展,以及我国将物联网作为战略性新兴产业上升为国家发展重点,工作在ISM频段的无线网络设备数量呈指数型增长。这推动着单一网络环境向异构网络环境不断演进。在这一过程中,对于异构网络中不同设备之间相互通讯的需求不断增加。然而,传统的数据分发方案受限于单个节点的通讯范围和不同网络设备之间冲突等诸多方面的影响导致数据分发的效率不断降低,同时也不适用于异构网络所特有的网络模式。针对这些
学位
链路预测有助于人们高效地从复杂网络中挖掘出丢失数据、新生数据以及虚假数据。基于网络拓扑结构相似性的链路预测算法是链路预测的热点研究方向,但是该类算法目前仍存在预测精度不够高的问题,主要原因是该类算法忽略了实际网络存在演化特性和算法自身不具备网络自适应预测能力,于是本论文提出了基于未来共同邻居的相似性链路预测模型。因此本论文的创新点和主要工作如下:1.通过分析现实网络连边形成的机制和网络的动态演变过
学位
大多数复杂疾病都与基因相互关联,寻找与疾病相关的易感基因是分析和了解相关疾病可能发病的机理、设计相关疾病的易感基因诊断方法的重要理论基础。全基因组关联研究(Genome-Wide Association Study,GWAS)是一种系统性地搜寻与人类相关疾病易感遗传基因的生命科学研究方法。该方法通过对于人体的全部的基因组的关联分析,可以全面地揭示与疾病的发生、发展与其治疗密切相关的易感基因。传统的
学位
基于视频的人体行为识别是计算机视觉领域的重要研究方向之一,能够应用于智能监控、人机交互、视频内容检索等众多领域中,具有非常广泛的应用前景。在互联网技术快速发展的今天,网络视频数量呈现爆发式增长的趋势,对视频数据处理的效率与质量提出了更高的要求。由于人体行为在时间上的连续性以及动作的复杂性等问题,如何高效准确地从视频中提取人体行为的特征仍面临巨大的挑战。近年来,深度学习技术在图像分类、目标检测等任务
学位
去中心化是区块链技术的核心价值,该特性保证了区块链系统的安全性,但也为其数据管理带来了众多问题,如数据存储完整性、隐私泄露和存储性能差等。该类问题导致区块链应用在设计开发过程中代码量骤增或冗余,以至于开发效率降低。设计模式是软件开发过程中一般问题的解决方案,它的引入可以为解决区块链数据管理相关问题提供便捷的途径,对其进行服务封装更可以提高应用开发效率。论文对基于区块链的数据管理设计模式与服务进行了
学位
手绘图像检索是一种通过手绘图像检索自然图像的检索技术。允许用户通过线条随心所欲地描绘头脑中想要表达的事物以作为检索输入,这是手绘图像检索最为主要的优势之一,然而手绘图像绘制过程中的主观性会带来语义模糊问题,这同样给手绘检索带来了挑战。手绘图像缺少颜色、纹理等细节信息,一般仅包含物体轮廓,因此通过整体视角进行观察,对于手绘图像语义理解至关重要。然而,本文通过调研发现,手绘图像的整体性在现有工作中并未
学位
手绘图像作为一种新型的视觉表达方式,能够高效,灵活地描述物体的外观和结构。然而在手绘图像检索领域(Sketch Based Image Retrieval,简称SBIR)中,手绘图像则存在特征稀疏,易于形变等问题。手绘图像由一系列简单的线条构成,是一种高度稀疏的表达方式,因此传统图像检索的方法无法对手绘图像中的内容进行有效地描述;另外不同的人群绘画出的手绘草图在外形上也具有较大的差异性,这导致手绘
学位
国内大部分油田处于勘探开发中后期,易于发现的油田越来越少,探明储量以隐蔽性油藏为主,但隐蔽性油藏难以发现。有利区预测是勘探开发过程中非常关键的一步,但传统有利区预测受限于现有的理论和方法,在地质条件复杂、地震属性种类多、地震属性相关性差的情况下,地震属性与有利区类别之间的对应关系难以确定,容易产生预测过程中的多解性问题,且地质勘探人员一般仅采用2-3种常规地震属性进行预测,忽略了其它未使用地震属性
学位
石油作为我国重要能源之一,被广泛应用在交通工业、建材工业、化工工业等各大领域中,因此石油的高效开采对我国来说是非常重要的。由于我国大部分油田都属于高含蜡油田,在开采等过程中存在着结蜡现象。该现象使得油井直径变小、油杆负载变大,进而导致石油的开采效率降低、成本增加,更为严重时,导致油井停止生产等故障,降低经济效益。由此看来,如何有效的预测油井结蜡对石油高效开采具有重要研究意义和应用价值。本文采用随机
学位
近几年来,图像描述逐渐成为人工智能领域内一个新的研究热点。图像描述任务是连接计算机视觉领域与自然语言处理领域的一项基础任务,其目标是使计算机能够自动生成能够准确描述输入图像内容的自然语言语句。图像描述任务需要利用计算机视觉中的相关技术以及自然语言处理中的相关技术。图像描述任务将图像内容转换为描述图像内容的自然语言文本,可以加深对图像内容的理解。虽然编码器-解码器结构在图像描述任务中取得了广泛的应用
学位