目标检测中候选区域生成算法的研究与改进

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:leoki111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提取与类别无关的候选区域是计算机视觉领域众多任务都面临着的一个基础性的问题,在图像分类、目标检测、图像问答系统中都有广泛的应用。在目标检测领域,基于候选区域的神经网络可以达到当前最好结果,也成为目标检测的主流方法。候选区域生成算法是一种加速目标检测的高效方法,能够极大地提高目标检测中分类器的效率。候选区域生成算法需要在类别未知的情况下输出图像中可能存在目标的区域,可利用的先验信息非常少,是一项非常有挑战性的工作。一些方法在先前研究工作中被广泛使用。最简单的是滑动窗口方法,该方法需提取106~107个包围框,由于包围框数量太多,对包围框区域进行特征提取和分类时的计算量很大,极大影响了目标检测的效率。应用最广泛的是基于图像低层特征的方法,主要有Selective Search方法和Edge Boxes方法,虽然在包围框数量上大量减少,但是由于缺少图像高层语义信息,导致平均召回率很低。在最近基于神经网络的方法中,最有代表性的是Sharp Mask方法,使用Mask区域能够达到较高的平均召回率,但是没有考虑包围框位置优化的问题,在包围框定位方面仍有较大提升空间。本文以基于区域的卷积神经网络目标检测框架为前提,以高效的通用性候选区域生成算法为研究目的,围绕如何生成较少较为精确的与类无关的候选区域进行展开。针对初始窗口中负样本过多的问题,使用了目标性实例分割和小尺寸窗口相结合的方式,减少噪声窗口的引入;针对基于神经网络的Sharp Mask方法定位不准确的问题,使用了Attractio Net方法中的位置优化模块,在优化过程中加入了聚类分析和结合分数的动态区域搜索,进一步提高位置优化模块的定位准确性;针对后处理阶段错误包围框的筛选问题,使用了置信度衰减和加入先验知识的方法,提高候选区域对图像中目标的命中率。实验主要使用VOC和COCO数据集,实验结果验证了改进后的方法能有效地提高候选区域的平均召回率,以及目标检测的精度和效率。在平均召回率方面,相对Sharp Mask方法在不同指标上有大约7~12%的提升,相对Attractio Net方法在各种尺寸指标上有大约1~2%的提升。在Multi Path目标检测框架下,使用优化后的20个包围框可以达到优化之400前个包围框的检测精度,一定程度上提高了目标检测中分类器的效率。
其他文献
针对某移动式水泵车的举升翻转机构出现了举升油缸上铰点断裂现象,通过多刚体运动学建立举升翻转机构虚拟样机模型。并进行运动学仿真得到油缸最大拉力;以此最大拉力为边界条件
室内采用生长速率法用咪鲜胺及恶霉灵原药对水稻立枯病的优势菌尖孢镰刀菌、串珠镰刀菌和立枯丝核菌进行了毒力测定。试验结果表明:咪鲜胺的各个处理对水稻立枯病的优势菌菌丝
异银杏双黄酮(Isoginkgetin,ISG)系从银杏树叶中提取的单体化学成分.作者观察了ISG对大鼠实验性血栓及血小板血栓形成的影响.实验结果表明,异银杏双黄酮对大鼠血检形成有明显
8月28日,国家药品监管局发布《医疗器械拓展性临床试验管理规定(征求意见稿)》,其中提到允许将尚未批准上市的医疗器械提供给患有危及生命且尚无有效治疗手段的疾病的患者,这也被
报纸
模具在大型风力机复合材料叶片的生产过程中地位举足轻重.设计优化了一种新型全自动液压翻转机结构作为生产大型风力复合材料叶片过程中的必备模具,从机械、液压、电控三方面
保证最大通过能力和无故障运行的通风组织是修建公路隧道最重要的问题之一。应该指出最有效的解决办法即是把通风系统与其它服务系统首先是交通调度、信号闭塞、照明以及考
曾经以“阳光,海洋,歌声”闻名于世、洋溢着浪漫情调的那不勒斯,近年来却成了意大利最脏乱差的城市。2008年新年伊始,这里又爆发了一场震动全国的垃圾危机——数千吨垃圾堆满了大
十四世达赖自称“一生追随佛陀”“是青年人宗教上的导师”“是慈善的喇嘛”,真相果真如此吗?纵观十四世达赖叛逃祖国几十年来的言行,只要有良心的人都不难发现,他实际上就是一个
报纸
认知参照能力是人类的一种基本认知能力,仿拟修辞正体现了这种认知能力。仿拟的生成理解机制是:以本体(R)为认知参照点通过心智路径通达仿体(T)。仿拟参照可具体化为语音参照、语义
当前,我国粮油肉菜等生活必需品总体供给充裕,价格相对稳定,市场运行平稳,在通货膨胀预期仍然较强的背景下,为稳定整体价格形势作出重大贡献。但是,在农业生产成本上升背景下