图像中目标精细检索关键技术研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:xiaolan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像采集设备的普及和移动互联网的飞速发展,图像数量呈现爆炸式增长,如何快速准确的在海量的图像数据中进行目标检索,是近年来计算机视觉领域的一个研究热点,具有十分重要的学术意义和应用价值。而随着用户对于检索要求的不断提高,目标精细检索系统也开始进入人们的视野。通常来说,目标精细检索系统可以从两方面进行定义:(1)能够生成更加精细的图像标注信息。更精细的标注包括物体区域的像素级标注(分割信息),以及物体部位的标注信息。这些精细的标注信息允许检索系统返回更加精细的检索结果:(2)能够理解用户更加精细的检索意图描述。例如用户以手绘草图作为检索输入,该草图描述着检索目标的形状细节、姿态、角度等信息。对精细检索意图的理解允许检索系统返回和用户输入高度匹配的目标。总的来说,相比于传统的目标检索系统,目标精细检索系统能够返回更加符合用户需求的检索结果,避免用户对检索结果进行二次处理和筛选,满足用户精细化的检索需求,大大提高目标检索的效率,具有非常重要的意义。本文的工作以目标精细检索为目标,从以上两个方面入手进行研究,取得了以下成果:(1)针对目标标注中的目标多样性和像素级标注问题,本文提出了一种基于超像素(superpixel)和改进与或图(AND/OR Graph)模型的目标标注方法。目标物体在外观、姿态上的多样性,会显著降低目标标注的性能,增加像素级标注的难度。针对这个问题,本文将目标物体定义为一系列部位的组合,提出一种改进的与或图模型来组织部位之间的关系,以提高对于外观和姿态变化的鲁棒性,并利用基于图模型的快速推理算法实现对物体部位的最优选择。在生成候选部位集合的过程中,考虑到像素级标注的要求,本文以超像素区域的轮廓形状作为特征,基于模板库来实现候选物体部位集合的生成。超像素和改进与或图模型的结合,使得本文的方法对于目标多样性具有较好的鲁棒性,并且能够实现目标的像素级标注。在多个公共数据库上的实验结果证明了本文的方法能够有效的应对目标多样性问题,实现目标区域的精细(像素级)标注。(2)针对目标部位标注中的鲁棒性问题,本文提出了一种基于轮廓预测及增强的目标部位标注方法。相较于目标整体,目标部位具有形变较小的优点,但同时也具有有效特征少,易受噪声干扰的问题。基于这些特点,本文通过增强物体部位的轮廓边缘来提高目标部位标注对于噪声干扰的鲁棒性。本文利用学习算法从正样本集中自动的学习一组典型的轮廓边缘模式(edge patterns)。基于学习得到的轮廓模式,本文提出一种“轮廓预测-增强”策略对输入图像进行过滤,预测图像中可能存在的物体部位轮廓边缘,根据预测结果在增强物体部位轮廓边缘的同时抑制噪声边缘,以达到提高部位标注鲁棒性的目的。INRIA和TUD数据库上的实验结果表明了本文的方法的确有效的提高了目标部位标注的鲁棒性。(3)针对手绘草图检索中的噪声问题,本文提出了一种轮廓边缘选择算法。由于自然图像中存在的大量噪声,手绘草图和自然图像之间存在巨大的视觉差异。如何有效的降低噪声边缘的影响,是提高检索系统性能的一个关键点。本文将手绘目标图像和边缘图像(自然图像经边缘检测生成)视为一系列线段的组合,提出了一个HLR (histogram of line relationship)描述子通过描述线段之间的关系来描述物体形状。因为边缘图像中包含大量的噪声边缘,如物体细节边缘和背景边缘,基于HLR描述子,本文对边缘进行选择,保留物体轮廓边缘,忽略噪声边缘。该算法为每一个HLR描述子生成大量假设,每种假设对应一种边缘选择的结果,最终将边缘选择问题转化为一个寻找最佳假设组合的最优化问题。相应的,本文提出一个快速算法来求解这个最优化问题。实验表明,HLR描述子和边缘选择算法都有效的提高了检索性能,增强了检索系统对于噪声的鲁棒性。(4)针对手绘草图中的边缘不稳定问题,本文提出了一种最优局部匹配算法。自然图像经过边缘提取不仅会生成噪声边缘,也会造成轮廓边缘丢失,即边缘不稳定问题。这个问题增加了手绘目标图像和自然图像之间的匹配困难。噪声边缘的存在使得边缘图像(自然图像经边缘检测生成)成为手绘草图的一个超集,而轮廓边缘丢失使得边缘图像成为手绘草图的一个子集。于是,本文将手绘图像和自然图像之间的匹配问题归纳为一个最优局部匹配问题,提出了一个全新的SP (structure point)描述子和层次匹配算法来解决这个问题。SP描述子通过描述线段间的交点来描述物体的局部结构信息。层次匹配算法将SP描述子层次的分解为描述子集合,通过自顶向下的匹配方式来实现SP之间的最优局部匹配。在多个数据库上的实验结果证明了SP描述子和层次匹配算法对于边缘不稳定现象的有效性。
其他文献
随着社会的不断发展与进步,公路事业也得到了极大的发展。公路施工技术与以往相比有了很大的提高,公路施工的总体质量越来越高。尽管如此,在公路施工中仍有一个十分严重的问题影
目的研究应用整形外科缝合技术修复面部外伤的方法,并观察其临床效果。方法本文选取了2017年6月至2018年6月在我院治疗记录的80例面部外伤患者为研究对象,并随机分为对照组和
永磁同步发电机(PMSG)与PWM整流器构成的永磁可控发电系统在新能源发电和电力驱动领域应用日益广泛,但与直接并网运行发电机相比,定子电流含有大量高次谐波分量。本文建立了SPW
机关文书档案管理是办公室一项最经常、最基础性的工作,涉及档案收集、整理、立卷、归档、利用以及销毁等衔接有序的过程。针对机关文书档案管理特点,结合现状分析,从中查找问题
这种新型淀粉酶制剂可以改善面包和馒头制品的柔软度及弹性,延长货架期。该淀粉酶是特别为延缓焙烤制品的老化而开发的。通过作用于支链淀粉的的侧链,支链淀粉的回生将减少,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
对烘烤型水性阻尼涂料的外观控制及影响烘烤外观的因素,如乳液、填料和微球发泡剂的选择进行了研究,结果表明,当烘烤固化条件为140℃/30min,乳液含量为30%~40%,填料粒径为100
本试验旨在研究饲粮添加胆碱与裂殖壶菌油(Schizochytrium oil,SO)对鸡蛋卵黄脂质及二十二碳六烯酸(DHA)富集的影响。选取26周龄京红蛋鸡288只,分4组(每组6个重复,每重复12只鸡)。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
当前,以互联网、大数据、云计算为代表的新一代信息技术革命正席卷全球。顺应这一科技发展趋势,我国的信息化发展水平大大提高。中国互联网络信息中心(CNNIC)发布的《国家信息化
报纸