面向目标检测的视觉注意模型研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:crystal19900224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域中,构造视觉注意模型提取图像的显著图是近年的一个研究热点。然而,由于现实中图像前景和背景千变万化,而且交织在一起,错综复杂,想要准确地提取图像的显著区域极具挑战。近年来,随着显著性检测技术的不断发展,使得人们能够在目标检测过程中,选择图像中“有用”的数据进行计算,这不仅降低了计算复杂度与内存开销,而且由于剔除了冗余信息,也提高了检测的准确性。因此,研究如何利用这些选择后的数据进行目标检测变得十分有意义。本文首先提出了一种基于背景知识学习的视觉注意模型。该模型在提取显著图时主要包含两个步骤,第一步是计算图像中超像素的权重值,第二步则是利用局部加权对比度来计算超像素的显著值。针对这两个步骤,本文首先提出了一种超像素加权模型框架,该框架包括超像素块提取、形状与颜色特征提取和权重值预测三个部分。在此基础上,本文提出了一种基于局部加权对比度的显著值计算方法,该方法以超像素为计算单元,计算每个超像素块与其他超像素块在颜色和空间信息上的差异,并将该差异值作为显著值。实验结果表明,本文提出的基于背景知识学习的视觉注意模型能够有效地提高检测精度,与已有模型相比,本文模型在MSRA1000和ECSSD两个公共数据集上检测得到的显著图具有更高的分辨率和平均精度,目标区域内的显著值分布更加均匀,前景与背景边界更加明显。本文还提出了一种基于参数学习的目标检测算法。该方法首先利用本文提出的视觉注意模型提取图像的显著图,然后在显著图的基础上构造窗口质量函数,并建立基于贝叶斯概率模型的最优化问题来确定窗口质量函数的最优参数,最后,利用动态规划算法来计算窗口质量函数的极值点,该极值点的坐标即为目标窗口的位置。相比于文献[1]提出的目标检测模型,本文提出的目标检测算法在MSRA1000和ECSSD两个公共数据集上的检测结果具有更高的精度。同时,检测结果表明本文提出的视觉注意模型与文献[2]提出的模型相比,在目标检测方面具有更大的优势。
其他文献
在模式识别领域,不同的分类器可以得到不同的分类性能,但没有一种分类器能对所有应用都取得好的结果。为了提高单一分类器的识别性能,多分类器融合系统在模式识别领域得到了
本文主要介绍了40Gbps长距离光收发合一模块的研究和实现。其研究和实现的目的是解决网络对带宽和速度的需求。   文章大致分为两个部分,第一部分侧重介绍了对40Gbps长距离
光纤布拉格光栅(Fiber Bragg Grating,简称:FBG)传感器已成为目前国内外光纤传感领域研究的热点,它属于波长调制型传感器。与强度和相位调制型等其他类型光纤传感器相比,具有
近年来,现代海洋高新技术蓬勃发展,水下机器视觉的研究和应用也在迅速进步。然而,由于水下光学环境的复杂多变,水下图像往往伴随着光线模糊、颜色失真以及噪声干扰等问题。如
射频识别(Radio Frequency Identification,RFID),又称电子标签(E-Tag),是一种利用射频信号自动识别目标对象并获取相关信息的技术。在飞速发展的信息技术时代,RFID广泛应用