论文部分内容阅读
随着互联网技术的不断发展,计算机需要处理海量的数据,而在这海量的数据中,80%的信息是视觉信息,因此快速准确的处理视觉信息,完成图像或视频的分析任务是一个研究的热点。本文受人眼关注点所驱动进行视觉显著性检测算法的研究。依据人类视觉机制可知,人类在观察图像或视频时,会将注意力集中在某些人眼感兴趣的区域,而忽略相对不显著的区域。视觉显著性检测的主要任务是提取图像或视频中的显著区域,尽可能准确的模拟人眼关注区域。视觉显著性检测研究主要分为两个方向,一是显著物体检测,二是预测人眼关注点。本文的主要研究方向是建立预测人眼关注点的视觉显著性检测模型。本文基于对现有显著性检测算法的研究,提出了基于重启型随机游走模型的视频显著性检测算法,该算法首先利用SLIC超像素分割算法将视频的每一帧分割成超像素构建无向图,然后提取视频中YUV颜色空间的空域特征建立空域转移概率矩阵,提取H.264码流信息中的运动矢量用随机游走模型建立时域重启矩阵,再利用边界先验基于吸收马尔科夫链建立背景先验的重启矩阵,最后用改进的重启型随机游走模型迭代计算得到最终的显著性检测结果图。该算法在公开的SFU和CRCNS视频集上进行了仿真实验,实验结果表明,本文提出的基于重启型随机游走模型的视频显著性检测算法不仅具有较低的时间复杂度,而且有较高的检测准确度,有效的抑制了背景噪声。由于目前基于压缩域的显著性检测逐渐受到关注,本文同时提出了一种基于互信息的压缩域视频显著性检测算法,该算法首先从H.264压缩码流中提取空域特征和时域特征,利用香农互信息的基本理论分析显著性,通过计算每个宏块的中心窗和邻域窗内的特征集间的互信息确定空域显著图和时域显著图,然后自适应融合得到时空域显著图,再用基于凸包的中心先验优化时空域显著图获得最终的显著图,有效地提高了检测的准确度。同样,对算法在公开的视频集上进行仿真,实验进一步验证了算法的有效性。