论文部分内容阅读
随着处理器性能的提高和视频处理技术的发展,未来的视频监控将逐渐实现高清化和智能化。然而终端监控设备由于受到计算资源的限制,往往不能满足高分辨率视频的处理要求。为此本文采用词包模型(Bag of Words Models,BoW)的思想来解决背景估计问题,设计了基于词包模型的背景建模的新方法。该方法不仅大大节省了内存的消耗,而且背景模型的精度较高。本文首先提出一种基于局部词包模型的背景建模方法。该方法通过增量K均值聚类为每个块建立独立的背景词包模型,由于聚类可以很好地对前景和背景进行分类,所以该方法取得了较好的前景提取效果。然而该方法在模型更新时会面临复杂的单词合并问题,而且和以往的算法相比并没有节省计算资源。因此本文又提出了一种基于全局词包模型的背景建模方法,在一定程度上突破了以往的研究思想。该方法事先对训练样本进行K均值聚类生成规模固定的词包,而且训练样本可以是内容无关的。然后每个块共享全局词包建立各自的背景模型,在背景估计过程中只需对全局词包进行简单的更新,无需增加新的单词。这样既减少了内存的消耗又避免了插入删除操作,并且进一步提高了背景模型的精度,非常适用于高清视频监控。通过综合实验表明,本文基于全局词包模型的背景建模方法具有内存消耗低、模型精度高、词包的通用性强等特点,还能抑制影子和亮度变化对前景提取的影响。当然该算法也有其缺点,比如在全局词包上的块匹配效率低,需要进行搜索算法的优化。