论文部分内容阅读
随着Internet在全球范围内迅速普及,通过Internet传输多媒体尤其是视频信息的需求日益迫切。Internet带宽有限且随给定时间的流量和连接方式的不同在很大范围内变化。针对这一特性,为了有效地利用现有带宽,尽可能提高传输视频的视觉质量,本论文在MPEG-4精细可伸缩性视频编码(FGS)的基础上提出了针对运动目标的自适应选择性增强编码算法。
选择性增强是对视频序列中视觉重要区域实施增强编码,视频中运动的人或物往往是人们关注的目标。算法首先结合鲁棒的分割机制,在视频序列中准确定位运动目标。对有明显目标前景和背景之分且目标相对背景运动的视频,提出基于运动检测(MotionDetection)的目标分割算法。利用仿射运动模型估计反应背景运动(即摄像机运动)的全局运动参数,通过运动补偿分离背景与运动目标。直接采用FGS基本层编码时产生的运动矢量,经过自适应中值滤波使之更真实地反应运动信息,降低运算复杂度以适合实时编码的要求。
网上新闻播报、IP视频电话、网络视频监控等视频,背景静止且大多数时间帧与帧之间往往仅有细微的差别,通过块匹配运动矢量很难完整定位目标区域,本论文提出了一种基于变化检测(ChangDetection)的目标分割算法。利用静止区域帧差信号服从高斯分布,而运动引起的帧间差与高斯分布相差很远这一特性,通过在帧差图像中区分高斯信号与非高斯信号来分割静止的背景和运动目标。
视频序列中运动目标的有效分割提取对视频编码和计算机视觉等具有重要的意义,同时又极具挑战性。论文还提出了一种视频序列中运动目标的自动提取算法。采用时域分割和空域边缘提取相结合,确定运动目标边界,然后通过搜索-估计补充、闭合目标边界,将运动目标从背景中分离出来。实验表明,本算法对大多数类型的视频中运动目标的提取都能得到满意的结果。
将以上分割算法与FGS编码器结合,其结果用于确定选择性增强的移位因子,使FGS编码实现基于内容的选择性增强。实验结果表明本文算法能有效提高目标区域视觉效果,与不实施增强编码的情形,相比在不同的码率下目标区域PSNR值都有提高,且码率越高提高越明显。