论文部分内容阅读
多媒体通信将是新一代通信系统的典型业务和显著特征,视频编码技术则是多媒体技术的基础和核心。本课题以华为科技基金项目——AVS视频技术提案和下一代视频编码技术研究、和国家音视频标准化工作组(Audio Video Coding Standard Workgroup of China, AVS)面向高清的音视频编码标准为课题背景,研究新型视频编解码技术,在保持视频主观质量不变的前提下,提高压缩效率。在过去二十年中,为了达到更好的存储和传输效果,混合视频编解码技术成功的在提升视频质量的同时降低码率。现有主流视频压缩标准均采用混合编码框架,在此框架下研究降低空域和时域冗余的编解码技术。如今在此框架下少许的编码性能提升往往以很大的复杂度增加为代价,因而很难继续提升编码效率。而如今视觉信息的信息量越来越大,而现有带宽以及传输能力有限,同时存在外界环境的影响,因而对于视频编码研究领域来说,在统计分析的同时,结合人眼的主观视觉特性,提出基于纹理分割的视频编码技术是一个前途光明且有挑战性的研究方向。本课题将研究结合人眼主观视觉的视频编解码技术,提出并实现一种基于纹理分割的新型低码率编解码算法。本文首先在AVS视频编码框架的基础上实现了基于颜色空间的视频纹理分割算法,通过转换视频序列的颜色空间,统计宏块的方向信息和颜色信息,并对方向信息和颜色信息直方图按几何平均值准则进行比较,通过相似性判定,划分出颜色相似的纹理区域。随后根据上述方法不足之处,改进基于颜色空间的视频纹理分割算法,首先改变最小判定单元的大小,不仅能够更加符合现有标准,同时能够增加准确性;其次针对统计宏块方向信息和颜色信息算法存在的问题,设计高效的统计方法;最后引入高效的EMD-L1算法,以更加合理和正确的判断准则,增加相邻块间直方图相似性判定的准确度,能够对纹理区域划分的更为精确。然后本文提出基于Mean Shift的纹理分割算法,在原始视频序列进入视频编码框架之前,引入Mean Shift算子,对视频序列每帧图像的每个像素点进行梯度计算,找到其收敛的最大模式点,对原始视频序列每帧图像的像素点进行聚类,在聚类的基础上对大面积聚类像素点集中区域进行纹理划分,该算法不仅能够保证图像的重要信息,同时也能最大程度的划分出纹理区域。最后本文分析了完整的系统实现以及系统结构,包含编码端的纹理分割以及解码端的纹理合成,同时涉及到辅助信息的提取。然后设计了一种对现有标准的语法改动最简便的方案,并且分析了整个算法的复杂度。实验结果表明,上述两种方案均能有效的划分出纹理区域,基于颜色空间的视频纹理分割算法对于简单平缓的纹理具有较好的分割效果,而基于Mean Shift的纹理分割算法则对于复杂纹理有较好的适应能力。