基于压缩域的视频转码与视频编辑技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yydfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字电视业务迅速而广泛的开展,对MPEG-2视频码流编辑技术的需求十分迫切。MPEG-2压缩节目的制作和编辑技术完全不同于传统的模拟电视节目的制作和编辑;与M-JPEG压缩节目的编辑相比,对MPEG-2压缩节目实现帧精度的编辑也要复杂得多。MPEG-2标准为实现高压缩比而利用了帧间的时域相关性,因此在视频编辑中对视频内容及码率的任何改变都会对后续帧产生影响,从而涉及到视频转码。MPEG-2码流视频编辑的关键技术在于视频转码器的设计、快速算法、再量化技术、码率控制及视频编辑算法等。 本文结合作者参与的上海市青年科技启明星计划“数字电视节目制作与编辑技术”(编号:01QD14030),研究了MPEG-2码流的转码与编辑技术中的一些关键问题,包括内部编码帧的转换、DCT域运动补偿及其快速算法、帧精度的无缝拼接、叠加台标、画中画等。在简单地介绍了本文的研究背景和研究目的之后,本文着重分析了视频转码器的结构、DCT域运动补偿(DCT-MC)的快速算法、编码参数再利用、码率控制与再量化,并介绍了压缩域的MPEG-2视频编辑技术,通过研究提出了如下的创新成果: 针对MPEG-2内部编码帧的转码,本文提出了基于优选再量化级的转码算法。通过分析转码时的率失真曲线,建立了优选再量化级的判断依据,并使用大量的实验来为每个量化级建立对应的优选再量化级;为确保转码中使用优选再量化级并实现有效的码率控制,本文还提出了一种针对内部编码帧的码率控制算法。实验表明:本文提出的算法所获得的PSNR性能不但明显优于其他的转码算法,而且也优于使用TM5码率控制算法直接编码所能获得的性能。 针对DCT域运动补偿问题,首先通过分析基于帧DCT的DCT-MC的不足之处,提出采用场DCT来实现DCT-MC,给出了场DCT下具有半像素的运动矢量的处理方法,通过推导出新的矩阵来减小半像素运动矢量进行DCT-MC时所需的计算复杂度。然后,通过结合图像的局部相关性和偏移块中能量的分布情况,根据参考块中DCT系数的分布特性提出了一种改进的局部带宽估计方法,通过只对位于局部带宽之内的DCT系数进行计算可减小DCT-MC的计算复杂度。最后,针对当前残差块DCT系数的分布特性,为B帧转码时的DCT-MC提出了一种快速算法,该算法利用B帧不作参考帧的特点,只有当残差块中相应位置处的DCT系数不为零时才计算预测块中有关位置处的DCT系数,该算法显著地加快B帧的转码速度,且对转码后图像质量的影响非常小。 研究了帧精度的MPEG-2码流无缝拼接技术。介绍了现有的拼接方案并分析其局限性,通过分析给出了帧精度拼接中帧类型转换方案的选取策略;为实现帧类型转换,提出了基于DCT域的帧类型转码器,并分析了帧类型转码对图像质量及编码比特数的影响。针对码流的无缝拼接提出一种码率控制算法,该码率控制算法利用已解码帧的信息计算拼接期的目标比特数,采用TM5码率控制算法来为每一帧分配目标比特数,并使用ρ域码率控制算法来保证码率控制的精确性。实验表明:拼接后码流的vbvdelay与原始码流的vbvdelay基本上做到了一致,同时将图像降质限制在有限的十几帧之内,有效地实现了MPEG-2码流的无缝拼接。 研究了MPEG-2码流中的信息插入技术。从转码器的角度出发,推导出了基于DCT域转码器的台标叠加方案;在分析了台标叠加时解码器和转码器中需要进行处理的区域的基础上,给出了快速的台标叠加方案。为了减小台标叠加对编码比特数的影响,针对DCT域台标叠加提出了一种运动矢量的修正方法。本文还给出了基于DCT域转码器的画中画实现方案,并对帧类型对齐的问题进行了探讨和分析。
其他文献
本文主要研究了智能天线应用中的多种阵列信号处理算法。首先分析了一种基于平行阵的二维方向角自动配对方法,指出了其中方法性能缺陷的理论原因。提出了改进的特征结构子空间
低信噪比条件下的红外弱小目标检测是当前的热门研究课题,国内外不少学者在这方面做了大量的研究工作,提出了不少有价值的解决办法,如多帧检测和运动轨迹检测等。但是这些算