论文部分内容阅读
过去十多年来,随着Internet和无线通信网络的高速发展,数字视频的应用日趋广泛。人脸检测,它作为人脸信息处理中的一项关键技术,在基于内容的图像检索、视频监控、视频会议、可视电话以及人机交互等方面都有着重要的应用价值。面对大量涌现的视频数据,如何快速准确的找到人脸区域,就成为一个亟需解决的问题。另一方面,目前主要的视频通信网络,Internet和无线通信网都是低速不可靠网络,而常用的视频压缩编码通常依赖于基于块的混合编码技术对数据进行压缩,其压缩后的视频流,对传输错误很敏感。有效地提高编码视频抗误码力,特别是提高视频序列中所需的视频信息的抗误码力尤为重要,成为目前视频领域需要解决的关键技术之一。本文首先介绍了H.264编码技术中与本论文研究内容密切相关的主要内容,接着分析了率失真算法模型以及JM测试模型中的率失真优化方法。其次,分析了视频中的人脸检测技术,结合视频编码中的运动矢量、帧间相关性、人脸特征以及帧差等,提出一种快速准确的视频人脸检测算法。提出的算法,可有效预测视频中人脸区域位置,并对AdaBoost算法中误判和漏判的人脸区域进行了弥补。实验表明,与AdaBoost算法相比,提出的算法在提高了人脸检测准确性的同时,也节省了50%左右的人脸检测时间。最后,本文研究了有损率失真优化模型,综合分析视频传输过程中扩散失真和掩盖失真,并从像素级对端到端的视频传输失真情况进行了研究,实现了一种通用的传输失真度估算模型。结合人脸区域失真度,提出并实现了一种基于失真度的人脸区域更新算法,提出的算法能根据丢包率和传输失真度扩散情况动态的选择人脸区域更新。基于丢包的仿真实验表明,与整个人脸区域固定周期更新算法相比,提出的算法能够保证解码端的人脸重建图像具有较好的主客观质量,同时编码比特数波动小,更利于实际应用。