【摘 要】
:
AV1是开源媒体联盟AOM在2018年推出的新一代视频编解码标准,旨在开发应用于互联网的开源、专利免费的视频编解码器。AV1作为开源媒体联盟的首个视频编解码标准,与上一代视频编解码标准H.265/HEVC以及谷歌公司的VP9相比,AV1在相同的高清视频序列和测试条件下,编码性能均得到了提高。本文主要针对AV1视频编码标准的率失真优化技术进行研究和分析,并以不同的模型和质量评价方式为基础进行改进,提
论文部分内容阅读
AV1是开源媒体联盟AOM在2018年推出的新一代视频编解码标准,旨在开发应用于互联网的开源、专利免费的视频编解码器。AV1作为开源媒体联盟的首个视频编解码标准,与上一代视频编解码标准H.265/HEVC以及谷歌公司的VP9相比,AV1在相同的高清视频序列和测试条件下,编码性能均得到了提高。本文主要针对AV1视频编码标准的率失真优化技术进行研究和分析,并以不同的模型和质量评价方式为基础进行改进,提升编码增益。本文的研究工作可以分为以下三点:(1)针对AV1的层次结构,从失真传播的角度出发,首先列出不同时域层级之间时域率失真优化问题,然后对不同时域层级的聚合失真进行估计,进而根据失真调节拉格朗日乘子完成时域率失真优化。在I帧及ARF(Alternative Reference Frame)优化层面,统计其参考利用率,提出对I帧块级QP的自适应优化。由于AV1默认采用两次编码,根据第一次编码记录的帧间信息对模型参数进行自适应调整。与AV1相比,该方法在亮度分量取得了平均2.00%的BD-Rate(PSNR)编码增益。(2)针对AV1的层次结构,从码率变化的角度出发,首先建立失真与码率变化的模型,进而将模型集成到率失真代价函数中,最终调节拉格朗日乘子完成时域率失真优化。在进行原始运动补偿误差的分析与计算时,考虑不同时域层级对应的参考帧,并进行自适应优化,同时根据第一次编码记录的帧间信息调整计算所需的阈值,最终提高编码效率。与AV1相比,该方法在亮度分量取得了平均1.50%的BD-Rate(PSNR)编码增益。(3)针对AV1在主观质量上的率失真优化问题,结合JND模型,从时域和空域的角度,分析并改进传统的JND模型,将时域缩放因子结合到模型中,以更好反映时域特性。在运动搜索方面,使用基于JND阈值的运动估计得到主观失真,并根据AV1编码结构增加对多参考帧的优化,进而调整以JND模型为基础的拉格朗日乘子,实现主观质量下的率失真优化。与AV1相比,该方法在亮度分量取得了平均1.18%的BD-Rate(SSIM)编码增益。
其他文献
视频合成孔径雷达(简称:视频SAR)是近年来快速发展的新SAR成像体制,可通过对场景中机动目标的持续监测,将观测区域的动态信息以连续图像的数据形式呈现出来,其高帧率、高分辨的成像能力实现了对场景中目标的实时成像。视频SAR成像中关键技术有高帧率、高精度成像算法与运动补偿算法等,本文对视频SAR成像过程中相关技术原理进行深入探究,论文的研究内容及主要创新点可分为以下三个方面:1.鉴于视频SAR具备高
现代微波毫米波电路正在朝着小型化,高度集成的平面电路方向发展。传统金属波导虽然具有损耗小、Q值高、功率容量大的优点,但是因为其体积庞大,难以与其它的微波毫米波电路平面集成,难以实现小型化,而且传统金属波导的加工难度大,加工成本高昂。基片集成波导(Substrate Integrated Waveguide,SIW)是一种新型的将传统矩形波导与平面传输线相结合的结构。目前已经被广泛地用于微波与毫米波
调频连续波(FMCW)雷达相比于单点频连续波雷达和脉冲雷达具有较多优点。FMCW收发前端是FMCW雷达的重要组成部分,其性能的优劣对于FMCW雷达有着重要的影响,而X波段天线尺寸小、距离及方位分辨率高,有利于近距离目标探测,因此对于X波段FMCW收发前端的研究有着十分重要的意义。本文主要介绍了一种X波段FMCW收发前端的设计与实现。首先对比分析了几种常见的频率源技术和接收机技术的优缺点,根据本课题
自适应目标检测是雷达信号处理领域的一个重要研究方向,是雷达诸多功能实现的前提。对于噪声协方差矩阵(Noise Covariance Matrix,NCM)未知的目标检测问题,通常需要训练数据对NCM进行估计。一般情况下,需要至少两倍系统自由度的训练数据样本来估计NCM才能将损失控制在3d B以内。实际应用中,由于复杂的环境地形等原因,通常难以获得足够的训练数据样本。当训练数据数量(Amount o
太赫兹SAR作为SAR成像技术的前沿研究领域,有着非常广阔的应用前景。太赫兹SAR的合成孔径时间短,在合成孔径时间内雷达载机飞行轨迹变化较小,一定条件下对成像的影响可以忽略。不过对于太赫兹SAR的研究还停留在直线轨迹或者圆周轨迹模式,曲线模式的太赫兹SAR无论从模式上还是算法上都不太成熟。基于此,本文对太赫兹曲线SAR的成像模式和算法进行了研究,在成像模式扩展、子孔径划分以及成像预处理方法等方面进
混频器的主要功能是完成频率变换,是接收系统中至关重要的电路。现今,随着毫米波固态三端口器件的发展,有源混频技术成为了混频器研究的重要方向,同时也在MMIC中得到广泛的应用。本文基于一款商用的K波段FET管,来进行基波有源混频器和谐波有源混频器的研究。首先研究了一种K波段基波有源混频器,该混频器性能良好,一定带宽内具有变频增益。然后将该款K波段FET管应用在了更高的频段,分别研究了U波段二次谐波有源
伴随着移动通信的飞速发展,相控阵技术凭借灵活快速的波束成形和波束扫描等特点愈发热门,而射频前端芯片作为相控阵中不可缺少的关键模块有着重要的研究意义。同时,CMOS工艺凭借着低成本,高集成度等优点在微波毫米波集成电路领域备受关注,因此本文基于CMOS工艺针对射频前端芯片中的幅频电路进行了深入研究。文中先是对衰减器和混频器的相关知识做了介绍与分析,包括各自模块的基本原理,性能参数以及基本结构。之后根据
超声速混合层燃烧是超燃冲压发动机燃烧室中典型的流动与燃烧形态。因此,开展三维空间发展超声速混合层燃烧直接数值模拟,认识超声速混合层燃烧中的涡结构、激波波系和火焰形态的演化以及混合效率和燃烧效率的变化规律,具有重要的学术意义和工程应用价值。主要研究工作及其结论包括:提出了超声速有反应混合层设定入口条件的相容性方法,基于耦合详细反应机理的多组分NS方程和能同时分辨涡结构与激波的五阶紧致-WENO混合格
通信信号调制识别是一种识别所接收的未知通信信号调制类别的技术,同时也是对信号下一步分析的关键基础。几年来随着人工智能技术的发展,将深度学习技术应用于通信信号调制识别已经成为了主流趋势。但深度模型的复杂度与运算量较大,难以满足复杂环境下的需求。因此,本文研究了调制信号深度模型的轻量化技术,主要成果如下:1.实现了一种以通道剪枝为基础的信号识别模型轻量化算法。该方法使用模型归一化层的缩放因子作为评价标
随着无线通信系统逐渐往多频化的方向发展,不同天线之间的布局成为决定系统尺寸的关键因素之一,多频天线的小型化设计对系统级的小型化起到至关重要的作用。而5G通信的发展,使得毫米波与微波频段天线同时被应用于收发信号,由于两者之间尺寸差异巨大,将毫米波天线集成到低频天线的结构之中成为可能,此类天线被定义为结构复用天线。由于部分低频天线表面电流分布存在较弱的区域,在相应区域内设计毫米波天线对低频天线引入可以