视频压缩感知中基于深度学习的特征域多假设重构算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:z11272037
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统视频压缩编码技术建立在奈奎斯特采样定理基础上,先对信号进行高速采样,然后通过复杂编码压缩技术去除冗余信息。这种视频编码方法计算复杂度极高,很难适用编码端传感器资源受限、数据测量代价昂贵等应用场合。压缩感知技术通过开发信号的稀疏特性,突破了奈奎斯特采样定理的限制,实现了信号采样与压缩过程的合并,大大节省了采样资源成本。基于迭代优化的传统视频压缩感知重构算法虽然支持理论完备,但时间复杂度较高,难以实际应用。近年来,少量基于深度学习的视频压缩感知算法被提出,成功解决了传统算法高耗时的问题,但未充分利用帧间相关性,理论可解释性不足。本文结合传统方法与深度学习视频压缩感知重构各自的优势,完成了以下两部分工作。1.结合传统多假设重构理论,提出一种特征域多假设视频压缩感知重构网络(MHNet)。首先,采用时域可变形卷积对齐网络在特征域获得各像素的多假设预测,通过深度学习获得自适应参数,提高了假设集的匹配准确性与权重的精度,充分地挖掘了时间相关性,降低了块效应,得到高质量的预测帧;然后,构建残差重构模块实现非关键帧预测残差的重构,进一步提升重构质量;最后,针对信号的特征探究了并行与串行两种运动补偿模式,并给出了其网络实现(MHNet_par与MHNet_ser)。仿真结果表明,MHNet_ser在大多数情况下优于MHNet_par,且明显高于其它视频压缩感知重构算法。2.针对多假设问题中假设集构造与假设权重求解两个关键问题,对MHNet中多假设预测过程进行优化增强,提出增强多假设预测视频压缩感知重构算法(EMHNet)。EMHNet提出了自适应深度多假设预测模块(MH-Module)与两阶段多参考帧运动补偿模式。前者通过增加运动估计网络深度、增加自适应权值求解模块和扩大假设集容量等方法提升了网络的预测能力;后者通过合理选择参考帧,使不同运动特征序列均能构造更优假设集。仿真结果表明,EMHNet在各种实验条件下都有较好的重构性能,相比于MHNet提升了1-2d B。
其他文献
2005年起,中国光伏巨头纷纷赴美上市。但随着经济局势的转变,受美股估值低、融资难等影响,近年来各巨头企业的利润被严重压缩。与此同时,国内光伏产业强势崛起,A股光伏上市公司估值一路高涨。在这种情形下多家光伏中概股企业陆续退市。但受多种因素影响,这些退市企业一直未能正式登陆A股市场,如何重新在A股上市,仍然值得探讨。晶澳科技为光伏行业龙头企业之一,从美股退市后于2019年通过借壳上市正式登陆A股。其
作为减少温室气体排放和缓解能源紧张局势的重要途径之一,电动汽车的大规模推广将在节能减排、清洁能源、燃油替代和绿色环保等方面带来积极效应。随着经济发展和交通运输体系电气化,电动汽车需求必将日益壮大。但集群电动汽车充电行为受用户主观因素影响呈现随机无序的复杂特征,表现在配电网层面则形成具有强随机性和叠峰效应的充电负荷特性,将给城市配电系统的安全、稳定运行带来风险。因此,如何管控和优化电动汽车充电负荷是
为了实现机器人核心零部件的国产化,本文对谐波减速器的力学特性和传动精度进行了研究。建立了基于空载侧隙和周向啮合刚度的啮合力计算解析模型以及考虑误差特征的谐波减速器传动精度解析模型。论文主要内容如下:(1)对谐波减速器进行了运动学分析。基于包络理论,求解了谐波齿轮传动平面啮合问题。根据柔轮齿廓方程以及中性层的变形,求解了与公切线式双圆弧齿廓柔轮共轭的刚轮齿廓数值解以及共轭区域,利用最小二乘法对刚轮齿
随着人们对建筑舒适度的要求逐渐提高,建筑供冷消耗的能源大幅增加,为实现建筑节能,基于绿色、低碳、环保、节能的用能原则且综合考虑多种能源利用的区域供冷技术脱颖而出。为了区域供冷系统能够更大限度地体现其优越性,科学合理地进行区域供冷规划具有重要意义。由于控制性详细规划对区域供冷规划有一定程度的影响,为了更具整体性和前瞻性,本文将研究控制性详细规划指导下的区域供冷规划方法。本文首先梳理了区域能源系统和能
行人重识别是指给定一个行人的图片,在多个不同的摄像头中检索到这个行人的其他图片,可以广泛应用于社会安防等领域。随着社会的发展,日常生活中的监控摄像头与监控数据越来越多,行人重识别任务受到了越来越多的关注。在深度学习时代,大量行人重识别工作借助卷积神经网络在有监督场景下实现了令人惊艳的重识别性能。然而,有监督行人重识别需要使用大量的行人标签用于训练,这显然不适用于具有海量监控数据的现实场景。无监督行
长期以来,中国是一个典型的城乡“二元结构”国家。围绕缩小城乡差异、解决城乡“二元结构”,我国政府和学术界高度重视并做出大量的研究和实践。党的十六大提出城乡统筹,十七大提出城乡一体化,十九大提出城乡融合,从统筹城乡发展,到城乡发展一体化,再到城乡融合发展,其本质上是一脉相承的,根本目的是构建新型城乡关系,破除城乡二元体制障碍,使农村居民和城市居民享有平等的权力、均等化的公共服务、同质化的生活条件。然
室内饰品摆放是指从饰品数据库中挑选出合适的饰品并且将其以正确的姿态,大小摆放到三维场景中。目前,室内饰品的挑选,摆放等一系列工作都是由用户手动完成,但是用户从海量的饰品数据中挑选出适合特定三维场景的饰品,是非常耗费时间和精力的事情。再且,由于饰品数据的初始姿态和大小并不确定,放置到三维空间后并不一定契合当前的三维空间,需要用户手动调整,这进一步增加了室内饰品摆放的繁杂程度。另外摆放过程纯粹由手工控
基于眼睛状态识别的疲劳检测系统可以识别驾驶员的疲劳状态,并在其疲劳时进行提醒或者干预,能够减少因驾驶员疲劳驾驶车辆而引发的交通事故,有效保护驾驶员与行人。该系统的核心在于高精度、强鲁棒性的眼睛状态识别算法的设计与实现。当前影响眼睛状态识别算法精度与鲁棒性的因素主要是复杂多变的驾驶场景以及有限的眼睛状态数据集。因此,本文一方面从提高眼睛状态识别算法的场景适应能力入手,提出融合视觉基元属性的眼睛状态识
3D打印技术作为一项具有颠覆性和创造性的新兴技术,有望为食品产业的智能化和数字化提供新技术和新途径。目前相关研究仍处于初级阶段,主要集中于对墨水打印性能的优化以及材料外观的塑形。极少利用3D打印尤其是同轴3D打印的结构定制和调控能力进行食品功能材料的开发,这极大地限制了食品3D打印的发展。纤维素是广泛存在于食物及膳食纤维中的生物质,其纳米纤维因来源广泛、安全无毒、生物相容性好、可降解、强度高并具有
能源是人类社会发展的基础,社会的能源需求也与日俱增,开发绿色清洁的太阳能等可再生能源,成为了当下研究的热点问题。但是太阳能的利用方面存在一定的局限性,如能量供给与需求的时间不匹配,提高太阳能的利用率显得尤为重要。相变储热技术可以有效解决太阳能能量密度低、能量分布不均以及间歇性等问题,实现了太阳能的有效储存与利用。本文利用相变材料(PCM)与电控相变技术相结合,实现了相变储热技术在太阳能热泵热水系统