【摘 要】
:
在图像压缩,视频编码等领域,失真信息对于率失真优化起着至关重要的作用。在本文中,本文利用H.265/HEVC编码框架对图片进行压缩,并通过构建一个卷积神经网络对图片压缩过程中产生的失真信息进行预测。由于卷积神经网络具备强大的特征表达能力,而在编码参数一定的情况下,失真信息本质上依赖于图片本身的内容,所以本文可以利用卷积神经网络强大的特征表达能力对失真信息进行直接预测。在本文中,主要使用表示结构相似
论文部分内容阅读
在图像压缩,视频编码等领域,失真信息对于率失真优化起着至关重要的作用。在本文中,本文利用H.265/HEVC编码框架对图片进行压缩,并通过构建一个卷积神经网络对图片压缩过程中产生的失真信息进行预测。由于卷积神经网络具备强大的特征表达能力,而在编码参数一定的情况下,失真信息本质上依赖于图片本身的内容,所以本文可以利用卷积神经网络强大的特征表达能力对失真信息进行直接预测。在本文中,主要使用表示结构相似性的失真图(SSIM Map)来表示图像的失真信息,并构建一个可以端对端训练的网络对失真图进行预测。与传统的卷积神经网络进行预测的方式不同,本文构建的网络可以根据输入的量化参数(QP)的不同获得不同的失真预测结果,将传统的输入与输出一一对应的网络预测方式扩展为一对多的方式。通过变换输入的条件信息,在不改变输入图片的情况下获得该图片在不同QP下的失真预测结果。为了构建这种特殊的失真预测方式,本文提出了量化参数标签(QP label)作为网络的输入条件与原始未经压缩的图片共同输入网络模型中进行预测。除此之外,本文采用了对称式的网络结构以及深层浅层特征融合的方法使得网络可以同时提取到深层的语义信息以及浅层的结构信息。对称式的网络结构也使得特征融合的过程变得更加简单,因为在融合的过程中不需要进行特征图大小的变换。在相同大小的特征图之间进行特征融合避免了特征图大小变换中插值带来的信息损失,使得最终网络的预测精度更高。本文使用MSCOCO数据库进行实验,最终实验结果也验证了本文方法的有效性。通过详细的实验结果,本文证明了通过引入量化参数的标签作为网络输入条件,网络模型可以根据输入条件的不同获得不同的失真预测结果,而不需要针对每一个量化参数训练单独的失真预测模型。在精度上,本文基于多QP的失真预测模型已经超越了单QP的预测模型,充分证明了本文算法的有效性。另外,由于QP标签的加入,使得本文可以统一训练一个针对所有QP的失真预测模型,大大减轻了网络训练过程中的算力消耗。除此之外,一个统一的预测模型在实际应用中也更有优势,只需要改变网络的条件输入便可以获得不同的失真预测输出。在该网络模型的基础上,可以尝试将不同的参数作为网络的输入条件,探索这些参数对网络预测结果的影响,而不一定是采用量化参数作为网络条件的输入。通过这种方式,本文提出的网络未来可用于探索更多压缩过程中的参数对失真信息的影响。
其他文献
由于井下矿井水成分复杂,采空区内的充填体会遭受到矿井水中各种离子侵蚀,尤其是氯化物矿井水广泛分布于各个矿区,具有强渗透性的氯离子侵蚀使充填体结构逐渐劣化,继而充填体结构承载力和耐久性急剧下降,导致充填失效或局部失效。本文依托于山东省自然科学基金项目,针对采空区内充填体所处的氯盐环境,采用理论分析和室内实验方法,开展氯盐侵蚀下充填体的力学性能、损伤特征、渗透性及微观变化研究,综合分析其损伤劣化机理,
行政许可撤回为实现公共利益作出了突出贡献,但随着该行政行为的普遍应用,关于行政许可撤回的案件数量也在不断增加。研究发现《行政许可法》第八条的规定就是关于行政许可撤回的总结性规定,概括规定了撤回的适用条件,但是具体操作没有做详细要求;并且关于撤回的程序规定仍属于立法空白状态,没有具体的法定程序来强制性规范行政机关的撤回行为;关于补偿损失也仅停留在第八条的口号式规定,并且在司法实践中产生是否将间接损失
本文使用NCEP/NCAR及欧洲中心再分析资料,结合多元线性回归、合成分析、谐波分析、plumb波活动等方法,研究了西太平洋遥相关型(Western Pacific teleconnection,WP)和北大西
煤矿开采中出现的煤岩动力灾害严重威胁矿井安全生产,随着开采力度及深度的增加,灾害的发生频率大幅度提升,由于动力灾害具有突发性、瞬时性及类型复杂性等特点,给预测及辨识带来很大的困难,目前尚未有准确有效的方法应对这一难题。本文利用课题组自主研制的钻孔多参量测试装置进行实验验证,提出钻孔多参量指标监测煤体应力的方法,利用层次分析法,将钻孔参量与瓦斯突出预测指标结合,对冲击地压、煤与瓦斯突出及二者相互作用
低密度奇偶校验(low density parity check,LDPC)码的校验矩阵具有稀疏性,当采用置信传播(belief propagation,BP)译码算法时,其性能有潜力接近香农极限。然而,由于其拓扑结构(即Tanner图)中存在陷阱集,当信噪比(signal to noise ratio,SNR)达到某个门限后,部分LDPC码的误比特率(bit error rate,BER)不再随
随着信息技术和农业知识的逐步融合,对作物结构和生理功能的研究进入了数字化和视觉化阶段。先进的检测技术和现代信息计算机技术能够以视觉方式重现作物的形状和结构,从而在环境中快速获取数据信息,重建三维结构,分析、模拟和预测植物生长的动态过程和植物与植物之间的相互作用,在植物繁殖与数码植物研究方面,对作物生产过程和形态进行三维视觉方式的测量和分析是难点也是热点。对研究植物三维可视化以及植物表面特征方面有着
目的:研究新辅助化疗联合手术治疗局部晚期乳腺癌的疗效,探讨影响新辅助化疗疗效、新辅助化疗对术中及术后情况的影响和影响局部晚期乳腺癌患者预后的因素。方法:回顾性分析2007年1月至2012年1月在中国人民解放军联勤保障部队第九六七医院、大连市中山医院及普兰店中心医院收治的124例局部晚期乳腺癌患者,其中接受新辅助化疗后手术患者56例(其中Luminal A型7例、Luminal B型20例、HER-
糖基化被认为在肿瘤的恶性转化过程中起着关键作用,与癌症进程相关途径有着密切的关系。唾液酸化的改变在癌症中普遍存在,唾液酸化的产物在肿瘤进展的不同阶段介导病理生理反应。细胞内的唾液酸化是由细胞内的唾液酰基转移酶催化的生化过程。唾液酰基转移酶是一系列参与催化双糖、聚糖和糖复合物中糖链合成的酶。在恶性肿瘤中,ST6GALNAC1将唾液酸添加到丝氨酸或苏氨酸残基上的α-2,6键上,在各种类型的肿瘤中发挥重
声子晶体是一种高频散弹性材料,一般由两种或两种以上介质周期性分布构成。当弹性波在声子晶体中传播的时候,受内部周期结构作用,某些频率范围内的弹性波不能传播。声子晶体
随着科学技术的快速发展,能够获取遥感图像的光学、热红外、雷达等卫星种类日益增多,也使得遥感图像的分辨率不断提高、规格不断扩大,可以记录的地表信息也日益丰富、细节日益完善,但传统的遥感图像分类方法对于日益复杂的场景下遥感图像的处理需求已无法满足。对于某个遥感图像数据集而言,遥感图像场景分类通过对其中的各类图像特征进行深层次的语义理解,可以自动按照人类的视觉感知方式识别不同场景,如机场、森林、港口、农