基于生成对抗网络的图像压缩算法的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:aaron209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,图像分享已经成为了互联网社交的主要渠道之一,例如,微博的日活用户达到了1.84亿,每天有超过1亿张照片通过微博进行上传和交换。而图片所需要的储存空间也随着手机等拍照设备的像素越来越大在快速增加。因此,图像压缩对于确保整个互联网的低成本存储和共享起着至关重要的作用。要尽量减少存储空间则需要大幅度降低编码比特率,然而传统的工程化的压缩算法在低码率下视觉效果不尽人意,出现模糊,块状甚至缺色。目前深度学习已经在处理目标检测、跟踪、分类等方向取得了很好的效果,有的甚至已经超过了传统的方法,然而在图像压缩方向,深度学习相关技术还没有被充分利用研究。2014年由Goodfellow等人提出的生成对抗网络由于其良好的拓展性和巧妙的弱监督学习模式,在图像生成、超分辨率等方面给我们带来了全新的思路。本文将利用深度学习和对抗生成网络在图像处理、图像生成方面的优点,对低码率(低于1bpp)甚至超低码率(低于0.1bpp)下图像的压缩质量的提升展开深入研究。首先,本文设计了基于卷积神经网络的包含编码端和解码端的自编码器。在编码端,原始图像通过卷积层逐步降低图像的空间尺度,得到图像特征,再通过量化器减少图像中的信息冗余,形成用于传输的比特流,达到图像压缩的目的;在解码端,将比特流重新编码,通过卷积层逐步将尺度恢复和纹理生成,最终重建出图像。在此基础上,本文还设计了一种多尺度“先验”机制,通过级联网络从粗到细地进行重建,每个尺度产生的压缩表示的熵作为“先验”加入到率失真目标函数中,来提升率失真性能。实验表明了多尺度“先验”机制的效果,而且在低码率下,我们的方法不仅超过了一些主流的基于深度学习的图像压缩算法,也超越了传统的图像压缩方法。然后本文针对超低码率下图像模糊,纹理过度平滑,主观视觉效果不佳且客观评价指标完全失效的情况,提出了引入基于对抗生成网络的对抗性损失函数和一种更接近于感知相似度的损失函数来做“率-失真”优化。模型架构上,在承接我们提出的多尺度自编码器的基础上,我们加入了多尺度鉴别器来进行端到端的训练。实验表明在超低码率下,我们的方法重建的图像在主观质量上明显好于目前公认的性能最佳的传统图像压缩方法得到的重建图像。
其他文献
气水两相流广泛的存在于工业应用领域中,其流动传热能力的实验研究对于能源的高效利用具有重大意义。然而,气水两相流复杂的流动特性和多变的相界面分布极大的增加了其探测的
本文通过分析我国国有企业集团股权管理工作的现状及今后的发展趋势,阐述了股权管理工作在企业发展中的重要地位,指出了当前股权管理工作中存在的一般问题与难点,有针对性的提出
当前我国经济实力在不断地增长,而经济的增长使得企业在市场当中的竞争也变得更激烈,国有企业要想为日后长远的发展打下坚实的基础,就必须不断地与时俱进,根据时代发展不断地
高速公路作为现代综合交通运输网络中的重要组成部分,在国民经济发展中发挥的作用越来越重要,本文对高速公路建设管理控制中存在的问题进行分析,并就改进措施谈点个人浅见,仅供参
<正> 农村机械维修行业,具有为农机自身服务和为社会服务的双重功能。从整个社会产业角度看,属于社会产业系统的第三产业;从农机服务产业化角度看,它是该产业链中的重要一环
精细化管理是近年来备受企业推崇的管理模式,它通过将管理工作做细、做精,达到全面提高企业管理水平和工作质量的目的。随着时代的发展和进步,新时期公安消防部队管理需要在实践
随着经济和综合国力的不断提升,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,旅游正是人民对美好生活需要的重要方面。在中国旅游
<正> 河南省洛阳四达农机有限公司的前身是孟津县四达农机厂,是一个民营小企业,近几年经过不断探索、创新,公司得到了长足的发展,2003年产值达800多万元,实现利税40多万元。