【摘 要】
:
随着计算机技术、多媒体技术以及网络通讯技术的快速发展,数字图像处理的相关技术被广泛地应用于人类社会生活的各个方面。视觉是人类获取外界信息的主要途径之一。在现实场景中,受限于图像传输带宽和存储成本等影响,在传输、存储过程中往往不能将图像完整的保存下来,需要对图像进行不同程度的压缩,进而导致所获图像质量受到影响。特别地,近几年随着移动互联网的快速发展,越来越多的用户在移动设备上观看图像,受限于移动设备
论文部分内容阅读
随着计算机技术、多媒体技术以及网络通讯技术的快速发展,数字图像处理的相关技术被广泛地应用于人类社会生活的各个方面。视觉是人类获取外界信息的主要途径之一。在现实场景中,受限于图像传输带宽和存储成本等影响,在传输、存储过程中往往不能将图像完整的保存下来,需要对图像进行不同程度的压缩,进而导致所获图像质量受到影响。特别地,近几年随着移动互联网的快速发展,越来越多的用户在移动设备上观看图像,受限于移动设备的存储空间、传输带宽和观看窗口。因此,如何在保证视觉感受的同时,高效地缩小图像,同时在需要时将图像恢复到原始大小或进行其他应用是图像应用的关键性问题之一。本文基于卷积神经网络对图像缩小方法进行研究,包括结合知识蒸馏的方法和基于域适应的方法。首先,考虑到卷积神经网络良好的特征提取能力,本文提出了一种结合知识蒸馏的基于卷积神经网络的图像缩小方法。该算法首先使用逆亚像素卷积层将图像无损转化为特征,再通过一个密集残差注意力模块从像素级的浅层特征中提取出适用于图像缩小的高维特征,最后再将高维特征利用卷积层映射到低维空间中,得到小图输出。其次,为了进一步提高现有的基于卷积神经网络的图像缩小方法性能,本文采用知识蒸馏的方式,用于平衡图像缩小与图像超分辨率之间的结果。将使用双三次插值作为损失函数的模型作为教师模型,使用双线性插值作为损失函数得到的模型作为学生模型,通过知识蒸馏的方式来优化图像缩小与超分辨率性能。实验结果表明,本文提出的结合知识蒸馏的卷积神经网络图像缩小方法与现有的其他方法相比,在客观指标和主观综合评价中,都能取得更好的结果。同时将生成的图像运用到在超分辨率任务上,作为超分辨率算法模型的输入,也可以得到更先进的重建性能。进一步地,本文提出了一种基于域适应的卷积神经网络图像缩小方法。首先我们发现使用纯矢量图形作为监督信息训练得到的图像缩小网络也可以用于位图的缩小,这表明位图与矢量图在某一个特征空间中是属于同一个嵌入空间的。受到这一点的启发,该方法将矢量图与位图同时作为卷积神经网络的输入,通过减少两类图像在再生希伯特空间中的距离使网络学习如何提取矢量图与位图的共性特征,然后将该特征映射到位图所在的空间,得到最终的图像缩小结果。实验结果表明,该方法可以取得更好的图像缩小性能。
其他文献
全局光照一直是计算机图形学领域中一个热门的话题,其主要研究光线在场景中传输过程以及与物体表面的交互过程。光线传输的发展致力于在影视制作,艺术仿真,游戏制作等中带来更加真实的画面效果。在游戏制作过程中美术一般要对场景中的材质、灯光等参数进行反复调优,如此才能达到一个让人满意的画面,而我们可以通过光线传输模拟算法来渲染游戏场景的静态画面以作为参考,为美术提供一个渲染目标进行比较,这对于调试游戏场景中的
随着人工智能的大力发展,图像智能技术被普遍运用于我们日常生活和工作中,而图像智能应用是强依赖于输入的图像质量,图像去噪经过移除图像噪声能够有效地提高图像质量。本文对传统的基于非局部自相似性图像去噪算法和基于卷积神经网络去噪算法展开研究,主要的研究内容如下:(1)图像去噪算法中基于非局部自相似性的算法存在不足之处:在全局匹配相似图像块矩阵的时候并非所有的图像块都能匹配到相似图像块,对于细小纹理图像块
能从文本中自动创建一个或多个文本文档的简明摘要,该技术以最小化冗余率,且最精简的语言提炼文本信息为目标,使用户能够在巨大的信息资源中获得重点,提升阅读效率。现有的文本摘要模型可分为抽取式文本摘要模型与生成式文本摘要模型。抽取式文本摘要模型对原文中句子的重要性建模,选择能够代表原文中心含义的句子作为摘要。而生成式文本摘要模型按照原文中表述的语义,由语言生成技术自动生成文本的摘要。得益于近几年来深度学
逆光车牌图像修复是智慧交通领域中具有挑战性的研究问题之一。受太阳光反射的影响,车牌识别系统所采集到的车牌图像被光斑遮挡,造成车牌信息丢失,使得车牌识别系统的识别准确率下降。因此,逆光车牌图像修复的研究将有助于车牌识别技术的实际应用推广。与传统的计算机视觉方法相比,深度学习技术具有处理复杂模式的强大能力。目前,车牌识别系统大多是使用多设备或者通过控制拍摄条件进行多图像的采集,进而筛选出无逆光或逆光影
网络虚假评论检测研究旨在从海量互联网评论数据中识别水军发布的虚假评论,是自然语言处理领域的重点研究课题之一。现有方法主要利用文本特征和用户行为信息实现虚假评论检测,取得了较大的进展,但仍存在诸多挑战如:以往的方法在文本特征提取过程中,难以关注到文本中的关键词语义信息;现有的模型存在训练效率低且分类精度不足的问题;已有的方法未考虑水军评论的群体共性特征,导致模型性能受限。针对以上问题,本文进行了如下
随着立体电视、头戴式立体显示器等硬件技术的风靡,虚拟现实、增强现实等立体内容受到人们的广泛青睐。然而立体显示技术的普及也暴露出一些问题,很多人在长时间观看立体内容时出现眼疲劳、头痛、对焦困难、恶心等生理症状。立体内容质量欠佳是造成上述不良症状的重要原因之一,因此通过立体图像舒适度增强技术提高立体图像质量以及提高用户体验是重要的研究课题。在立体内容制作环节,使用专业的立体摄像机设备和规范的拍摄手段可
当前热点的深度隐写术可以把图像秘密信息隐藏到尺寸相同的载体图像中,具有隐写率高等特性,常被特定组织用作秘密通信。主动隐写分析术能够去除所隐藏的秘密信息,一定程度阻止深度隐写信息通过互联网进行非法或恶意传输。文档图像具有大量的文字信息,其作为深度隐写秘密信息能够在秘密通信中传递大量有效信息,具有泄漏机密信息的安全隐患,然而目前并没有相关研究专门针对文档图像作为秘密信息的深度隐写去除方法,于是本文提出
近年来,深度神经网络在图像识别领域取得了巨大的成功。然而研究发现,深度神经网络极易受到对抗样本的欺骗。攻击者仅通过在图片上添加微小的、人眼不可见的扰动,就可以让深度神经网络对该图片做出错误分类,从而达成一些非法的目的。因此,研究对抗样本防御算法对于保障深度神经网络在实际应用中的安全十分重要。针对对抗样本的防御问题,本文主要研究工作如下:(1)对抗攻击方法性能评估。首先,本文提出从对抗样本的图像质量
随着集成电路的制造工艺步入纳米时代,芯片中的元件越来越多,使得布线的难度越来越高。因此,布线已成为超大规模集成电路物理设计中最亟待解决的问题之一。通常,布线分为全局布线和详细布线两个阶段。全局布线作为布线的第一阶段,上承详细布局,下启详细布线。一个高效的全局布线算法能把拥塞信息反馈给布局器,让布局器能摆放出高可布线性的布局方案。另一方面,一个高性能的全局布线算法能有效地满足设计规范,让详细布线的负
近年来,随着移动互联网的蓬勃发展以及智能手机的快速普及,Android应用的数量飞速增长。应用内功能众多,这些功能不仅能满足应用使用者的需求,还能被进一步发布成API用于外部调用。例如,第三方应用使用微信的分享API发布朋友圈。但是将应用功能封装为API的过程较为繁琐,传统的API封装方式是针对指定的功能模块,通过代码重构发布其API,这种方式不但会增加开发者的工作量,而且难以应用于第三方应用的A