基于注意力机制的生成式对抗网络的图像增强和补全算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:bsky613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机的发展并且智能手机的方便性,越来越多的人更喜欢用手机拍摄然后用手机或电脑处理图片,而不是专业相机。但是手机拍摄的图像通常包含噪音、低对比度和微弱的色彩等问题,因此手机图像增强具有较高的研究意义。此外,有些照片包含被遮挡的区域,因此我们需要将图像补全。因此,手机图像增强和图像补全到研究者的广泛关注,具有重要的研究意义。例如,通常情况下人脸图片会有部分被遮挡,因此人脸补全在计算摄影中起着重要的作用。视频中前景和背景二者在每一帧中均是移动状态,因此视频的目标移除并补全是具有挑战性的任务。在本论文中主要解决手机图像增强,人脸补全,图像补全,视频目标移除并补全算法研究等任务。具体来说,我们的目标是在保持性能的情况下,采用轻量级的网络架构,使其具有较短的测试时间。本论文的研究范围和主要内容如下:1.对于手机图像增强任务,本文提出了一种基于CNN的轻量级图像增强的生成器,称之为多连接残差网络(MCRN),该生成器保持质量和速度之间的平衡。该网络由一个鉴别器和一个生成器组成。生成器是一个两级的网络:1)第一级提取结构特征;2)第二级重点提高感知视觉质量。同时采用多连接方式,在保证网络快速收敛的同时,获得了较好的图像增强效果。实验结果表明,该方法在感知质量和运行时间方面均优于现有方法。2.人脸补全是一项具有挑战性的研究内容,因为人脸关键部件如眼睛和鼻子通常是被遮挡的区域。本文提出了一个简单有效的人脸补全方法。首先构建了一个端到端的多层级生成网络,因为可以减少训练时间的同时获得不同层级的特征图。采用多尺度特征映射有助于生成具有真实感纹理的自然人脸。对于优化网络的参数,我们使用了两种损失函数:内容和纹理。前者包括平均绝对误差(MAE)和多尺度结构相似性(MS-SSIM)损失函数,以尽量减少内容失真;后者包括风格和对抗性损失函数,以便于纹理合成。然后为了优化以上提出的人脸图像生成网络,我们采用了基于多级注意力机制的生成结构。多层特征处理不仅减少了训练/测试时间,而且还可以保持性能再每个卷积层的通道数减少的情况下。之后我们将注意力机制和多级特征处理结合起来,以建立每一个像素点与周围内容的软相关性。对于网络优化,我们使用两种损失函数:内容和纹理。与前一种方法的损失函数不同,这里内容损失包括平均绝对误差(MAE)和边缘保持损失函数,目的是产生接近真实的修补结果,而纹理损失包括对抗性损失和感知性损失函数,用来微调纹理的合成。此外,我们利用边缘保持损函数获取边缘和周围图像的相似性。实验结果表明,该方法不仅能在随机遮挡上生成真实的结果,而且在客观评价和主观评价方面也优于现有方法。3.对于图像补全任务,本文提出基于扩张卷积和通道注意力机制的特征对比度增强的轻量级生成网络。我们采用扩展卷积来扩张感受野,在卷积核具有相同参数数量的情况下。同时,我们利用通道注意力机制来自适应特征对比度的权值。损失函数上采用,对称平均绝对百分误差(SMAPE)和颜色增强损失函数,它们分别使得生成的图像具有高质量和自然色彩,这里是用SMAPE代替重建损失函数。同时该生成网络的参数只有4.5M。实验结果表明,该方法在视觉质量、定量测量和运行时间等方面均优于现有方法。4.视频补全需要保持时间帧在信息和内容上的连贯性,因此视频补全在计算机视觉中是一项具有挑战性的任务。视频补全的目的是合成更真实的内容,并保持视频中被遮挡的区域生成内容的帧之间连续性。在这项工作中,首先,我们利用实例分割作为遮挡部分。然后,为了充分利用空间和时间信息,提出了一个简单而有效的生成结构来进行视频补全。首先,在帧融合中提出了时域匹配模块,充分利用了时间帧。在此基础上,我们提出了扩张多尺度(Dli MC)模块来重用特征图以充分利用空间信息,它由扩张卷积,两个尺度收集特征图的不同的信息,由残差结构组成。上述模块减少了测试时间和生成模型的参数。同时为了优化模型,提出了遮挡对抗损失函数,该损失函数用于微调纹理改善生成区域的细节。实验结果表明,与其它方法相比,该方法在视觉质量和主观测评方面是有效的。
其他文献
爱国主义题材电影是一种特殊而有效的教育载体,与传统的教育模式相比,具有“潜移默化”的隐性教育特征,是开展大学生国家认同教育的有效途径。而近年来随着时代的发展,爱国主义题材电影的内容和形式相对于以前都发生了很大的变化,这些变化越来越多的影响到大学生的思想和行为,成为高校对学生进行爱国主义教育的必要力量,优秀的爱国主义题材电影会对大学生国家认同产生积极的影响。如何加强爱国主义题材电影对大学生国家认同的
近年来随着多旋翼无人机数量的增多,其引发的安全问题愈发不容忽视。多旋翼无人机具有低空、慢速、小型化的特性,传统基于能量的信号处理手段难以对其进行精准检测。无人机旋翼的旋转会对雷达回波产生调制,形成微多普勒信号,可通过分析这种微多普勒信号,获取旋翼参数信息,从而实现对多旋翼无人机的检测。本文研究多旋翼无人机的微多普勒信号处理算法,主要包括微多普勒信号的降噪、高时频分辨率表示算法和旋翼参数估计算法,并
近年来,随着国家产业结构调整的不断深入,商业银行经营环境发生了巨大变化。行业领域内利率市场化政策的实施,行业领域外互联网金融机构的强势进入,都给商业银行经营带来了挑战。在国内中小城市,随着各中小型商业银行的入驻,打破了原有国有商业银行在本地垄断地位,本地银行业竞争开始加剧。在此背景下,寻找适合中小城市国有商业银行发展的营销策略,已成为当务之急。本文选取工商银行X支行作为研究对象,从基层支行角度出发
对于中学物理教师而言,如何培养学生的科学探究能力,在教学中培养和提升学生的科学探究能力,是一项重要的课题。初中生物理科学探究能力的培养是实现学生科学探究能力的重要手段,物理教师要肩负起对于中学生科学探究能力培养的重要职责。进行了文献调查法、问卷调查法、访谈法、数理分析法的调查,对国内外研究现状进行了研究,并对相关概念进行了界定。报告了目前初中生物理实验课堂不容乐观的现状。而初中生物理科学探究能力培
互联网行业兴起一种名为增长黑客的用户增长模型,通过建立转化漏斗模型来量化产品生命周期的五个环节,这五个环节分别是获取用户、激发活跃、提高留存、增加收入和推广传播。产品的运营策略都是围绕这五个阶段,最终目标是驱动用户增长,形成增长闭环。本文研究的问题是如何将转化漏斗模型的各个阶段通过量化的方式展现出来,让产品运营者了解制定的运营策略对转化漏斗模型的影响,从而调整运营策略进行优化。为了解决这个问题,本
近年来,我国综合国力不断加强,产业结构不断优化,对外开放的力度也不断加大,经济从高速发展转到中高速发展。同时,随着澜湄合作机制的稳步推进,将进一步深化澜湄区域经贸合作,扩大跨境经济合作规模,进而带动整个澜湄区域经济走廊建设。澜湄合作机制成立至今,取得了较大成效的同时,还存在货车不直通、物流成本高、运输效率低、基础设施设备落后、通关便利化水平低、信息化水平低等方面的问题。在这样情况下,在澜湄合作区域
随着知识经济时代的到来,科技创新已逐步上升到国家战略层面,成为全球社会经济发展的重要动力。以信息技术为标志的第三次科技革命推动了产学研合作创新的飞速发展,使产学研合作在全球高新技术日新月异的环境下,成为推动经济和整个社会发展的一种最强动力。产学研合作通过优化社会资源配置,促进科技与经济的进一步融合。在政府的大力支持和引导下,我国的产学研合作也在稳步的发展,并在经济发达地区取得了很好的成效,提高了我
随着我国经济社会的发展,电力体制改革不断推进,把电力经营全面推向市场经济成为电力行业发展的主要趋势,打破传统的电力经营模式,进一步提高电力市场效率已成为整个电力行业的共同诉求,YN集团售电公司也顺应趋势进行电力市场化改革。但是,当前市场化电量比重越来越高,电力市场竞争白热化,YN集团售电公司在产品、价格、渠道、促销等营销策略方面面临挑战。因此,如何顺应市场需求,不断创新电力企业电力销售的营销策略,
自组装技术一直以来都受到人们的关注,该技术广泛应用于光子晶体等周期结构的制备。通常球形胶体颗粒的自组装方法较为成熟,且可以得到较大面积的有序结构;而对于形状稍复杂棒状胶体颗粒,通过自组装法制备取向一致的棒的阵列结构仍有很大的挑战。由形状各向异性的棒构成的阵列有望应用在超材料等光学领域,比如通过对光的调控提高光吸收效率,进而提高其光催化性能。目前交变电场已被成功应用于胶体棒有序阵列的构建,原有的电场
近年来,生产安全事故频繁发生,每次事故也必然会导致一定的生命财产损失,因此生产安全问题一直都是不可忽视的难题。研究发现,人为过失往往是造成生产安全事故发生的重要原因之一,而传统的监控视频无法实现对导致事故的危险行为及时识别并提醒制止。本文旨在通过人体行为识别技术来研究制造业生产过程中的安全管理问题,利用智能监控系统对危险行为进行实时识别并及时提醒制止,以降低生产安全事故的发生率。本文以昆明理工大学