基于生成对抗网络的图像生成方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:charles8025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的根本作用在于保存、交流信息,作为人类视觉感官的基础,如何快速生产利用图像,一直是人们在逐渐进步的方向。随着计算机的普及,数字图像生成的方法到目前为止基本可以分为两大类,一类是传统数字图像技术,在场景构建或风格转换任务中,人们针对环境、组成的不同分别设计不同的计算方法进行处理,使用数字图像技术进行几何处理、图像增强和图像重建等技术,此后许多计算机视觉中的应用都可以被抽象表示为将输入图像转换成符合实际应用需求的输出图像。而随着国内外深度学习成果的逐渐积累,另一类图像生成通过计算机视觉技术,利用这些在计算机中留存的大量图像所包含的海量的关于真实世界的信息,学习到可以使用计算机进行表达的图像视觉特征。从传统图形学到自编码器到深度学习,图像生成的方式逐渐变得更加多元、灵活和高效,特别是随着计算机视觉领域深度学习的快速发展。生成对抗网络为图像生成过程带来改变的同时,同样也面临一些棘手的问题,一是训练过程中生成模型和判别模型性能不平衡,二是有限样本导致的模式崩溃现象。高度敏感的超参数选择使得生成对抗网络的训练变得十分困难,而有限样本导致生成网络崩溃,使生成模型倾向于只生成具有某一种风格的或是部分呈马赛克碎片状的图片。迄今为止针对上述问题提出改进的设想,例如多组生成对抗网络联合训练,渐进式生成对抗网络等,很少有考虑到利用同级特征在生成模型和判别模型间流动方面的改进。针对以上问题,本课题提出三点改进,首先在生成对抗网络前增加自编码器模型对数据进行特征提取,以特征提取的方式对生成对抗网络的输入数据进行预处理;第二,提出了同级特征在生成模型和判别模型间跃层连接的策略;第三,使用基于注意力机制的上采样方法代替反卷积。以上三点改进的提出都是在最大程度上利用特征提高训练的稳定性和生成图像的质量和多样性,同时尽量减少计算压力,特征预提取和跃层连接这两种改进在整个模型中的层次中呈递进关系,使用训练数据集训练一个自编码器作为特征提取器,选择自编码器的隐含输出作为下一步将要训练的生成对抗网络中生成模型的训练输入,并在生成对抗网络中增加从生成模型到判别模型的跃层连接和能够大量降低参数量的基于注意力机制的上采样方法。其中,采用对图像进行特征预提取的方式能够提高生成模型对图像中特征中分布的归纳能力,在以MNIST和ISR为训练数据的实验中,生成图像的多样性因此获得了改善;生成模型和判别模型之间的跃层连接即保证了生成对抗网络能够学习高频细节,同时也保留了图像中的低频细节,损失函数收敛结果表明该结构能够在训练过程中保持生成模型和判别模型之间的平衡,加快模型的收敛速度;而基于注意力机制的上采样方法在上采样阶段产生的计算压力仅为反卷积的六分之一,由于反卷积在生成对抗网络中的大量应用,对减少整个模型的体量来说十分显著。
其他文献
在面对突如其来的疫情等紧急情况时,如何缩短企业的生产加工时间、减少调度成本,高效率的加工产品成为企业急需解决的问题。在需求规模巨大化及机械产能固定时,车间调度成为了影响生产效率的要素之一。近几十年来,先后涌现了众多解决车间调度的算法,粒子群算法和禁忌搜索算法因其简捷、高效的优势一直是学者们研究改进的对象。粒子群算法具有所需参数较少、收敛速度快且易于实现的特点,但粒子在迭代过程中根据当前最优和全局最
化学分子图的拓扑指标是一种数值不变量,它可以间接预测对应化学分子的物理、化学性质.修正互惠度距离指标是互惠度距离指标的一个推广,定义为Rt(G)=(?)dG(u)+dG(v)/dG(u,v)+t,t≥0[1]亚苯基链和螺旋六角链是两类重要的芳香类化学分子图,具有很强的化学背景.本文第一个部分研究了亚苯基链的修正互惠度距离指标.令M是图G的一个最大匹配,S是M的一个子集.若S只包含在M中而不包含在G
大老爷府油藏是95年投入开发的低阻低渗砂岩油藏,经过17年的注水开发,已经进入到高含水采油期,含水达到93%,采收率只有11%,需要深化对水驱规律的再认识,提高水驱油效率,提高
背景喉鳞状细胞癌(laryngeal squamous cell carcinoma,LSCC)是一种高侵袭性的头颈部恶性肿瘤。研究表明,自噬是维持机体正常生理平衡和内环境稳态的重要机制,与人生长发育以及肿瘤发生等生理过程有密切关系。微小核糖核苷酸(micro RNA,miRNA)是一类参与多种细胞生理过程的内源性非编码RNA,在细胞生长、增殖、分化和凋亡中发挥着不可缺少的作用。微小RNA-124
如今世界范围内能源短缺及环境污染问题变得越来越严重,太阳能因其清洁性、可再生性、安全性、不受地理条件限制等优势而倍受关注。基于共轭聚合物和有机小分子的本体异质结
在紫金山铜金矿床内有几个世所罕见的发现,引起了广大研究人员的兴趣和热情,包括发现8种Cu-S体系矿物,探明铜矿体垂直厚度超过千米,但仍未见底。因此,为了查清Cu-S体系矿物的
基坑工程是土木工程最为复杂的技术领域之一。基坑的开挖不仅需要保证其自身的安全可靠,同时还必须保证临近建筑物,构筑物及地下管线等的正常使用。沿海地区建筑物密集,且软
乙酰丙酸作为高附加值平台化合物,其酯类衍生物可应用于清洁能源,能有效缓解化石能源紧缺等问题。磁性纳米固体酸催化剂具有易分离、可重复使用等特点,可高效催化乙酰丙酸酯
近年来,在国家教育信息化政策的大力推动下,各级各类教育领域都在着手于营造信息化教学环境,促进教学模式改革。伴随着网络通信技术的大力发展,手机在线教育规模的逐渐扩大,基于慕课的混合式教学渐渐进入各级各类学校里,使得更多教育者意识到混合式教学对于传统讲授教学起到了很大的辅助补充作用。虽然混合式教学进入课堂教学的趋势日渐明显,但在中等职业教育领域,特别是中职旅游教育领域仍处于初步发展阶段,尚有很大的发展
2015年,国家旅游局以促进区域旅游发展为目的,提出了“旅游+”的概念。伴着促进旅游发展的政策的实施,各地政府纷纷制定了新的旅游业发展规划,国家旅游局则创建了全域旅游示