【摘 要】
:
随着现代计算机技术的不断发展,二十一世纪迎来了人工智能的辉煌时代,在自然语言处理、计算机视觉、音频处理这三大领域的技术突破最为明显,自然语言处理上,出现了文本生成和文本挖掘等技术,在计算机视觉上出现了图像风格迁移、图像生成、语义分割等技术,音频处理领域上有声纹识别、人声生成、音乐生成等技术。常规的深度学习神经网络都致力于研究回归或是分类,但是自从生成对抗网络被提出来之后,基于深度神经网络与大数据的
论文部分内容阅读
随着现代计算机技术的不断发展,二十一世纪迎来了人工智能的辉煌时代,在自然语言处理、计算机视觉、音频处理这三大领域的技术突破最为明显,自然语言处理上,出现了文本生成和文本挖掘等技术,在计算机视觉上出现了图像风格迁移、图像生成、语义分割等技术,音频处理领域上有声纹识别、人声生成、音乐生成等技术。常规的深度学习神经网络都致力于研究回归或是分类,但是自从生成对抗网络被提出来之后,基于深度神经网络与大数据的样本生成技术逐渐成为了人工智能领域内热门的研究课题,在基于原始的生成对抗网络的基础上,不断有改进的新模型提出,如条件生成对抗网络CGAN能够根据输入的词语生成图片,深度卷积生成对抗网络DCGAN能够提取更加深层的输入图像特征,超分辨率卷积神经网络SRCNN以及增强型超分辨率卷积神经网络ESRCNN都是用于超分辨率图像生成领域。本文主要研究基于生成对抗网络的人脸图像生成技术,并从人脸图像生成、人脸图像去模糊以及人脸图像超分辨率三个方面提出了不同程度的创新与改进,本文主要提出的改进有以下三点:1.在人脸图像生成这一领域上,边界均衡生成对抗网络(BEGAN)可以生成令人印象深刻的真实人脸图像,但在生成图像的质量和多样性之间存在一个权衡。本文在分析完边界均衡生成对抗网络利弊的基础上,提出一种能够生成更高质量、更多样性图像的方法。即通过在鉴别器模块中加入第二损失函数(去噪损失),使鉴别器模块可以获得更多关于真实图像分布的有用信息,进而提高了鉴别器模块在区分真实人脸图像和虚假人脸图像的能力,同时由于鉴别器模块能力的提升,生成器模块也不得不通过产生更真实的图像来欺骗鉴别器模块。同时本文提出在边界均衡生成对抗网络架构中使用批量标准化技术可以提高生成图像的多样性。2.在人脸图像去模糊这一领域上,由于在现实生活的环境当中所拍摄下的人脸图像会因为光线、抖动、角度、运动等因素造成图像模糊,因此为了解决在这种情况下人脸图像有所模糊的状况,本文在基于原始生成对抗网络(GAN)的基础上,通过引入感受野块网络(RFBNet),增强了原生成对抗网络提取模糊图像特征的能力。其次,本文还提出了一种能够结合不同层次图像特征的特征损失函数并加入到原始生成对抗网络的最终损失函数当中,使网络的生成的去模糊图像与真实图像的特征相似度得到提升,最后,本文通过向原始生成对抗网络中加入RFBNet当中的RFBs结构,使改进后的模型的去模糊能力速度大大增加。3.在人脸图像超分辨率这一领域上,现有的增强超分辨率生成对抗网络(ESRGAN)是一种单图像超分辨率图像生成方法,能够生成高分辨率图像。尽管原模型生成的图像质量就很好,但这个模型仍有改进的空间。本文提出了一个对现有密集残差块(RRDB)的改进,即向RRDB模块中加入跳跃连接技巧(Skip Connection),使得其对于图像特征的容量增加,并且用改进后的密集残差块去代替原来ESRGAN所使用的基本模块。除此之外,本文提出的另一个改进方法即通过向生成器模块添加噪声输入,并增加缩放因子参数γ,通过使用随机变量学习隐含图像的特征,生成的图像将会呈现更加真实的纹理效果。
其他文献
聚类作为机器学习领域的主要研究内容,其目标是通过某种相似性度量将对象数据聚成不同的簇,实现“物以类聚”。聚类的研究对象多种多样,其中一类近年来被广泛研究,即多视图数据。一般来说,单视图数据专注于描述对象的某些特定属性,不具有全面性。与其相比,多视图数据可以从多角度描述观察对象,相互之间具有较好的补充性,更加有利于聚类学习。另一方面,多视图数据也带来了新的挑战,例如,数据的高维度影响了聚类算法的学习
《义务教育英语课程标准》(2022)要求初中生敢于在课内外英语活动中积极用英语进行交流。但教师不恰当的纠错方式会提高学生的英语口语焦虑,从而降低其英语口语学习的积极性。与其他研究不同,本研究以《外语口语焦虑自我图式量表》(FLSAS)为测量工具,在对比分析、错误分析和情感过滤假说的基础上,通过快速聚类分析将初中生分为不同的英语口语焦虑类别,探讨了以下问题:1.初中生英语口语焦虑的总体水平如何?2.
<正>为提升企业经营效率,确保财务报告可靠,具体业务合法合规,公司必须进行有效的内部控制。作为内部控制五大要素之一,风险评估工作开展的好与坏,直接决定企业内部控制的成败。风险评估要重点做好风险管理组织和目标、风险识别、风险分析评估、风险应对与控制、风险信息沟通与监督等关键环节,确保企业内部控制能够有效实施。
沥青路面水损害一直以来都是影响路面使用寿命及服务能力的主要病害之一,大量的工程实例证实许多沥青路面在使用初期就产生了大面积的水损害。深入研究发现路面内部的动水压力是引发早期水损害的主要原因。饱水路面在车辆荷载的作用下会产生循环变化的动水压力,进而产生高速水流对沥青混合料冲刷,这种冲刷作用会极快的加速水损害的发展。然而,目前的沥青混合料水损害评价体系中的试验方法基本都是基于静态水条件,并没有考虑动水
工业运行控制系统中往往存在着各种形式的约束如输出约束、预设性能和时变约束等等。为了使系统能够稳定运行,通常需要对系统的状态和输出过程进行约束,若不对系统进行约束,会使得系统运行不稳定,严重的话甚至会使系统无法运行,所以对受约束条件下的系统进行稳定性研究是非常有必要的。系统的运行环境中通常也存在着随机因素,在对系统进行建模时也需要考虑随机因素的影响,如何解决随机因素的影响一直以来都是非线性系统研究的
伴随着互联网技术的迅速发展,我们迎来了信息爆炸的时代。我们在享受获取信息便利性的同时,同样苦恼于如何从大量的信息数据中快速准确地获得自己真正需要的信息。近年来,推荐系统作为有效解决信息泛滥的手段引起了国内外大量研究人员的关注。其中,协同过滤(Collaborative Filtering,CF)方法通过利用用户的历史交互信息来挖掘用户的兴趣偏好,获得了巨大成功。然而,基于CF的方法通常存在数据稀疏
肠道不仅具有消化和吸收功能,同样也是仔猪体内重要的免疫器官。由于仔猪自身的免疫系统不完善,在仔猪阶段极易受到环境以及营养变化等因素的影响,诱导仔猪机体的氧化损伤。当仔猪受到氧化应激时,仔猪肠道也会受到氧化损伤。如何缓解仔猪的氧化损伤,提高仔猪的抗氧化功能和生长性能成为研究热点,课题组之前的研究证实茶树油具有一定的抗氧化功能并且可以提高仔猪的生长性能。而4-萜品醇(TER)为茶树油的主要成分,本研究
Event-B是一种计算机领域中针对系统级建模和分析提出的形式化方法。对于复杂软件系统,Event-B通过需求的不断扩充,在不同的抽象层级上使用精化策略来表征系统。在整个系统建立以后,用数学证明去验证每一层精化后模型的一致性。在完整模型通过验证后,完善先前的需求设计,规避在后续开发阶段可能出现的错误。随着新冠疫情的爆发,人体免疫学方面的研究,成为当下的热点话题。免疫系统在面对病毒入侵时,会进行两种
车联网(Internet of Vehicles,IoV)以车辆为主要载体可以实现多种方式的智能交互,能有效引导交通信息的传输,提高城市交通的安全性以及智能化水平。但是,以车为基本单元向外延展的通信,如车与车(Vehicle to Vehicle,V2V)、车与基础设施(Vehicle to Instructure,V2I)和车与网络(Vehicle to Network,V2N)都是在无线网络环
文本简化任务主要目的是降低文本内容和句法的复杂性,同时保留源文本的主要信息和含义。文本简化的主要功能是帮助语言知识储备量较少的人群更好的理解文本内容。现在的文本简化方法大多基于神经网络模型,这类文本简化方法通常需要大规模的平行语料,对神经网络进行训练,从而达到文本简化的效果。但是现有的文本简化语料库包含了很多问题,如语料库提供的简化不够充分、简单句和复杂句的意思不一样等等,导致训练出来的文本简化模