基于生成式对抗网络的图像识别研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:yangbintian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的兴起和硬件设备的高速发展,人类正逐步进入人工智能时代,而图像识别是人工智能领域应用最广泛的技术之一,研究提升图像识别性能具有重要意义。本文基于生成式对抗网络,结合发票图像自动识别相关问题,研究并提出印章消除、图像超分辨率处理以及丰富手写体数据集的三种网络模型,包括SealGAN网络模型、ESRGAN网络模型和HWGAN网络模型,以提升图像识别性能,并进行实验对比分析。论文主要内容如下:首先提出了用于消除印章的新网络架构-SealGAN网络。基于CycleGAN网络的循环结构,SealGAN设计两个独立的分类器来取代判别网络;并基于UNet和ResNet结构设计SealGAN的生成网络,同时针对印章的特点来调整生成网络。结合发票印章处理问题,分别采用CycleGAN-Unet、CycleGAN-Resnet和SealGAN三种网络模型进行印章消除实验,并基于网络综合性能评价指标对三种网络模型进行评价,实验结果表明SealGAN网络的有效性。其次分析对比了典型的图像超分辨率处理方法,包括基于传统图像处理的超分辨率、引入深度卷积神经网络的SRCNN模型以及引入生成式对抗网络的SRGAN模型。基于带条件的生成式对抗网络cGAN,引入了辅助编码器,提出了全新的超分辨率模型-ESRGAN网络。结合不同发票图像,分别采用双线性插值放大、Sobel算子、拉普拉斯算子、SRCNN网络、SRGAN网络以及ESRGAN网络进行超分辨率处理实验,对比分析不同方法的处理效果。最后针对手写体汉字中出现的各种生僻字,由于其数据集较少,无法训练自动识别网络,提出了用于生成手写汉字的HWGAN网络,可丰富手写汉字数据集。网络采用了特殊的训练方式,引入了 PSNR指标作为相似性损失,缓解原始版本的生成式对抗网络所存在的模型坍塌缺陷。实验结果表明,HWGAN网络可根据汉字的打印体很好地生成相应的手写体,而且生成的手写体具有不同风格。
其他文献
为了解底栖动物对稻田生境变化的响应及其安全性,本文以底栖动物为指示生物,通过湖南省湘潭市湘乡东郊乡上花村水稻种植区进行3年关于稻田生境三个方面实验研究。通过稻田底栖动物个体数量、物种丰富度、群落相似性、均匀性指数、优势种分布、群落多样性指数以及优势集中性指数分析,得到相关结论,以期为农业生产和生态安全提供参考性依据。1、施用有机肥提高稻田土壤相关元素含量稻田施用有机肥-施能牌“根果旺”复合微生物菌
长期以来,我国的粮仓建设创新较慢,占绝大比例的平房仓仍采用传统砌体结构,建设过程中使用粘土砖,结构形式单一,抗震性能差,原材料消耗大,不利于节能与环保。而密肋复合墙体
清洁高效的锂离子电池已经广泛应用于生活的各方面。但是,目前商业化的碳负极材料由于比容量偏低,已渐渐不能满足高速发展的社会对能源的需求。因此高容量、高比能、循环稳定
目的和意义原发性肝癌,简称肝癌,是世界上最常见的恶性肿瘤之一,其死亡率在恶性肿瘤中排行第三。射频消融术作为临床上治疗肝癌的重要方式之一,具有疗效好,创伤小,安全,可重
以RFID技术为代表的创新信息技术蓬勃发展,国内外上市公司在纷纷采纳的同时也十分关心其对企业长期投资回报的影响。既有研究多聚焦于信息技术采纳对企业短期市场绩效的影响,
航空倾斜影像已成为大规模城市三维重建的主要数据源,然而由于倾斜影像存在较大的俯仰、横滚角,影像之间差异较大,其自动特征匹配存在明显的可靠性问题,交互式转刺同名点仍必
随着新课程改革的逐渐深入,高中英语课程的培养目标更着重于培养学生的语言应用能力。如何减少高中生英语写作错误,提高学生英语写作能力,已成为广大师生所共同关注的焦点之一。但梳理国内外相关文献后,本文总结发现我国高中英语应用文写作教学中仍存在诸多问题,如对高中生写作错误的关注度不高,学生写作错误反复出现,对英语应用文写作框架感到模糊等。本文基于Corder提出的错误分析理论,以湖南邵阳某中学高二某班的5
纤维的取向度和纤维直径是纺织材料的重要参数。纤维的取向分布决定了纺织材料的力学各向异性,进而影响纺织材料的性能,取向度一致的纳米纤维材料在燃料电池、生物医学等领域
近年来,我国快递业蓬勃发展,已经成为邮政业的重要分支。目前,我国的快递行业整体呈现多家行业巨头及中小型快递企业并存的形式。作为世界第一快递大国,目前行业已有300万名一线员工,为就业增收提供了新渠道。然而,网点经营却面临着货量逐年增多,劳动力市场充足,配送人员短缺的矛盾现象,使网点用工成本增加,也严重影响了团队建设,给网点管理造成了不小的困难。因此,快递人员的队伍稳定性不强仍是我国快递行业面临的主
情感交互是实现人机交互的重要方式,通过收集人的多模态信息,机器人能够识别人的情感状态,并根据相应的情感分析结果给出合理的反馈。由于模态数的增多,噪声污染和数据冗余等因素严重影响了情感识别算法的效率。快速、准确地从多种模态信息中提取具有决定性的情感特征是多模态情感识别研究领域的难题。本文针对现有双模态情感识别方法易受到噪声污染和数据冗余等问题的困扰而导致识别率较低的问题,提出了一种基于深度学习与回溯