基于生成对抗网络的数据增强方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:duchze
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现有的图像分类和物体检测等任务中,研究人员经常遇到数据集规模不够、样本分布不平衡、数据代表性不足等问题。针对这些问题,人们提出了许多数据增强方法。生成对抗网络作为一种生成模型,能够经过训练生成新样本数据,近年来已成为解决这一问题的有效途径之一。使用生成对抗网络来进行图像数据增强的方式一般可以分为两种:一种是通过生成对抗网络直接生成大量样本数据,从而对图像数据集规模进行扩充;另一种是通过生成对抗网络对图像进行变换,使用原有图像特征并生成具有新特征数据以进行数据增强。本文分别对这两种方法进行了系统研究,具体工作如下:1、通过生成对抗网络直接生成图像时,因为样本数据分布复杂、网络表达能不足等原因,生成对抗网络可能会发生模式崩溃问题,从而造成数据重复、样本分布不均匀。对此,本文提出了一种新的基于多分布输入的生成对抗网络。本文所提出的多分布生成对抗网络使用高斯混合分布代替生成对抗网络中的单一分布作为输入数据;同时,在训练过程中,根据判别器和生成器的损失函数变化对多分布进行优化,使其能更好地生成输入数据,避免模式崩溃。本文以染色体图像生成为例,使用多分布生成对抗网络对染色体图像数据集进行扩充,达到了提升染色体分类准确率的效果。除此之外,本文还在高斯散点数据和MNIST数据集上对多分布生成对抗网络对于模式崩溃问题的有效性进行了验证。2、在对已有图像通过变换来进行数据增强时,生成对抗网络可能会遇到生成样本质量不高、边缘特征不清晰的问题。对此,本文提出了一种新的形变生成对抗网络,有效解决了字母图像数据增强的问题。该网络在生成器部分增加了输入字母的形态特征,判别器部分增加了期望生成的信息;此外,本文所提出的形变生成对抗网络还对损失函数进行了改进,在生成对抗损失函数基础上添加了均方误差和感知误差作为损失函数,从而提高了所生成的字母图像的质量。本文以ICDAR2015文字数据集为例,用形变生成对抗网络进行训练,并通过文字检测算法对增强前和增强后的对比评测,验证了本文所提出的网络在数据增强方面的效果。
其他文献
研究目的:学校体育课程作为学生德育的载体越来越受到重视。国外学者在对体育品德教育的研究中提出了TPSR(个人与社会责任)模式,受到诸多好评。而国内对此模式的研究较少,特别是高校缺乏对体育课堂德育因素和价值的落实。部分研究者将TPSR模式与团体类运动项目结合取得了不错的效果,但对游泳、田径等非团体类项目的尝试严重不足。因此将TPSR模式的课程理念应用于东华大学游泳选修课程中,并根据课程的实际情况进行
学位
自2008年京津城际高铁开通以来,高铁网络在我国经济生活中发挥着越来越重要的作用。高铁一方面改变了人们的出行方式,增强了城市间的互联互通,另一方面也提升了高铁城市的市场可达性,加速了城市间生产要素的流动,为城市的发展提供了新的契机。近年来关于高铁开通对于城市发展的影响日益受到关注,同时其对于城市产业集聚和城市创新的带动作用也日益显著。本文通过借鉴藤田昌久(2016)中两经济体的简单的内生增长模型,
学位
随着网络的普及发展和网络游戏产业的发展,越来越多的人被网络游戏吸引。根据中国互联网络信息中心官方发布的最新《中国互联网络发展状况统计报告》显示,到2021年12月,我国网络游戏用户数量达到了5.54亿。其中,青少年群体因为处于人生发展的暴风骤雨期,思维与情绪变化起伏大,极容易陷入网络游戏成瘾。对青少年网络游戏成瘾的形成与预防机制研究一直受到重视。积极青少年发展是指青少年的正向发展,属于积极心理学的
学位
作为当代美国炙手可热的印第安裔作家,琳达·霍根始终在创作中揭露白人对印第安人的压迫,批判西方政治。她不仅集诗人、小说家、散文家、大学教授等众多头衔于一身,还是“生态批评”、“激进政治”、“女权斗争”等先锋运动的领军人物。从《恶灵》到《太阳风暴》,从《力量》到《靠鲸生活的人》,霍根以四部小说开辟了“生态主义”和“女性主义”的发声渠道。可以说,“反抗”既是霍根作品的主题.,也是其选择的立场。然而,“生
学位
汪精卫通过多年所积累的个人资源、制度资本、社会关系和社会声望,在1925年6月到1926年3月间达到了自身政治生涯的巅峰,在国民党内拥有特殊的重要政治地位。然而从1927年4月份归国到1927年底被迫引退出国,短短时间内,汪的政治地位遭受重创,至此成为国民党内各派寻求政治平衡的象征和工具。本文主要是研究汪精卫在1925年前的社会资本的积累与政治地位的获得以及其在1927年底政治地位下降的原因。首先
学位
REITs是Real Estate Investment Trusts的缩写,即“不动产投资信托基金”,REITs诞生之初投资的不动产类型基本仅为房地产,而如今“不动产”所代表的资产类型由狭义的房地产,拓展为具备经济价值的土地附着物,比如:铁路、高速公路、无线通信设施、电力配送网络、污水处理设施等。2020年4月30日,中国证监会发布了我国首个公募基础设施REITs制度——《公开募集基础设施证券投
学位
白糖是保障国家民生与经济发展的必需品,稳定其市场运行具有重大的战略意义。我国白糖市场化程度较高,白糖期货发挥着价格发现和风险规避的重要作用。然而,若期货市场的自身风险较大且缺乏管控,则可能会为市场和投资者招致更大的损失。据郑州商品交易所资料显示,白糖期货市场自2006年上市以来价格波动剧烈,数年来几经大幅涨落,亟需借助科学合理的风险测度对其进行市场风险监测和风险特征捕捉,但由于白糖期货上市较晚,关
学位
近年来,中国经济的快速发展,吸引了大量外资企业来华进行投资经营。中国市场早已变成各个外资企业国际化发展战略的重中之重。而这些外资企业经常以与中国企业建立合资企业(一种战略联盟)的形式进入中国市场,且大部分来自欧美、日本、新加坡等发达国家或地区,拥有先进的企业社会责任理念。这对改善中国企业的企业社会责任,推动我国经济和社会的发展有着非常重大的意义。然而,现有文献中对于战略联盟中企业社会责任的实证研究
学位
近年来,随着移动设备中相机拍摄性能越来越好,越来越多的人们使用移动设备来拍摄视频。但是在拍摄视频时,由于相机突然的运动,视频会不可避免地出现抖动的情况,导致视频质量下降。因此,视频防抖技术一直都是研究的热点。本文主要关注基于惯性感知的视频防抖技术研究,提出了基于惯性-视觉融合的视频防抖解决方案,设计并实现了基于Android智能设备的视频防抖系统。本文的主要工作如下:(1)本文通过大量的实验研究了
学位
近年来我国商业银行同业业务持续过热,业务创新模式变换频繁,乱象丛生,在此背景下,监管部门自2014年起大量出台监管文件,重点规范银行同业业务。2017年以来,银监会的高监管模式持续推进,组织开展“三三四十”等专项系列活动,并且在2018年3月形成了银行和保险业混业监管的形式,期间发出了大批监管函,罚款金额也十分可观,如2016年底引发的“侨兴债”事件,银监会对广发银行开出了 7.22亿罚单,引起了
学位