基于深度神经网络对抗与集成的不平衡数据分类方法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:taohongguanghao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分类是机器学习和数据挖掘中获取数据中的信息和价值的一种重要手段,传统的数据分类算法通常运用于数据概率分布平衡的数据集,但是在实际生活和工业生产中,很多数据集中正负样本的分布往往是不平衡的,而少数类样本数据又具有更重要的信息,少数类样本分类错误可能需要付出很大的代价,如医疗诊断、信用卡诈骗检测等。在这种情况下,以总体的分类准确率为目标的传统分类算法并不适用于解决这一类的问题。针对不平衡数据分类问题中的难点,本文提出了一种基于深度神经网络集成的不平衡数据分类方法,利用深度神经网络提取复杂问题样本中的潜在特征,基于进化算法提高深度神经网络的训练效果,通过生成对抗模型改善数据样本的不平衡状况,最后通过深度神经网络集成来提高综合分类性能。本文的主要成果和创新点如下:(1)提出了一个基于进化深度神经网络的不平衡数据分类模型,通过深度自编码器(Deep Autoencoder,DAE)以及深度玻尔兹曼机(Deep Boltzmann Machine,DBM)提取不平衡数据中的潜在特征,通过水波优化算法(Water Wave Optimization,WWO)对深度神经网络的结构和参数进行优化,实验结果表明该方法显著地提升了深度神经网络的分类准确率,在不平衡数据分类问题中表现出了良好性能。(2)设计了一个基于深度去噪自编码器的深度生成对抗网络(Adversarial Deep Denoising Autoencoder,GAN-DAE),通过生成器和判别器的对抗训练,获取不平衡数据中正负样本的特征,并用训练完成的生成器生成少数类样本,改善数据样本的不平衡状况。实验结果表明这种该方法有效提升了不平衡数据分类的性能该方法,并将GAN-DAE应用于银行诈骗转账检测这一重要实际问题中,取得了很好的分类效果,并产生了较大的经济效益。(3)提出了一种基于进化算法优化的深度神经网络集成模型,将一组GAN-DAE集成到一个综合分类模型中,采用进化算法优化模型中各个成员神经网络的权重,实验结果表明这种深度神经网络集成方法进一步提升了不平衡数据分类的性能。针对不平衡数据分类问题,本文提出了基于进化算法的深度神经网络优化方法,同时对神经网络的结构和参数进行优化提升了深度神经网络的性能和分类精度。同时本文提出了基于进化算法优化的深度神经网络集成模型,以GAN-DAE作为成员神经网络,并使用进化算法对成员神经网络的权重进行优化,实验结果表明本文提出的方法大大提升了不平衡数据分类的精度。
其他文献
以环境作用下混凝土结构的性能演化与控制为主线,对相关研究成果进行回顾与分析。结果表明,经过二十余年的研究,对环境介质的侵蚀机理、锈蚀混凝土构件的受力性能、结构的时
由于特留份是对遗嘱自由的限制,是法定的不可侵害的继承权利,故继承主体应限定在法定继承人。在我国,婚生子女和非婚生子女享有同等继承权,故可以直接规定特留份数额为扣除债
技术是一种特殊的文化现象,它能反映文化焦点并用技术自身特殊的方式来表达它们。风格是内在模式形式化的外在表现,是一种对文化模式的显性表达,它依赖于结构,在本质上分层次
丹毒是由β溶血性链球菌引起的皮内网状淋巴管的急性感染,导致皮肤及皮下组织的急性化脓性炎症[1]。下肢丹毒是中医外科常见病之一,大多是由于下肢皮肤黏膜破损而导致的急性
通过分析高铁与民航博弈的根源,选择票价作为博弈研究的分析依据,运用科学的方法对票价采集数据进行处理。在对两种交通方式的票价进行对比之后,分析了其博弈过程,得出博弈机
目的:观察益气养阴类中药配合西药治疗糖尿病的临床效果。方法:抽取172例患有糖尿病的临床确诊患者病例,将其分为治疗组和对照组两组,平均每组86例。分别采用胰岛素和胰岛素与
目的 研究配对盒基因9(paired box gene 9,PAX9)在食管鳞癌细胞中的表达及其对细胞生长和增殖的作用及其机制,为食管癌的治疗寻找新的靶点和治疗方法。方法 培养4种食管鳞癌细
心理学家马斯洛提出“归属与爱的需要”是人的重要心理需要,对于一个班级来说,要让学生健康成长,投入学习,成就自我价值,首先要让学生对班级有一种归属感。本文就如何培养学
目的通过研究血管紧张素抑制剂类药物贝那普利对肝纤维化小鼠肝脏组织中AngII及TGF-β1、IL-1β、iNOS表达的影响,初步探索贝那普利发挥抗肝纤维化作用的机制。方法将40只SPF级健康雄性C57BL/6小鼠(体重在19g到22g之间),随机分组为:(1)空白对照组、(2)贝那普利对照组、(3)CCl_4致肝纤维化模型组、(4)贝那普利治疗组,每组10只。小鼠从济南朋悦实验动物繁育有限公司运到
会计信息的基本质量特征是一个体系,由客观性、相关性、可比性和可理解性四个方面组成.受多种因素的制约,会计实际提供的信息在质量上达不到用户的要求.提高会计信息质量的基