基于生成对抗网络的数据异常检测算法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:ocean_30
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测是机器学习领域的重要分支,当数据的产生过程表现为异常时,会导致异常事件的发生。在入侵检测系统、信用卡欺诈检测、工业传感器设备监测等领域中,异常检测都有广泛的应用,因此对于各应用领域的海量数据进行异常检测具有实际意义。本论文针对传统的异常检测模型在数据规模较大、维度较高等条件下,模型性能效果不佳的问题,提出了基于GAN-Tree的数据异常检测模型;同时为避免上述数据增强方法中生成样本标签的误差性,加入第二个生成对抗网络使生成样本与其对应的标签一致,提出了基于GAN-DP的数据异常检测模型。具体研究内容和结果如下:(1)设计基于GAN-Tree的数据异常检测模型。在原始生成对抗网络的基础上,利用生成式模型特性生成大量的异常样本,本文将生成样本与原始样本组合构造为类别平衡数据集,再将该数据集送入推理神经网络中预测异常样本,同时加入树系模型与参数优化算法微调推理神经网络的异常样本分类效果。结果表明,对比六种传统的机器学习模型,GAN-Tree数据异常检测模型能够达到最高的AUC值0.965,相比次优的CBLOF模型提高1.5%,综合性能优于传统的检测模型。(2)设计基于GAN-DP的数据异常检测模型。为使生成数据与其对应的标签一致,本文提出Info-GAN模型控制生成样本;之后将实际数据和生成数据与其对应标签组合构造为数据标签组输入到第二个GAN模型中训练;同时加入树系模型与参数优化算法精调推理网络以提高分类的准确性。结果表明,对比六种传统的机器学习模型,GAN-DP与GAN-Tree的综合性能出色,在ROC曲线、KS曲线、PR曲线三种异常检测指标上,GAN-DP分别达到最高值0.978、0.87、0.927,相比GAN-Tree分别提高了1.3%、4%、6.7%,佐证了GAN-DP可以对海量数据中的异常样本实现正确分类。(3)研究数据异常检测模型的应用效果。利用GAN-DP作为基准异常检测模型,同时将参数调整算法BOHB移植到树系模型中,进一步提高GAN-DP的样本分类能力。通过智能制造工业设备产生的数据与Pyod开源异常检测数据集验证模型的实际性能,结果表明,GAN-DP在工业真实数据集中的AUC值达到0.762,相比传统性能最优模型HBOS提升了12.4%,更符合实际应用;此外,在开源的Mnist数据集上,GAN-DP的AUC能达到0.99,效果相比次优模型PCA、OCSVM提高了12%。
其他文献
随着智能工业的发展,无人机自主管理的需求也在不断上升。在许多应用场景中,比如无人机电力巡检、园区巡检等,这些过程重复且时间规律,采用无人机自动化管理能够节省人力成本,且在某些场景还能降低危险系数。无人机在自主化管理研究中,由于现有民用卫星定位精度不高,无法满足无人机自主降落过程中所需定位精度更高的要求。本课题研究的目标是实现无人机快速自主降落。具体的方法是在无人机返航过程中,首先利用视觉图像处理算
学位
摩擦纳米发电机(Triboelectric nanogenerator,TENG)可以将环境中微小机械能转化为电能,具有制备成本低廉、取材范围广泛、结构多设计样等优点,是一种具有广阔应用前景的自供电器件。追求高输出功率、高电能转化效率一直是该领域重点研究方向,本工作将具有多孔结构的聚二甲基硅氧烷(Polydimethylsiloxane,PDMS)薄膜应用于TENG,并研究器件性能提升技术,具体研
学位
人脸作为最重要的生物特征早已被运用在各行各业当中,移动支付、智能安防、智慧城市等众多领域都可以看到人脸识别的身影。随着智能移动办公概念的提出,人脸识别考勤设备制造行业也迎来了新一轮的革新。多人识别、隐私保护、速度快、准确率高、设备轻便、信息智能化管理等许多要求已经成为其最新的研究发展方向。本文结合最新人脸识别考勤需求,展开基于ARM的动态人脸识别考勤系统的研究与设计,主要工作内容如下:1.本文基于
学位
上转换发光材料因为卓越的发光能力,在医学领域、太阳能领域、红外防伪等方面有着巨大的发展潜力。NaGdF4是上转换效率比较高的基质材料之一,因晶体表面缺陷、荧光猝灭现象等原因导致其发光效率较低。本文通过溶剂热法合成Al3+掺杂的纳米颗粒NaGdF4:Er3+/Yb3+,探究了掺杂0~at.17.5%的Al3+对纳米颗粒物相、形貌及上转换发光性能的影响。采用真空法制备了Ag/介质层/UC层复合薄膜,研
学位
摩擦纳米发电技术是一种性能优越的能量收集和自供电传感技术,具有广阔的应用前景。揭示摩擦材料湿度响应特性及其影响机制对于提升摩擦纳米发电机输出性能具有重要意义。本文研究了相对湿度对常见摩擦材料摩擦起电性能的影响,发现摩擦材料间的电荷转移量随着相对湿度的上升先增强后减弱,并且该现象具有普遍性。本文主要的研究内容及成果如下:1、设计制备一种应用于湿度响应特性研究的胶囊型摩擦纳米发电机,该器件易于实现机械
学位
随着神经网络和深度学习等信息技术不断的创新突破,人工智能应用与服务的兴起驱动着智能时代的蓬勃发展。将人工智能应用与服务推向网络边缘,充分释放边缘数据的潜力,实现边缘设备智能化逐渐成为各行业的研究发展方向。边缘智能的实现对设备提出了高算力、高带宽、低延迟和低功耗等需求,以便能够应对各类复杂应用场景,提供高性能的实时计算和更好的服务质量。然而,由于卷积计算较高的计算复杂度和庞大的计算量,在神经网络模型
学位
随着科学技术的不断发展,物联网逐渐出现在人们的视野并且变的愈加重要,物联网是基于互联网基础上可以纵向延伸和横向扩展的网络。世界经历了工业时代,PC互联网时代,移动物联网时代,到现在的物联网时代,可见物联网已经成为当今社会的主流。传感器是能够将自然界信号转换成电学信号的器件,是整个物联网系统信息的来源,模数转换器(Analog-to-digital Converter,ADC)是传感器中重要组成部分
学位
二十一世纪是纳米科学的世纪,纳米尺度下光与物质相互作用表现出许多宏观下没有的性质,在集成光学、光通信以及传感检测等领域已有广泛应用。表面等离激元作为纳米尺度下对光子进行操控和集成的重要工具,是在金属-介质交界处产生的一种电磁模式,其沿金属-介质分界面横向传播,同时纵向迅速衰减。具有表面等离激元性质的表面等离激元超材料,常用于高分辨率成像、无标记传感检测等诸多领域。相较于平面结构,三维结构表面等离激
学位
光伏发电对能源结构的转型与脱碳起到重要作用,未来仍将持续发展。光伏阵列工作在室外,环境变化不稳定,容易发生各种故障,因此建立准确的光伏阵列故障诊断模型,实现故障的在线识别能够有效的提升光伏阵列的工作效率和安全性。本文基于改进的稀疏表示技术,分别针对光伏阵列电流-电压(I-V)特性和暂态数据的故障特征进行挖掘,以此建立诊断模型,并通过迁移学习使目标阵列的模型建立更加高效,具体研究工作如下:首先,针对
学位
自旋电子学经过了几十年的发展,基于各种材料的自旋注入乃至自旋的调控始终是研究的热点。拓扑绝缘体作为一种具有非平庸金属表面态的非传统绝缘体,具有很强的自旋轨道耦合作用。三维拓扑绝缘体Bi2Se3和Bi2Te3均为窄带隙材料,能够测得较大的自旋极化光电流,为研究材料的自旋极化特性乃至之后制备自旋电子器件提供了一个很好的平台。鉴于不同厚度的纳米片对自旋相关光电流的影响目前尚不明确,以及通过自旋光电流研究
学位