【摘 要】
:
由于信用欺诈、网络入侵等异常的发生,异常检测被相关领域的众多国内外学者广泛关注,并已成为研究热点。目前已经提出了许多异常检测方法,其中基于聚类的异常检测方法最为流行。随着深度表示学习的发展,融合表示学习的聚类算法的性能具有了大幅提升。但是,现有的基于聚类的异常检测方法往往是根据聚类结果进行异常点检测,而在聚类过程中忽略了异常检测与聚类之间的相互依赖关系,从而导致异常检测准确度不高。为了提高异常检测
论文部分内容阅读
由于信用欺诈、网络入侵等异常的发生,异常检测被相关领域的众多国内外学者广泛关注,并已成为研究热点。目前已经提出了许多异常检测方法,其中基于聚类的异常检测方法最为流行。随着深度表示学习的发展,融合表示学习的聚类算法的性能具有了大幅提升。但是,现有的基于聚类的异常检测方法往往是根据聚类结果进行异常点检测,而在聚类过程中忽略了异常检测与聚类之间的相互依赖关系,从而导致异常检测准确度不高。为了提高异常检测算法的准确性,本文提出了一种实现样本表示学习、聚类以及异常样本发现的三者联合学习算法DORKM(Deep K-means with outlier removeal and representation learning,DORKM)。DORKM算法在遵循DKM(Deep K-means)基本框架的基础上,在聚类过程中增加了异常样本分布的确定,且在后续更新簇中心以及计算聚类损失时都考虑了异常样本的影响。在MNIST+、KDD-CUP99和UBR三个数据集上的实验结果表明DORKM算法明显优于基线算法模型,从而证明了DORKM算法在大规模高维数据下的有效性。由于样本表示学习得到地样本表示的质量取决于自编码器的结构,且不同的数据集能够拟合的编码器的结构不同,本文将基于二阶的粒子群优化堆叠自编码器引入DORKM中提出了一种新的异常检测方法PSO-SAE-KM(Particle Swarm OptimizationStacked Auto Encoder-K-means)。现有的一阶粒子群优化的堆叠自编码器(PSO-SAE)仅优化了隐藏层的层数,在此基础上,本文增加了隐藏层中节点数的优化,形成了二阶的PSO-SAE。在3个数据集上与传统的一阶算法进行对比,实验表明了提出方法的有效性。
其他文献
目的探讨并比较加速康复外科(Enhanced recovery after surgery,ERAS)理念指导下经跗骨窦小切口有限内固定与经外侧L形切口钢板内固定治疗Sanders Ⅱ型、Ⅲ型跟骨骨折的临床疗效。方法收集于2018年09月至2020年12月之间收治的在ERAS理念下指导下开展治疗的40例单侧闭合性跟骨骨折(Sanders Ⅱ、Ⅲ型)患者的相关资料。所有患者均于住院期间接收手术治疗且
目的:探讨肢体软组织肉瘤(ESTS)保肢R0切除术后的复发和转移模式,为后续治疗提供依据,通过干预降低局部复发和远处转移的风险。材料和方法:回顾性分析从2010年1月至2017年12月在浙江大学医学院附属第二医院接受保肢R0切除手术的ESTS患者,并对其临床病理因素进行分析,探究局部复发和远处转移模式。对于局部复发病例,在磁共振成像(MRI)上测量原发肿瘤边缘到局部复发肿瘤中心的距离。局部复发位置
采用“任务驱动”教学法,在初识细胞器、再认细胞器、拼装细胞器、归纳细胞器四个任务驱动下,帮助学生理解细胞器结构和功能的统一性,实现科学思维的发展。
航空发动机孔探损伤自动检测技术是提高航空器飞行安全和利用率、节约时间和经济成本、促进智慧民航发展的一项重要内容。但孔探损伤自动检测技术的研究尚处于起步阶段,现有孔探数据存在损伤样本数量少,损伤类别分布不均衡的问题,因此,需要对进行数据扩展。目前尚无针对孔探场景的数据扩展方法。本文研究总结了通用场景的数据扩展方法,提出了基于风格迁移的交互式数据扩展方法和基于生成对抗网络的交互式数据扩展方法。论文工作
目的报道2例以节段性肌张力障碍为首发症状且发病年龄小于20岁的舞蹈病-棘红细胞增多症(chorea-acanthocytosis,Ch Ac),总结分析青少年起病的Ch Ac的临床特征,血涂片,影像学特征,基因特点以及基因型和表型的相互关系,增加对该疾病的认识。材料与方法本文报道了在本院确诊的2例Ch Ac,进行了家系及基因验证,检索回顾分析文献报道的确诊的青少年起病的Ch Ac,对疾病的临床特征
人工智能等技术的发展虽然为解决航班延误提供了新思路,但是因为航空系统的数据信息涉及机密,对他们各种计划制定都有着重要影响,数据高度敏感,各方之间数据难以共享,这给应用人工智能技术解决航班延误问题带来了巨大的挑战。因此,在隐私保护的前提下进行延误预测模型的建立显得愈发重要。根据现有的研究情况和存在的问题,本文进行了如下研究:针对现有的航班延误预测方法中未考虑多数据源与数据隐私问题,以及训练过程中中间
旅客大多数的不良情绪并不是因为航班延误本身引起的,而是由于在特殊天气条件之下,航空公司一直无法确定航班起飞时间,使得旅客做一些无谓的等待,造成旅客情绪不稳定,甚至出现恶性群体事件。论文结合海量气象数据对航班运行态势做量化研究,旨在对航班的运行态势做量化评估,做到提前预测航班运行态势,及时通知旅客航班是否能够正常运行,有利于旅客更好地安排行程,减少不必要的等待,从而减少乘客的焦虑和投诉。针对基于天气
目的探讨血清肿瘤坏死因子相关凋亡诱导配体(TNF-related apoptosis-inducing ligand,TRAIL)在细菌感染性疾病诊断中的价值。方法选取2020年8月11日-2021年2月5日在我院肝病感染科的住院患者,并根据出院诊断纳入诊断为感染性疾病的患者,分为细菌感染组和病毒感染组,排除非细菌和非病毒感染患者,选取同时期的医院健康体检人群作为对照组,记录研究对象基本信息和临床
知识图谱问答是知识图谱中的一个重要应用,近年来得到人们的广泛关注和研究。特别是针对复杂问题的知识图谱问答,由于问题中的关系和约束信息较多,以及面临知识图谱不完整等问题,都为当前研究带来了很大挑战。本文主要研究复杂问题的知识图谱问答,具体开展了以下工作:(1)知识图谱通常存在不完整的问题,导致问题主题实体和正确答案实体之间缺乏有效关系路径。前人提出使用知识嵌入方法实现链路预测,此类方法仅注重于将问题
目的:多巴胺(Dopaminergic,DA)神经元分化的潜在机制尚未完全阐明。本研究试图分析小鼠上胚层干细胞(Epiblast stem cells,Epi SCs)产生的外泌体中microRNA(miRNA)和mRNA的表达情况,揭示外泌体在DA神经元命运决定中的作用。方法:EpiSCs在添加了SHH和FGF8的N2B27培养基中增殖,通过单层分化(Monolayer differentiat