基于KNN-DPC聚类算法的RESTful API异常检测研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:WEIFINDYOU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析云平台接入日志中的RESTful API数据可以识别出当前访问者的资源访问动作是否存在异常。但RESTful API数据中正常类与异常类的高不平衡率使得异常检测模型的准确率下降,同时潜在的未知异常是已知异常以外不可忽略的安全威胁。为解决以上问题,本论文首先提出基于KNN-DPC聚类的RESTful API采样方法,解决RESTful API数据的不平衡问题,然后在此基础上提出基于聚类算法的RESTful API异常检测模型,使得异常检测模型不仅能防患已知异常也能对未知异常具有一定的敏感度,极大地降低平台受到的风险。具体完成了以下工作:1、针对RESTful API数据中的不平衡问题,提出一种基于KNN-DPC聚类的RESTful API采样方法,利用KNN-DPC聚类发现异常类中存在的小类簇,考虑到异常类离群点有可能是特殊的异常情况,筛选出异常类离群点集合,为其生成定量的新样本,并设计权重在非离群异常类样本中选取高价值的采样种子合成新样本。最后在类别重叠区对正常类进行欠采样,完成数据平衡。公开数据集上本文提出的采样方法在平均F-measure上比次高的采样方法高出2.15%,在平均Gmean上比次高的采样方法高出1.46%,在平均AUC上比次高的采样方法高出1.34%,这说明本文提出的方法在不平衡问题上具有一定的普适性。而本文提出的采样方法在真实数据集上F-measure方面最高提升了2.57%,G-mean方面最高提升了4.84%,AUC方面最高提升了4.8%,这表明提出的采样方法在真实场景下能平衡数据,提高模型的分类效率。2、在解决RESTful API数据不平衡问题的基础上,对于未知异常的识别问题,进一步提出基于聚类算法的RESTful API异常检测模型。该模型主要由RESTful API已知类型检测模型和RESTful API未知异常检测模型组成,前者使用平衡后的RESTful API数据集训练DNN模型,通过softmax层提供新样本的已知类型判别项;后者受到KNN-DPC算法原理启发,考虑未知异常类型的可能分布情况设计未知异常判别过程,提供新样本的未知异常判别项,通过两个判别项综合判断新样本的最终类型。在三个真实RESTful API数据集上的实验表明,该模型在面对不同的未知异常威胁时Marco-F1值最高能有14.11%的提升,Marco-Precision值最高能有25.01%的提升,Marco-Recall值最高能有27.77%的提升,这说明本文提出的异常检测模型具有较高的异常识别率,极大提高了实用性。综上所述,针对RESTful API异常检测中的不平衡数据问题和未知异常检测问题,论文从数据实际分布情况出发,基于KNN-DPC算法原理提出相应的解决方法和模型,有效地提高了RESTful API异常检测效率,具有重要的参考和实用意义。
其他文献
为了提高220kV大截面XLPE电缆在电力系统中的安全性,提出220kV大截面XLPE电缆绝缘局部放电在线监测方法。通过建立4种电缆绝缘缺陷模型,提取不同缺陷模型的局部放电信号,根据提取结果制定具有去噪效果的监测方案,采用GPRS网络传输监测数据,并利用小波变换原理,对监测信号进行降噪、去噪处理,实现对电缆局部放电的在线监测。实验结果表明,面对4种局部放电问题的在线监测方法,对照组的4种局部放电监
期刊
随着我国经济规模的不断扩大,电力作为各领域不可或缺的重要能源,其质量对工业生产、科学研究和日常生活都有着巨大的影响。近年来,电力系统的安全性和可靠性受到了大量研究人员和工程人员的关注。在过去的几十年中,在线电力监测系统被广泛应用于电力系统发电、输电、变电、配电和用电等各个环节,高度实时的电力监测系统为高效、便捷地维护大型电力系统提供了强有力的支撑。通过对现有电力监测系统中的数据传输技术链路和智能电
会议
目的:研究面部黄褐斑患者接受光子嫩肤治疗的效果。方法:使用电脑随机序列法将我院80例面部黄褐斑患者划分为两组,即对照组和实验组,每组40例,分别接受常规治疗和光子嫩肤仪治疗。对比两组治疗效果、皮肤性质。结果:实验组患者治疗总有效率为97.50%,对照组患者治疗总有效率为80.00%,实验组治疗有效率较对照组高,差异具有统计学意义(P<0.05);治疗前两组患者的皮肤色斑、纹理、紫质沉淀、皱纹、毛孔
期刊
情绪是一种结合了人的思想、认知、感觉和行为的综合状态。情绪在人与人之间的沟通交流、对事件做决策和对事物进行认知的过程中,起着必不可少的作用。近年来,运用信息技术手段对人的情绪进行正确识别受到了各个领域专家们的广泛关注。通过计算机视觉的方法分析面部微表情、自然语言方法分析文字包含的情感等都是对人类情感进行分析的重要手段。脑电信号(EEG)作为一种通过观察大脑皮层神经细胞的生理活动进而分析人体情绪的方
学位
学位
微生物检测和抗菌治疗与人类健康息息相关,快速检测和有效清除病原微生物对疾病治疗至关重要。传统的微生物检测方法如酶联免疫吸附检测(ELISA)、聚合酶链式反应(PCR)技术等,操作步骤复杂、耗时长且对仪器要求较高。另一方面,耐药性微生物的出现使得新型抗菌疗法的研发成为亟待解决的问题。聚集诱导发光分子(AIEgens)由于其出色的荧光和光敏性能,在微生物检测和抗菌治疗中表现出巨大的应用潜力。本文对AI
期刊
自2020年我国提出“碳达峰、碳中和”目标以来,商业银行已将绿色金融作为未来银行业发展的重要目标。近年来,商业银行主要通过绿色金融贷款形式,将资金集中投向企业B端开展绿色金融服务,而对零售C端的绿色金融发展模式仍处在探索阶段。商业银行应充分发挥客户资源的规模优势,将传统营销理论和网络整合营销原则相结合,开创C端绿色金融发展的创新商业模式,引导个人消费者参与绿色金融,从消费端刺激生产端不断向绿色低碳
期刊
随着电动汽车的快速崛起,私家车的持有率也在快速增长,城市交通系统受到严峻的挑战。合理设置交通设施、规划交通路线、实施分流方案可以有效减少道路拥堵时间、降低发生频率,从而减少安全隐患、提升居民幸福感,是智能运输系统(Intelligent Transportation System)的重要组成部分。交通流预测作为智能交通控制方法的重要步骤,一直以来受到学术界的广泛关注。交通流数据的时间、空间模式和随
学位
学位
身份识别技术通过分析云用户特征是否合法可以有效地识别出异常用户,在一定程度上保障系统安全。边缘计算网络作为云用户访问网络资源的第一关更加需要对云用户身份进行识别,但是由于边缘计算网络的特殊性,身份识别任务对时延和能耗更加敏感,因此设计符合边缘计算网络的身份识别任务分配策略更加重要。通过对现有身份识别任务分配策略的研究,本文取得了如下的研究成果:1.针对边缘计算中身份识别任务分配能耗和时延敏感问题,
学位