【摘 要】
:
大数据时代下,传统的异常流量检测采用静态规则匹配的方法,已然不能满足多变复杂的网络环境。而机器学习由于其自学习、自演化的特性,不但可以检测出异常流量,而且可以对未知的异常进行标记识别,因而采用机器学习方法进行异常检测已经成为网络安全领域的研究热点。由于机器学习依赖于数据的处理和学习模型的构建,因而在进行异常流量检测时,具体有两个问题需要解决:一是减少原始数据产生的干扰,去除冗余数据,降低异常检测的
论文部分内容阅读
大数据时代下,传统的异常流量检测采用静态规则匹配的方法,已然不能满足多变复杂的网络环境。而机器学习由于其自学习、自演化的特性,不但可以检测出异常流量,而且可以对未知的异常进行标记识别,因而采用机器学习方法进行异常检测已经成为网络安全领域的研究热点。由于机器学习依赖于数据的处理和学习模型的构建,因而在进行异常流量检测时,具体有两个问题需要解决:一是减少原始数据产生的干扰,去除冗余数据,降低异常检测的时间开销;二是需要一个高效的方法来提高异常检测的准确率与精度。针对这两个问题,本文采用机器学习中的流形学习和GBDT方法进行异常检测,并且将异常检测分为数据预处理和数据分析两个部分。第一部分是网络数据的预处理阶段,主要解决网络数据的降维问题。网络流量数据由于其内部结构复杂,数据体量巨大、种类繁多,并且存在冗余数据,在进行数据挖掘和信息处理时,会有巨大的计算量,从而降低分析处理的效率,因而需要对高维网络数据进行降维处理。基于此,本文提出一种有监督判别投影的流形学习降维方法,该方法在考虑类别信息的基础上进行有监督降维,降维投影之后能够实现同类数据聚集,不同类数据分散的效果。同时通过对高维数据进行降维操作,可以有效降低数据量的大小,从而避免过大的计算量,并深入挖掘网络流量数据的本质。第二部分是数据分析阶段,主要解决异常检测模型的分类准确性较低的问题。本文在考虑不同类别数据的分类代价不同的基础上,提出一种基于代价敏感的随机GBDT异常检测方法。该方法首先将代价矩阵引入到损失函数的设计中,建立代价敏感损失函数,降低不同类别数据的分类代价;而为了减少计算量并提高计算速度,将随机梯度提升思想引入到GBDT方法中,在GBDT的决策树构建中,随机选取训练集的一部分。通过对GBDT方法的改进,本文提出的基于代价敏感的随机GBDT方法可以有效提高异常检测的效率。最后,通过仿真实验证明了本文所提出的有监督判别投影方法在不同类别数据上进行数据分离的优越性,以及所提出的基于代价敏感的随机GBDT异常检测方法在提高异常检测效率上的有效性。通过数据预处理阶段和数据分析这两部分的实验分析,证明本文所提的方法可以有效提高异常检测的准确率。
其他文献
换流变压器处在交流电与直流电相互变换的核心位置,良好的内绝缘是保证其安全可靠运行的前提条件。换流变压器在运行中将承受交直流电压和极性反转电压的作用,面临的关键问题
伴随着世界经济的迅猛发展,环境问题也日益严峻,严重违反了人类可持续发展的目标。为了净化和修复环境,众多科研工作者采用了各种各样的方法,例如生物法、物理化学法、高级氧化技术等。半导体光催化作为高级氧化技术中的一种方法,由于反应条件比较温和、几乎能降解所有的污染物等优点,成为了解决环境污染问题一种很有前景的方法。光催化技术的核心要求是开发出高效的光催化剂。但是,被研究最多、公认高效的Ti O_2光催化
本论文通过合成聚合物基功能微球提高了材料的基本性能,而且赋予了材料新的特性,随着制备方法及表征手段的日益成熟,功能性微球的合成已成为功能材料研究的重要领域。淀粉是
细菌是生物地球化学循环的重要参与者,在海洋高分子量有机质的降解中起重要作用,但是目前对于海洋细菌降解高分子量有机质的能力和机制仍然不完全清楚。假交替单胞菌(Pseudoa
呼吸道疾病既包括慢性阻塞性肺病、哮喘等非传染性疾病,也包括病毒性肺炎、肺结核等传染病。特别是今年新型冠状病毒全球肆虐,人们日益重视起呼吸道疾病,设计一款针对呼吸道疾病的生命体征监测系统显得尤为重要。考虑到现有的监护仪价格昂贵,因此,本文只针对脉搏频率、血氧饱和度、呼吸率和体温这四个与呼吸道疾病密切相关的生理参数,设计了一款超低成本的监护仪,并可无线联网,接入生理参数监控服务器。本文首先介绍了四个生
马尾松是我国南方主要的造林树种,其苗木质量的好坏对于造林的成败具有关键作用。形态学指标、生理指标和动态指标是评价苗木质量的三个主要方面。传统的测量方法不仅过程复杂,耗时长,而且精度不高并对苗木本身有损害,因此研究高效、经济、无损的测量方法显得尤为重要。本文旨在马尾松苗木生理指标与生长速率测定关键技术研究。分别采用近红外光谱检测技术和激光散斑技术完成对马尾松苗木生理指标和根生长率指标的快速精确的检测
随着强风灾害频繁发生,森林作为抵御风灾的天然屏障受到的损伤也越来越多,轻则叶片大面积脱落,林内枝干折损,重则单株林木连根拔起,大面积林分发生倒伏现象,使国民经济遭受损失,因此对于森林在强风力载荷下内部流场分布特征进行研究对研究者来说是迫在眉睫的事。通过分析风力分布特征获得强风力下林木内部流场运动情况不仅为树木安全性评估供理论依据,也为防风林种植供可靠依据。本文针对树木安全性评估做了以下几点研究:1
随着社会主义现代化建设的推进,面对能源供需格局新变化、国际能源发展新趋势,加大能源供应量已然成为促进当前经济高质量发展的必然手段。电能作为主要能源需求对象之一,在
2008年“5.12”汶川特大地震发生后极震区连续多年暴发了特大型泥石流,表现出群沟暴发、规模大、范围广、持时长、危害重等特点,导致地震后泥石流相关治理工程部分失效。其中主要原因之一便是对强震区沟道型及高位滑坡型泥石流致灾机理认识不足,治理方案没有区分宽缓、窄陡沟道型与高位滑坡型泥石流致灾特点,相应的防控措施缺乏合理的优化组合。传统泥石流防治理论与技术不能完全满足强震区泥石流治理的特殊需求。按照党
在铅锌尾矿中,黄铁矿、磁黄铁矿等矿物经水解后可形成具有吸附能力的水合氧化铁胶体,同时酸性矿水从低含量的尾矿中溶解出的铅与选矿废水中大量未被利用的选矿药剂黄药可形成