基于机器学习的流量异常识别方法

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:wfj0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了有监督学习异常检测系统和对网络流量访问控制的应用。监督异常检测是一种入侵检测系统,能够根据数据标签的先验知识对不同的流量进行分类并检测异常行为。访问控制旨在根据用户特权和行为来规范对敏感信息的访问。有监督监督学习异常检测的一个主要问题是检测方法在准确性和误报率方面的性能无法预测。本文利用机器学习算法对网络流量进行分析,并将其分为正常或异常流量。此外,我们通过结合异常入侵检测系统和访问控制评估工具,研究提高准确率和降低误报率的可行性。为了达到我们的目的并克服这些问题,我们提出了一种异常检测和访问控制相结合的方法。在本文中,将逐步介绍我们提出的方法、实验和结果。该方法包括数据提取、异常检测和警报验证三个步骤。在每一步中,我们都会使用适当的工具来进行实验和验证。数据提取的目的是捕获网络流量并选择特征。我们选择使用Wireshark作为特征获取器和数据包分析器。通过对采集数据的分析,我们可以选择特征并提取数据集。异常检测步骤执行异常检测算法来检测异常实例,且利用MATLAB接口工具来进行异常检测。本论文通过在MATLAB接口中建立基于机器学习算法的有效入侵检测系统(IDS)模型,并通过数据提取、异常检测和警报验证来使用访问控制系统,主要集中在异常流量识别上。该模型将用于有监督学习过程中对正常流量和异常流量进行分类,并提供实例来说明如何减少误报的同时授予用户访问权限。目前已存在大量的工作来识别网络运动中的异常流量。异常流量的识别在计算应用中是非常重要的研究方向。此类算法可以识别早期异常,因为可以大大降低对系统的危害。本研究主要通过分析通信中异常流量的特点、特征和属性,研究基于监督机器学习算法的异常流量识别方法。实验工作将分为如下两部分:第一部分:实验中使用MATLAB作为验证机器学习算法的平台,我们将分析和比较三种机器学习算法:SVM、K-NN和RF。实验表明这些算法能有效识别异常行为,并减少构成大部分流量活动的假警报。在此过程中分别使用每个单独的模型,他们的模型的性能由信用卡客户数据集评估。实验结果表明,与K-NNN和RF相比,SVM具有较高的识别能力。由于SVM算法的准确率较高,因此以SVM算法为核心,说明其在识别过程中的识别速度快、准确度高。该方案通过SVM、KNN、RF学习从识别精度、检测速度等方面对流量分类中的识别精度和检测速度进行了评估,证明该方案效果良好。第二部分:实验的这一部分介绍了一种使用深度学习模型的异常检测方,特别是前馈神经网络(FNN)模型和卷积神经网络(CNN)模型。通过使用流行的NSL-KDD数据集进行的几次实验评估了模型的性能。实验结果表明,FNN,CNN和SVM模型不仅具有强大的网络异常检测建模能力,而且具有很高的准确性。随机森林,K-NN和SVM等几种传统的机器学习方法相比,所提出的模型具有较高的准确性和检测率,且误报率较低。深度学习模型可以有效地提高检测准确性和识别异常类型。实验中利用ROC曲线对异常检测算法的性能进行了分析,并给出了相应的评价指标。警报验证步骤是针对访问控制策略和请求的异常实例的验证过程。策略和请求在XACML中定义,并使用SAFAX工具进行评估。为了证明所本方法的有效性,我们使用了针对消费者,客户,组织的案例研究,该案例研究涉及多个国家网络流量中有关直接和间接攻击和虚假警报的情况。UCI网络所持有的流量调查的不同组成部分之间的通信,其中网络流量的数据已被采集。本文的研究成果是根据我们的研究案例,开发了一个能够成功识别、评估和验证特定网络内用户的后验访问控制系统。该系统能够有效结合监督异常检测和访问控制的优点。首先,总体框架对各个模块的工作流程进行了详细的说明,并给出了利用三种不同的算法和参数识别异常流量的实验工作。其次,详细介绍了各个模块的代码实现方法。在最后一部分,我们对系统进行了评估。首先,简单介绍评价标准,然后,利用支持向量机、KNN、RF等算法实现了对整个系统中异常流量的识别和预测。实验表明,SVM和KNN在任何网络环境下都能以82.45%和80.75%的准确率出色地完成小型局域网的异常流量识别任务,在MATLAB界面中,与其他两种方法相比,RF的下降幅度低至65.55%,表明其在有效识别异常流量方面的不足。这为基于深度学习模型的异常检测方法的研究提供了更好的依据,特别是前馈神经网络(FNN)模型和卷积神经网络(CNN)模型的研究有待改进。实验中选用了NSL-KDD数据集,通过几个实验对模型的性能进行了评估。实验结果表明,FNN、CNN和SVM模型不仅具有较强的网络异常检测建模能力,而且具有较高的准确率。随机森林、K-NN、SVM等传统机器学习方法相比,该模型具有较高的准确率和检测率,且误报率较低。深度学习模型能够有效地提高检测精度和异常类型识别能力。本文实验中以KDDTrain+作为训练集,KDDTest+和KDDTes t-21作为测试集。实验结果表明,与其他机器学习方法相比,网络异常检测模型与SVM的准确率分别为80.34%和77.80%。本论文包含47张图,30个表和参考文献124篇。
其他文献
健康传播涉及很多专业的医学科学内容,要让公众更好地知晓、理解基本的健康知识,就要掌握一定的传播学相关知识,将科学传播与健康传播相结合。微信凭借其庞大的用户群体、便
期刊
川25井是在四川盆地唯一发现的富钾卤水深井,所含溴、碘、硼、锂等微量元素均达到单独开采的工业要求。本文采用氢、氧、硫、碳稳定同位素组成和氚同位素,并结合区域水文地质
会议
企业安全生产责任制的落实需要持之以恒,做秀式、运动式的开展安全生产,注定不能长治久安,花心思花力气、花成本,以身作则,建章立制、按章遵行,维护制度的严肃性,是落实企业
以“丁香医生”为例对健康类新媒体平台的营销模式进行个案研究,可发现其营销持续增长的核心要素是以人为核心、以优质内容为内驱动力的整合营销传播,通过健全机制保障内容质
中小企业为我国国民经济和社会发展做出了重要贡献,随着企业改制的不断深化,绝大多数中小企业已经转为私有。中小企业会计控制失范已是不争的事实,就其成因进行分析并提出对
通过高职院校工科类高等数学教材的编写与实践,以及对教材编写的认识,好的教材可以启发学生思维、引导学生创新。提高教学效果和教学质量,引导教学改革和教学思想的转变。并
企业的营运能力关系到企业的生存和发展,同时也会影响到其获利能力和偿债能力。如果公司对营运能力的监管不到位,会产生诸多问题。因此,企业应当加强营运能力的分析,这样才可
一、夏季宜吃甘凉、生津的食物 夏季属火,是阳盛的季节我们身体的阳气在夏季也会跟着旺盛,而身体的阴液就会跟着减少,所以应陔选择清热生津止渴的食物来补充阴液。这类型的食物
城市轨道交通具有运量大、安全快捷和污染小等特点,近年来快速发展,整体能耗随之迅速增长。城轨系统能耗分为牵引能耗和动力照明能耗。列车运行时的牵引能耗占总能耗比重最大,且随客流量、线路条件和驾驶策略等因素变化。排查牵引能耗异常情况是发现能耗波动原因的重要手段,而数据中的特征值和异常值能够为排查异常情况提供定量依据。在实际工作中将超过统一阈值的能耗数据判为异常值,没有考虑能耗模式的变化,易出现漏报和误报