【摘 要】
:
随着互联网技术的发展,网络攻击变得复杂化、多样化,网络与信息安全面临前所未有的挑战。因此,如何准确、及时地检测出网络和设备中的异常事件,对于网络和设备安全具有重要的
论文部分内容阅读
随着互联网技术的发展,网络攻击变得复杂化、多样化,网络与信息安全面临前所未有的挑战。因此,如何准确、及时地检测出网络和设备中的异常事件,对于网络和设备安全具有重要的意义。目前,针对网络攻击的防御手段主要有网络防火墙技术、安全扫描技术、加密技术以及异常检测技术等,其中,日志分析是异常检测领域的重要手段,是网络安全主动防御体系的重要组成部分之一。传统日志分析方法通过规则对单条日志进行匹配分析,检测效果很大程度上依赖先验知识,不能及时检测出未知攻击。目前日志分析技术的研究热点是与机器学习算法相结合,异常检测的准确度和复杂攻击未知攻击的检测能力有明显提高,但不同的算法往往性能参差不齐,尤其是处理海量数据时,多数算法的计算复杂度过高,难以满足海量日志分析的要求,而Apriori算法在处理海量数据时具有明显优势,该算法能够挖掘出海量日志数据的宏观统计特征,用于异常检测时能够过滤掉大部分明显正常的数据,从而极大地降低后期工作量,提升异常检测的效率。因此,本文以系统日志数据为分析对象,将聚类算法和关联分析相结合,对异常检测技术做进一步研究和实现。本文主要工作如下:(1)提出了一种基于哈希存储与事务加权的并行Apriori改进算法,提高关联规则挖掘算法的性能。该算法首先利用哈希存储的去重特性对事务去重,在一定程度上压缩了数据集;同时将项集与事务集的映射存储在HashMap中,计算支持度时只需计算项集对应事务集的权重,从而减少扫描事务数据库的次数;最后利用MapReduce编程思想,并行计算候选频繁集的支持度,提高算法的运行效率。实验表明,与传统Apriori算法相比,本文提出的Apriori改进算法性能得到大幅提升。在运行时间上取得与FP-Growth算法相近提升效果的同时,又避免了 FP-Growth算法内存开销过大的缺点。(2)提出了一种利用关联规则挖掘算法进行异常检测的完整解决方案。该方案解决了处理海量日志数据时,异常检测效率低的问题。方案包括数据采集、特征选取和模型的训练与检测三部分。首先,从目标设备上采集网络与设备日志,构建实验数据集;然后对数据集做预处理操作,包括清洗和归一化等。将预处理后的日志数据转换成特征向量后,使用聚类算法将数据集分为正常数据集和候选异常数据集,再利用关联规则挖掘算法对正常数据集进行关联规则挖掘,建立正常行为规则库,从而完成异常检测模型的建立;最后将待测数据进行预处理、特征提取以及频繁模式挖掘,与正常行为规则库进行匹配,完成日志数据的异常检测。(3)设计并开发了基于日志关联分析的异常检测工具,验证了本文所提异常检测方案的有效性。首先对日志预处理模块、特征提取模块以及日志分析模块进行了详细设计,并搭建了 Hadoop分布式以及Spark并行处理环境,然后对相关模块进行了编码实现,并在实验室环境下进行了仿真实验,验证本文提出方法的可用性和有效性。实验表明,本文提出的整套异常检测方案能够有效检测出目标设备中的异常事件,检测效率有明显提升,具有一定的应用参考价值。
其他文献
N-S方程是流体力学中的核心的基本方程,是一个非线性偏微分方程,其高难度从以下问题中可见一斑:即使仅讨论其通解的存在性,也成为著名的"千禧年7大数学难题之一"。流体力学家
由于环境因素的影响,预应力锚索易产生腐蚀,降低结构的工作寿命,产生严重的安全隐患,造成巨大的经济损失。同时,预应力锚索深埋在混凝土结构中,导致锚索腐蚀具有时间随机性、空间随机性、隐蔽性等特征。此外,工程常用监测方法存在缺陷,对锚索的腐蚀难以实现长期有效的实时监测。因此,研究实际工程环境中的预应力锚索的腐蚀规律是有挑战性的。本文针对预应力锚索的腐蚀问题,进行基于螺旋分布式光纤的预应力锚索腐蚀规律的研
绩效评价管理体系是我国各级政府组织实施预算和目标资源治理的重要绩效评价手段。虽然目前我国的财政支出绩效评价制改革已经开始取得初步成效,但我国财政支出的绩效评价体系建设中的突出问题依然普遍存在。这主要是由于目前我国的财政预算资金支出的绩效评价管理体系的基本建设尚处于初期起步的阶段,财政预算的支出使用率和绩效评价管理水平不高,财政资金的绩效评价不能在实践中得到有效评价。本文通过研究预算支出绩效评价过程
当今世界经济环境风云变化莫测。经济危机,黑天鹅事件的发生,各国经济相互影响更加紧密,科学技术迭代加速等使企业所面临的环境更加复杂,也更加的严峻。时代在变化,时代要求也需要更加有能力的企业家为企业的发展引领方向、保驾护航。而与此同时,企业该如何发展,企业又该如何能做到基业长青,又该如何在竞争不断加剧,愈发激烈的环境中不被打败。本文认为企业应该,也没有选择的需要进行其战略变革。本文的出发点是每一位企业
针对某型相控阵雷达波束内跟踪目标数量较少的问题,为了实现对编队飞行卫星等空间多目标的连续跟踪和实时轨道测量,采用多目标航迹关联技术,利用波束内多目标的探测方式,设计
油茶果是植物油茶的果实,油茶果最主要的用途是用来榨油,榨出来的油脂含有较高的不饱和脂肪酸,营养价值极高,不亚于橄榄,被誉为“东方橄榄油”。由于油茶果具有如此高的营养价值和生产价值,国家一直在努力推广油茶果的生产及开采,将其作为天然木本食用植物油,但由于油茶果成熟后需要尽快采摘干燥炼油,所以我国乃至全世界现在采用的生产方式仍为先采摘油茶果,然后自然堆砌干燥,再经过人工剥壳及筛分,这种生产对天气的要求
在2017年1月9日出台《中共中央国务院关于加强耕地保护和改进占补平衡的意见》提出耕地数量、质量、生态“三位一体”保护的新要求以及提出“建立健全耕地质量和耕地产能评价制度,完善评价指标体系和评价方法”的背景下,其核心目标是保障耕地总生产能力在未来不降低,粮食安全有保障。因此,进行耕地产能评价调查精确掌握耕地生产力必不可少。同时现有的耕地产能评价制度为2012年发布的《农用地定级规程》以及2018年
当今的商业模式正在被全民推崇的大数据、人工智能等新一代的信息技术所改变,在这个动态、混沌的商业背景下,2019年我国汽车产销量再次蝉联全球第一,分别是2572.1万辆和2576.9万辆,而实现巨大汽车产销最后环节的汽车销售人员则发挥着重要的作用。因此,如何有效地利用绩效考核来提高汽车销售人员的实际工作绩效能力,成为众多汽车销售企业经营管理者关注的重点。但在实践中,一些汽车销售企业把绩效考核仅仅表现
随着信息技术的普及,各大新闻网站每天的新闻资源骤增,为了改善“信息过载”问题,学者们对新闻推荐一课题展开了广泛研究。现有的技术手段多为先提取新闻的特征,然后分析用户的兴趣偏好,从而根据两者的匹配程度进行推荐。值得注意的是,实际生活中的新闻包含的信息形式多种多样,除了文本外还夹杂着图片、视频、链接等内容,这些信息的异构性导致难以在统一的框架中利用这些信息,提取新闻特征的推荐系统变得过于复杂,而单是提
盲源分离技术是一种在只知道接收端混合信号的情况下,对源信号和混合信道进行估计的新兴信号处理技术。而其中,考虑到反射、折射以及噪声干扰的卷积混合盲源分离技术,由于模型更接近于真实的信号传输环境,成为了近年来的研究热点。卷积模型频域算法过程为:在经过短时傅里叶变换之后,时域上的卷积混合信号转换为频域上各频率点的瞬时混合信号,可以进行瞬时混合盲源分离。但是在通过逆短时傅里叶变换变回时域信号之前,必须对幅