论文部分内容阅读
随着企业信息化水平的不断提升,企业核心业务越来越依赖于信息系统的可靠运行。对企业而言,任何信息系统用户所进行的异常操作,都可能会给企业带来不可估量的损失。因此,用户异常行为对企业造成的负面影响是一个无法忽视的问题,用户异常行为检测也成为当前学者的研究热点。 在各种用户异常行为检测方法中,数据驱动方法可以适应数据的复杂变化,所以采用数据驱动的方法进行用户异常行为检测。由于存在多种多样的数据驱动方法,因此,如何选择一种高效准确的用户异常行为预测方法,成为了本文的研究问题之一。此外,目前企业中的异常检测软件大多针对系统的软硬件本身而开发,很少有专门检测用户行为的系统,而且用户异常行为的分析处理过程耗时较长,有较多步骤都可实施自动化操作。因此,亟需开发一个用于预测用户异常行为的系统,帮助企业提高数据处理效率,增加数据价值。 为了解决这两个问题,本文以某船舶企业为例,采用特征工程的理论和方法,对信息系统日志数据进行了特征处理,并对相关分类模型与算法进行了详细的分析阐述和实验研究,并基于此设计了预测系统,最后提炼出了一个用户异常行为预测流程。本文主要研究和完成的工作如下: (1)日志数据的异常行为分类和特征工程构建。本文明确了异常行为的发生条件,将无监督的日志数据集转化为了有监督的用户异常行为数据集。然后运用特征匹配、构造、编码、缩放和降维的方法,对日志数据进行特征工程处理,得到了适用于深度神经网络模型的数据集和特征维度的重要性排序结果。 (2)深度神经网络模型预测。本文首先构建并优化了DNN模型,其次采用特征去尾的方法迭代测试了不同特征维度数量下的模型性能,得到了相对较好的预测结果,然后对比了每个维度下的不同行为模式发生率,并可视化了对比结果,分析发生原因,制定降低用户异常发生率的策略,最后对比分析了深度神经网络模型与多重线性回归、支持向量机的预测结果,阐述了深度神经网络模型的优越性。以业务部门为例,深度神经网络的预测召回率达到77.4%,优于支持向量机的74.86%;预测精度达到84.56%,显著优于支持向量机的63.03%。 (3)系统设计与预测流程提炼。结合相关理论方法和实际实验结果,本文基于此设计了一个预测系统,归纳了一个用户异常行为预测流程,并缩短了数据处理分析的时间,提高了预测的效率,让用户异常行为的分析变得更简单。