论文部分内容阅读
大数据时代的到来,政府、企事业单位对于信息化的投入不断加大,特别是近年来国家提倡向“大整合、高共享、深应用”的信息化目标,政府数据资源类别和数据量激增,个人数据集中度和敏感度进一步增加,数据利用和对外共享更加复杂,数据盗取现象、越权查询数据等造成政府已有个人数据信息泄露、侵犯公民个人隐私的现象不断发生,严重影响到政府信息安全,急需从新的技术手段如机器学习着手,进一步加强对政府数据资源的保护。近年来,公民个人信息泄露屡禁不止,时有曝光,已经成为媒体关注的热点问题,引发各类炒作,造成不良社会影响,严重影响政府机关形象,损害政府信息化发展成果。为此,本文拟通过某月份的应用日志数据,基于神经网络、决策树研究如何更有效的预测异常用户行为。一是研究人工神经网络、决策树算法的基本原理,重点研究了人工神经网络的特点和工作原理以及决策树的算法和适用的应用场景。二是抽取某月份政府应用日志数据进行了预处理与特征分析,建立基于人工神经网络以及基于决策树的用户行为异常审计模型。通过对两种模型训练数据进行设计、优化,逐步优化预测模型并对优化后的预测验证。三是根据决策树模型和神经网络模型对历史数据进行预测,得知神经网络模型有较明显的优势主要是在模型的拟合优度、对初始数据的仿真、模拟能力以及对新数据的预测能力方面。通过比较,深度神经网络模型在实验中主要优于决策树的方面是非线性映射关系、非线性函数动态处理能力、自组织自适应和自学习功能以及对变量的处理效果。