论文部分内容阅读
随着Internet在全球的普及和发展,计算机网络已经和人们的学习、工作紧密的联系在一起。然而网络攻击与入侵行为对于国家安全、经济、社会生活造成了极大的威胁。因此,信息安全问题逐渐成为信息产业的焦点问题,并已成为国家安全的重要组成部分,也是决定国家经济能否持续高速发展的关键。入侵检测是信息安全技术的重要组成部分,涉及日志分析、漏洞检测、攻击路径检测等多种技术,这些技术在很大程度上依赖包括数据挖掘技术在内的多种数据分析和计算技术的发展。而数据挖掘结合统计和计算技术,从大量的数据集中获取有用的模式,从而能对数据库中数据属性、对象集进行有效的描述,产生指导性的规则集合,提供给决策支持系统。作为机器学习在数据库中的应用,数据挖掘研究可以在关联规则和序列模式等几方面对入侵检测、攻击路径检测等提供依据,从而为制定防护策略做出贡献。本文在理解数据挖掘算法的基础上,提出算法的改进方法,并着重研究将数据挖掘技术应用于网络安全审计数据中,对安全日志中的数据进行关联性分析,以发掘出入侵数据包的特征和攻击序列模型,从测试数据集中构造出入侵模型。本文前三章分别简要介绍信息安全,入侵检测和安全日志的相关概念和基本原理;第四章重点介绍数据挖掘技术,包括了关联规则分析,序列分析,分类分析和聚类分析;第五章论证数据挖掘技术应用于入侵检测系统的必要性和实施的系统架构;第六章详细说明实验流程和实验过程中对关联规则算法的改进,其中重点研究了运用K-均值算法对审计日志做预处理和在实现关联规则挖掘时,如何改进Apriori算法,使之能在面对安全日志这种高维度数据时比原有算法效率获得大幅度提高;在第七章中对所做的工作作出总结并对未来的