论文部分内容阅读
随着计算机技术和Internet技术的迅猛发展,计算机安全问题日益突出和复杂。由于入侵检测技术对网络安全起着重要作用,进行入侵检测技术研究具有重要的意义。现有入侵检测技术存在很多不足之处,特别是不能适应海量数据环境下对入侵检测建模的要求。
本文从基于数据库的知识发现开始,简要说明了数据挖掘技术应用于入侵检测领域的优点;随后按照数据挖掘的过程,选用网络嗅探器程序收集的包级网络数据作为构建入侵模型的训练和测试数据集,详细地说明了对该数据集的处理方法和过程:首先根据传输层TCP和UDP两种协议分解原始数据集,分别得到TCP报文和UDP数据报;然后按照TCP连接的目标服务类型,进一步对TCP报文数据分解;利用TCP连接四元组,得到每一次TCP连接的报文块;从这些报文块中提取出网络连接的基本特征属性,形成可以供关联规则算法学习检测模型的网络连接记录;对于在实际数据处理中遇到的各种问题,也讲行了分析并给出了解决的办法。
论文的第四部分,详细的研究了各种数据挖掘方法的优缺点,再根据入侵检测网络记录的特点,选择了关联规则算法中的一个算法-Apriori算法,并且将其改进以适应入侵检测。然后通过收集大量的黑客软件进行实验,虽然有些方面做的还不够,但是在检测的自适应能力上取得了良好的效果。因此,本文提出的误用检测模型具有较好的检测性能。