论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程。任何有数据管理和知识发现需求的地方都可以借助数据挖掘技术来解决问题。
本文对数据挖掘的算法以及数据挖掘技术的应用展开研究,重点研究了聚类算法和数据挖掘技术在入侵检测系统(IDS)中的应用。针对数据挖掘的聚类分析,提出了一种基于层次聚类的模糊聚类算法(HFC),该算法采用凝聚的层次聚类方法来快速地发现高度聚集的数据区域,并对这些高密度区域进行进一步地分析与合并,通过评估函数的评估,最终找到最优的聚类方案,该算法的有效性通过仿真实验得以验证。针对数据挖掘技术在入侵检测系统中的应用,论文首先提出了一种适用于IDS中数据分类的数值归约算法,该算法一方面将特征值数目减少,另一方面将孤立的点放大为一个区域以便预测类似行为;论文通过以MIT的KDDCup99数据集为数据源,以决策树归纳分类算法为例的仿真实验验证了该算法对IDS的有效性。论文接着提出了一种适用于IDS的基于相关性度量的特征选择算法,该算法依据特征的相关性度量值进行特征选择,可以在不影响效率的同时降低时间复杂度;论文以分类器作为评估系统,KDDCup99为数据源,通过仿真实验验证了该算法的有效性。
论文对与课题相关的技术进行了介绍,分析了将数据挖掘技术应用于IDS的意义和IDS数据源的特点,描述了所提出的各个算法及其仿真情况,基于仿真结果对各算法做出了评价,提出了下一步的研究目标。
论文对数据挖掘技术的应用做了有益的研究。