论文部分内容阅读
随着传感器技术的迅速发展,无线传感器网络被越来越多地应用到工业、农业、医疗、卫生等行业中。其中,将传感器节点散布在目标区域内,通过无线传感器节点采集目标区域内的环境参数(温度,湿度,CO2浓度等),可以实时监控散布区域的内部环境变化情况。为了能够及时准确地发现自然环境中的突发事件以及监测传感器网络的健康状况,提高无线传感器网络的可靠性,对传感器采集到的数据进行异常检测就显得尤为重要。传感器数据的特点主要是具有高维性,与处理一般的低维数据不同的是,对高维数据的处理会产生更大的空间和时间复杂度。本文将机器学习UCI数据库的四组真实高维数据集和一组人工合成高维数据集作为高维数据研究对象,通过引入两种数据降维模型(DBN与PCA模型),将数据从高维空间映射到低维空间,实现数据的降维处理,再结合机器学习中的分类模型的理念实现低维空间数据的异常检测,将数据分为正常和异常两类。该方法既能减小算法所需的空间和时间复杂度,又不降低数据异常检测率。本文的主要工作如下:1.提出了一种基于两种不同数据降维模型(DBN和PCA模型)的高维数据异常检测方法。异常检测方法分别利用深度信念网络(Deep BeliefNetwork,DBN)与主成分分析(Principle Component Analysis,PCA)两种数据降维模型,实现对高维数据进行降维处理,之后将经降维处理的数据输入到基于四分之一超球的支持向量机(Quarter-sphere Support Vector Machine,QSSVM)模型进行异常检测。该方法主要包括四个步骤:第一步是分别利用DBN模型与PCA模型对高维数据进行降维处理,将数据从高维空间映射到低维空间,实现对高维数据集的特征提取;第二步是对数据的归一化处理,将数据范围归一化到[0,1]区间且将数据集中到以原点为中心的位置;第三步是对QSSVM模型的改进,将模型的线性优化问题转换为排序问题,从而降低算法在空间和时间上的计算复杂度;第四步是将处理后的数据输入到改进的QSSVM模型中进行实时异常检测,通过将数据分为正常和异常两类从而实现对数据的异常检测。2.对本文所提出方法的性能进行评估。利用四组真实数据集和一组人工合成数据集,在MATLAB平台上进行仿真实验。通过不同度量指标对本文方法的异常检测性能进行评估。实验结果表明,DBN2-QSSVM方法相比DBN2-OCSVM,DBN2-QSSVM方法平均缩短了 90%以上的计算时间且提高了 6%以上的异常检测准确度;同样,PCA-QSSVM方法相比PCA-OCSVM,PCA-QSSVM方法平均缩短了 90%以上的计算时间且提高了 5%以上的异常检测准确度。