论文部分内容阅读
随着无线传感器网络(Wireless Sensor Network, WSN)应用的日益深入,海量数据的产生在WSN环境中也将变得越来越普遍。但是传统的如简单的数据查询等数据处理方式,不仅无法满足人们日益深刻的信息提取需求,而且完全不能适应海量流数据环境下大规模实时数据处理要求。而流数据挖掘技术能够探究隐含在海量流数据中有价值的信息,其中流数据聚类技术又特别适用于WSN环境监控技术的研究,这是因为聚类算法在解决模型先验知识不足的数据检测问题上有先天的优势。考虑到在WSN环境进行监控需要实时检测到各种行为模式的存在,本文所研究的WSN入侵监控问题,便尝试利用流数据聚类算法来解决。传统的监控方案如基于BP神经网络的入侵监控系统,其计算时间复杂度明显高于线性增长速度,难以实现WSN的在线入侵监控;另一方面以往许多入侵监控算法未能较好地解决监控未知网络入侵行为的问题。而本文设计了新的面向WSN的流数据聚类算法,能够有效地对未知网络入侵行为进行在线监控;其分布式的解决方案尝试进一步地解决集中式数据监控的处理方式易出现的数据拥堵等问题。以下说明本文的主要的工作为:1、设计了基于流数据聚类的网络入侵监控算法---DOExMiCluster。在借鉴吸收经典的流数据聚类算法CLUSTREAM设计经验的基础上,放弃在实时入侵监控中不适用的设计使得新算法的时间和空间复杂度得到了进一步的降低,同时设计若干个与以往算法不同的微簇(微聚类),实验表明较之DOExMiCluster算法能对正常网络行为进行更好的学习。2、WSN入侵行为监控只能利用少数能覆盖整个网络的节点来配置相关的计算单元,本文拟将微簇分割到各个单元中,构建一个基于分簇路由的分布式DOExMiCluster入侵监控系统,其中簇头、辅助计算节点、用于流数据转发的流导向模块等结构组成一个完整的计算单元,最后这些计算单元以环形流水线的方式组织起来,进行流数据条件下的分布式计算。实验表明基于DOExMiCluster的WSN入侵监控技术能够达到较高的入侵识别正确率和较低的误判率,满足严格的线性时间复杂度要求。其中分布式入侵监控系统在WSN中能进一步精确识别已知入侵行为。分布式系统模型的设计使得整个系统以环形流水线的方式处理流数据,适应了WSN中数据需要快速流转的特征。但是,本文没能很好地考虑在WSN环境中存在的数据异构问题,数据传输过程噪音问题以及当出现某个计算单元失效时监控系统容错问题等,这些都是需要在进一步的研究工作中解决的。