论文部分内容阅读
当网络故障产生时,会在相邻的节点间引发并产生大量的告警,它们之间必然存在一定的紧密关系,进行故障诊断,关键是分析告警相关性,压缩冗余无关的告警来定位出故障根源。数据挖掘技术可以解决相关性分析中关联规则来源的瓶颈问题并减少对管理人员以及专家的依赖。网络告警和网络故障原因之间存在着某种模糊的因果关系,而传统布尔逻辑难以描述两者间的这种模糊关系,而模糊理论的语言可以精确描述这一关系。另一方面,考虑到在大型的通信网络的分布式结构下,不仅要挖掘域内的告警模糊关联规则,而且要挖掘域间的关联规则。论文针对上述问题同时结合多域分布式网络的背景,将数据挖掘技术中的关联规则挖掘与模糊理论技术结合起来,完成对大型通信网络域内及域间告警模糊关联规则的挖掘。主要的研究内容以及创新点包括:1.鉴于原始告警不能直接进行规则的挖掘,论文对其信息字段进行了相应的提取,统一了信息模型。并结合大型通信网络多域分布式的结构特点提出了一种各个子域事务库提取机制同步建立告警事务库的策略。2.对告警事务库中的告警项量化处理后,针对传统的FCM聚类算法的模糊化技术在处理大规模告警数据时效果难以令人满意以及FCM算法的聚类效果和收敛速度对聚类中心的初始化值敏感的问题,论文提出了使用Canopy聚类先对数据进行“粗”聚类,再使用FCM算法进一步“细”聚类的基于Hadoop平台的CPFCM算法来对量化后的告警数据进行模糊化。仿真结果表明:MapReduce化的CPFCM算法比MapReduce化的FCM算法具有更好的聚类效果和运行速度,并且模糊化后的结果用于告警模糊关联规则挖掘效果更好。3.针对基于Apriori的FDMA算法需要多次扫描数据库,时间效率较低的缺陷,论文将基于Fuzzy FP-tree(频繁模式树)的模糊关联规则挖掘算法用于告警模糊关联规则挖掘中,并结合多域分布式网络的特点做了进一步改进,提出了局部-局部的基于Hadoop的FFPLLA(Fuzzy Frequent-Pattern tree Local-Local Algorithm)和全局-局部的FFPGLA(Fuzzy Frequent-Pattern tree Global-Local Algorithm)两种算法。通过仿真验证了两种算法具有良好的时间效率,并具有较好的准确率可以有效地挖掘多域分布式网络的告警模糊关联规则,为网络故障诊断系统的模糊推理模块提供推理依据。并进一步分析对比了这两种算法的优点、缺点及使用场景。