论文部分内容阅读
故障诊断与定位是网络故障管理的核心,当网络出现故障时,要求必须在尽可能短的时间内,正确地判断出网络故障所在的位置和引起故障的原因,以便及时排除故障,恢复网络正常功能。告警相关性分析是故障诊断与定位的重要手段之一,广泛应用于各种智能网络管理系统。数据挖掘为告警相关性分析中知识获取提供了新的途径。现代电信网及其网络管理是一个典型的分布式应用系统,管理功能的实现是依靠不同层次的管理部件协同工作来完成的。本文以国家自然科学基金项目《基于数据挖掘的通信网告警相关性分析》为背景,重点研究了电信网分布式告警关联规则挖掘,包括告警预处理、分布式关联规则挖掘算法与分布式告警关联规则挖掘系统的实现及仿真验证。本文采用滑动时间窗口机制解决告警时间同步问题,提取告警项目中反映网络故障的字段组成告警事务项,并用告警压缩的方法处理冗余告警,以便将原始告警数据库转化为告警事务数据库,为告警关联规则挖掘做好数据准备。本文针对电信网告警信息量大、告警具有突发性等特点以及告警数据库的分布式环境,引入共享模式的分布式体系结构,由局部站点和全局站点协同进行全局告警关联规则的挖掘。在已有关联规则挖掘算法的基础上,提出了一种适合分布式电信告警关联规则挖掘的新算法—EDMA算法。该算法在局部站点运行本文改进的基于压缩关联矩阵的CMatrix算法,避免了多次重复扫描数据库。EDMA算法通过对每次迭代产生的全局频繁项集进行顺序编号,将项集映射为编号数据对代替项集本身在网络上传输,使得在全局站点上可用散列表结构进行候选项集的快速匹配、存储,并实现了传输信息量的有效压缩。算法性能测试表明:该算法具有执行时间效率高、通讯开销小、可伸缩性好的优点。最后,本文通过采用IOCP机制构建通讯控制模块,使用内存池技术管理I/O数据缓冲区以及定制通讯协议来进行局部站点和全局站点的同步与数据交互,有效地解决了高性能挖掘服务器实现中的技术难题,完整实现了分布式电信告警关联规则挖掘系统。系统运行和测试结果表明:该系统能够快速而有效地挖掘出电信告警数据中有用的告警关联规则。