论文部分内容阅读
随着网络服务需求的日益增长,网络功能虚拟化应运而生。网络功能虚拟化通过软硬件资源解耦,网络管理者无需投资安装和维护昂贵的专有硬件来建立网络连接设备的服务链,同时,网络管理者可以花更少的时间来管理数据中心,降低了资本支出成本以及运营费用。然而,网络功能虚拟化在提升网络效率的同时,也给网络管理带来了一些新的挑战,网络可靠性问题研究成为网络功能虚拟化完成商业化的重要保证。网络功能虚拟化之后,与传统的物理节点相比虚拟节点更加复杂,同时虚拟化的过程也会占用额外的系统资源,这些新变化使得网络功能虚拟化环境下的网络更容易发生故障,更容易产生故障干扰和故障传播。在这样的背景下,本文研究了网络功能虚拟化环境下的故障管理技术,分为故障检测以及告警相关性分析两部分内容。对于故障检测,由于网络功能虚拟化环境下难以获取有标签数据以及数据维度较高的特点,传统的数值检测技术和有监督的机器学习方法均不适用于网络功能虚拟化环境下的故障检测,因此,本文研究了基于无监督机器学习方法的网络故障检测机制。本文针对现有检测机制均有其检测盲区的特点,并提出了一种利用无监督检测算法集成进行故障检测的故障检测机制,对应用比较广泛的自组织映射算法、本地离群因子算法和孤立森林算法进行了集成,有效改善了单个检测算法存在的检测盲区,提高了算法的检测准确性。此外,本文还修正了网络负载变化带来的误检,进一步提高了检测准确性。对于告警相关性分析,由于网络功能虚拟化的分层架构,一个发生在下层的故障可能触发上层的一系列链式反应,会导致大量告警的同时爆发,同时由于网络功能虚拟化环境业务的动态变化很强,导致难以得到网元间的映射关系,无法得知底层网络拓扑信息。针对网络功能虚拟化环境下告警相关性分析的特点,本文对现有的关联规则算法进行了分析对比,首先利用FP-growth算法对WINEPI算法进行改进,提出了Improved-WINEPI算法,以加速二项频繁集寻找。为保证规则准确性,本文利用父子告警间时间相关性对Improved-WINEPI算法进行了规则验证,以去除无效规则,提高关联规则准确性。在得到关联规则后,本文利用根因图进行根因分析,以寻找根告警,帮助网络管理员快速找到故障源。