论文部分内容阅读
随着计算机网络的高速发展及其所承载信息的日益丰富,互联网给人们生活带来了极大便利。然而,互联网中时常发生的大规模网络中断事件同样给人们生活带来了挑战。作为保障互联网安全的有效手段之一,基于主动测量的网络中断检测技术一直受到国内外学者的广泛关注。然而,现有的基于主动测量的网络中断检测技术面临着诸多挑战。首先,现有方法需要部署大量探针,获取检测区域内所有链路的网络状态信息,而探针的管理和部署需要耗费大量的人力物力。其次,现有方法需要对所有目标链路的状态信息进行建模分析,同时并未考虑模型选择的合理性,导致检测时间过长。最后,现有方法并未对网络中断事件的影响进行刻画和评估,导致网络管理者无法对大量网络中断事件进行优先级排序并优先处理破坏性的网络中断事件,进而影响维护效率。针对现有基于主动测量的网络中断检测技术存在的问题,本论文以降低检测代价,减少检测时间,刻画事件影响三个方面展开了深入的研究分析,主要的贡献和成果概括为三个方面:(1)提出了一种基于关键链路的网络中断检测方法现有的基于主动测量的网络中断检测方法需要部署大量探针对检测区域内的所有链路进行探测来获取测量数据,而管理大量探针需要消耗大量的人力物力。同时,大量的主动探测会向网络注入额外流量,进而占用网络的链路带宽,降低网络流量的传输速度,增加网络负担。为了应对上述问题,本文提出了基于关键链路的网络中断检测方法。首先,对检测区域内的测量数据进行分析处理,获取检测区域内所有链路的流量信息及其连接关系。其次,分析每条链路的流量信息、连接关系和距离探针的位置,提取检测区域内的关键链路。基于识别的关键链路,获取其于往返时间(Round Trip Time,RTT)测量值,并计算得到关键链路的RTT临界值。随后,通过观察关键链路RTT实际值是否超过临界值来检测网络中断。最后,利用两个历史事件来评估所提方法,结果表明本方法能够有效地提取检测区域内的网络中断事件,并且能够大量减少所需监测的链路。(2)提出了一种基于链路聚类的网络中断检测方法现有的基于主动测量的网络中断检测方法需要对大量链路的性能数据进行建模来检测网络中断,这会增加检测时间、耗费监测成本。同时,现有方法并未考虑统计模型选择的合理性,由于网络测量的随机性,统计模型的选择直接影响了网络中断检测的准确性与时效性。为此,本文提出了基于链路聚类的网络中断检测方法。首先,基于链路RTT会受到与其特征相似的邻居链路RTT影响这一基本事实,提出了基于种子区域生长的链路聚类算法。该算法通过考虑链路之间的拓扑连接关系以及链路RTT时间序列的的相似性,将检测区域内的链路聚类成不同的链路集。其次,本文通过考虑统计模型的拟合度和复杂度,提出基于聚类结果的模型选择算法,为每一类链路集选择合适的统计模型并对其包含链路的RTT进行建模。基于建模分析得到的RTT概率密度,提出了基于建模结果的大偏差网络中断检测算法,通过比较当前链路的RTT概率密度与建模结果之间的偏差来检测网络中断。与现有的方法相比,基于链路聚类的网络中断检测方法能够有效地减少建模和检测时间,满足网络场景对网络中断检测方法的时效性要求。同时,通过历史事件验证,该方法在检测准确率和误报率两个指标都取得了优异的效果,可满足网络场景对网络中断检测方法的准确性要求。(3)提出了一种基于事件影响的破坏性网络中断事件提取算法现有的基于主动测量的网络中断检测方法并未对网络中断事件的影响进行评估,导致在实际部署中,网络管理者无法对大量的网络中断事件进行排序来确定优先处理目标,进而影响了维护效率。因此,如何对网络中断事件影响进行有效刻画,并提取破坏性的网络中断事件是本论文关注的重点。本文首先提出网络中断事件推断方法,通过聚类随时间推移发生类似变化的路由路径,有效地推断网络中断事件并准确地识别其根本原因。基于推断出的网络中断事件,本文提出网络中断事件影响的刻画方法,提出五个特征对网络中断事件的位置、严重性、范围、拥塞效应和持续时间进行刻画。最后,提出基于事件影响的网络中断事件过滤方法,以假阳性和假阴性最小为目标确定特征的阈值,并提取满足所有特征阈值的网络中断事件,即为破坏性的网络中断事件。实验结果表明,本算法能够有效地刻画网络中断事件的影响,提取破坏性网络中断事件,并且准确地识别这些事件的根本原因。