论文部分内容阅读
网络安全是当今世界最受关注的全球议题之一,每年全球因为网络攻击而蒙受的损失多达数千亿美元,随着损失逐年扩大,如何有效防止网络攻击成为了各国学者关心的议题,其中采用数学模型刻画网络风险以期有效地防御正成为越来越流行的研究方向.本学位论文依托极值理论模型对单个受攻击目标(例如电脑服务器)的风险进行建模和预测,采用多元相依模型对多个攻击目标的整体网络安全的风险进行评估.我们首先考虑单个被攻击目标的网络安全风险进行预测,即一维数据情形下的模型模拟.我们采用的是基于广义Pareto分布的极值理论模型.即对目标数据先设定一个门槛值(threshold),我们的目标数据是时间序列数据,当数据超过门槛值我们即认为极端事件发生,然后将时间序列中超过门槛之上的极端事件提取出来,对这部分数据我们假设在超过门槛值的条件下其分布服从广义Pareto分布,而极端事件在整个序列中服从动态Poisson过程.基于这样的模型假设我们进行拟合以及对未来的攻击事件进行预测.对于模拟的结果我们构造W统计量和转化时间间隔τ进行拟合效果假设检验.对于预测的结果我们构造在险价值VaR(Value at risk),采用经典的三大假设检验LRuc,LRind和LRcc对模型进行评估,评估的结果非常好,证明了极值理论模型的适用性.然后我们对多个被攻击目标进行整体的网络安全风险评估,即多维数据情形下整体的模型模拟.我们采用多维相依结构来刻画各个目标被攻击风险之间的关系,而最常用的多维相依结构就是Copula.Copula方法种类众多,在本文中我们采用的是正则藤Copula(R-vine).由于本文分析的多维数据高达69维,如果直接采用R-vine结构计算量过于庞大,仅有PC电脑的情况下难以完成模型的拟合和预测,我们需要对模型进行合理的简化.这里我们采用的是截断方法:截断R-vine结构,也即对于整个copula结构,从某一级树开始,假设其后的相依结构均为独立情形进而大大减少计算量.模型的简化很有可能会带来预测精度的下降,所以截断的级数选择需要进行严格的检验以期在计算量和精度之间达到一种合理的折衷.具体的处理细节将在正文中详细介绍.对于模型的预测效果同样构造VaR,采用LRuc,LRind和LRcc对模型进行评估,所选模型同样通过了所有假设检验.本文我们对一维数据模型和多维数据模型的特性以及优缺点进行总的概括评估,这些模型对安全风险刻画级数的发展既有其贡献和创新点,同时也有局限和未能解决的问题,基于此对网络安全风险未来的发展方向提出一些设想,将给出可能的新研究方法以及后续的研究计划.