论文部分内容阅读
针对环境的威胁态势问题,态势估计的相关研究取得了一系列进展。态势估计属于一种高层次数据融合技术,它将众多传感器数据通过推理、融合,以得到关于当前环境威胁状态的估计值。决策者依据此估计值,可作出相应的解决方案。本文主要是将研究的态势估计算法应用于网络空间安全态势预估中,探索其对数据融合处理的可行性和有效性。本文基于生物免疫与图模型的态势估计框架采用自下而上,逐层融合推理的思路。本文的工作内容主要包括三个方面:1.本文提出了一种底层态势估计通用框架。该框架采用生物免疫算法与梯度提升树算法(GBDT)相结合的思路,生物免疫算法构建抗体与抗原基因库,GBDT算法为基因库中各基因编码。将未知网络行为与基因库实时做相似性检测,以相似度作为态势估计的结果。与传统的态势估计相关算法对比,该框架主要有三个优点。其一,因果关系可解释性。GBDT利用树的叶子节点位置编码比二进制编码有更好的可解释性。其二,挖掘特征间的隐性关系。基于GBDT的编码方式根据数据最佳分裂点学习出特征间的分类判断规则,它无需专家知识即可挖掘出特征间的隐性关系。其三,该框架具有高灵活性和低时间复杂性的优点。生物免疫算法的相似度检测,类似于模板匹配形式,可以人为灵活地添加基因(正常或异常行为),无需贝叶斯网络和深度学习的繁杂重新预训练,并且可并行化计算提升了预测速度。2.对于高层态势估计,传统方法主要是基于加权求和的方式,这样的方式没有重视空间中个体之间的关联性以及安全态势在空间中的影响性、传播性。本文引入图模型的相关理论,将空间的个体统一协调处理,利用D_S证据理论的知识不确定性推理来获得空间个体的关联性,突出重点节点带来的重点影响。通过实验对比发现,该方法与AHP算法一样客观、有效,但是本文的算法摆脱了专家知识限制,能解决大规模态势估计问题。3.目前关于态势估计的很多研究忽略了数据特征之间相关性的影响。冗余信息存在于高相关性特征中,这会导致准确性和泛化能力的下降。针对这一实际应用问题,本文提出了基于bagging学习的流式特征选择方法,高维特征的维数降低提高了预测的准确性,增强了框架的泛化能力。对比实验结果表明,本文的特征选择方法性能优于其他方法。综上所述,本文针对于态势估计存在的一些实际问题,提出一种基于生物免疫与图模型的态势估计框架,包括一个特征选择方法,一个基因库编码方式,一个高层态势融合方法,分别应用于高维度特征降维,挖掘特征间隐性关系,以及客观地表达出高层态势威胁值。