面向大规模网络安全态势分析的时序数据挖掘关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:lijiarose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络安全态势分析能够帮助网络管理者了解大规模网络的安全状态,并能为管理决策提供依据,因此近年来日益受到了政府和研究机构的关注和重视。为了获取大规模网络安全态势分析所需的基础数据,一些威胁检测工具被部署在了骨干网络上。由于对性能有较高要求,这些工具往往会采用专用化方式部署,因此产生出的数据的可关联性较差,难以通过小规模网络安全分析中常用的关联分析法进行处理,而一般只能通过统计分析来提取其中的信息。这些统计分析信息随时间变化所形成的网络安全时序数据可以反映出网络风险的变化,因而大规模网络的安全态势分析很大程度上依赖于对这些网络安全时序数据的有效挖掘。本文面向大规模网络安全态势分析的需求,以“863-917”网络安全监测平台所采集到的木马数据以及蜜网系统所获得的僵尸网络数据为实例研究对象,针对网络安全时序数据进行挖掘研究,从发现这些数据的特殊变化和提供决策参考的角度提取出几个关键性问题进行了研究。主要工作包括:1、伪周期网络安全时序数据异常波段检测。许多网络安全时序数据具有典型的伪周期特征,其中异常波段的出现往往表明网络安全风险发生了一定变化,具有进一步深入分析的必要。由于网络环境具有不稳定性,因而通过引入具有较好偏移适应性的动态时间弯曲距离作为不同波段间的相似性度量,可以有效地检测出有较少历史相似波段的异常波段。在此基础上我们提出了一种基于聚类索引的异常波段检测方法用以加速该检测过程。在木马数据集和僵尸网络数据集上的实验表明该方法能以损失一定检测准确度为代价,取得比直接基于DTW的算法更高的检测效率。2、基于小波概要的网络安全时序数据流区间差分skyline查询。在进行网络安全态势分析的过程中,需要从大量同构的网络安全时序数据里选择出某些具有特殊性的数据作为重点关注对象。基于量值度量,现有的区间skyline查询有时不能满足网络安全应用的需求,且可能存在“淹没”现象。为此本文提出区间差分skyline的概念,面向特定时间区间内的数据增长属性进行处理以弥补现有研究的不足。并利用小波参数的差分性质,在网络安全时序数据流处理的背景下,给出了在常用的小波概要上快速进行不同粒度区间差分skyline查询的算法。在多地区、多种类木马数据集上的实验验证了本文所提方法能够在一定程度上避免基于量值度量的区间skyline查询的不足,并且与直接使用部分逆小波变换的算法相比有较低的计算复杂度。3、多维网络安全时序数据相似子序列搜索。历史相似子序列可以为网络管理者提供决策参考依据,并可用于对网络安全时序数据的定性预测。为了能够更好地利用近期出现的数据,本文通过引入数据立方体模型将相似子序列搜索问题扩展到了多维场景。继而利用数据立方体相邻层次单元间的相关性对搜索算法进行了改进,从而提高了搜索效率。在多维木马数据集上的实验验证了本文所提方法能够在具有多维组织结构的网络安全时序数据中搜索出更多有价值的匹配结果,并且能在保证准确性的基础上提高搜索算法的效率。4、网络安全时序数据预测。预测问题长期以来备受关注,同时也是网络安全态势分析中的一项重要需求。网络安全时序数据变化复杂,影响因素众多,难以对其建立合适的预测模型,因此传统的预测方法对此类数据的预测准确性往往较差。本文从基于案例推理的思想出发,通过引入事件序列分析领域中频繁情节的概念和方法为网络安全时序数据预测问题提供了新的解决思路。在此基础上针对具有不同特征的数据给出了利用均值特征和趋势特征进行预测的具体方法。通过在木马数据集和僵尸网络数据集上与其它几种常用预测方法的比较实验表明,本文所提出的方法在预测网络安全时序数据时具有较高的预测准确性。综上所述,本文的工作针对大规模网络安全态势分析背景下的时序数据挖掘问题,围绕着该问题在实际应用中涉及的若干个关键技术进行研究。本文对于促进该问题的理论研究和实用化具有一定的理论和应用价值。
其他文献
试验资料管理是临床试验的重要部分,试验档案具有资料多、跨时长、保密性强等特点。本文分析了临床试验各阶段常见的资料管理问题,依据实践经验针对问题探讨相应措施,建议从
表皮生长因子受体酪氨酸激酶抑制剂(epidermal growth factor receptor-tyrosine kinase inhibitor,EGFR-TKI)治疗非小细胞肺癌已获得较好的疗效,患者生活质量明显改善。但EG
茶叶质量安全是食品质量安全的重要组成部分,也是当前我国茶产业发展与茶学研究的热点课题,有效控制与降低有毒重金属含量及防止超标又是保障茶叶质量安全的技术关键点。茶叶
目的:观察DC-CIK联合化疗加靶向治疗治疗晚期结肠癌的疗效及安全性。方法:选取晚期结肠癌患者,DC-CIK联合化疗加靶向治疗(奥沙利铂+卡培他滨+贝伐单抗)为联合治疗组(30例),同
笔者主持了湖南省矿产资源利用现状调查矿区资源储量核查试点工作,从试点矿区的选择、试点矿区的资源储量核查工作过程中发现了一些具代表性和普遍性的问题,提出了解决方法,
PDI类化合物和三明治型稀土酞菁配合物作为新型的功能材料,由于其具有独特的光学、电学、磁性以及其它的与其分子内部大环之间-相互作用有关的物理性质,使得它们在分子电子学、
培养学生的实践能力是高等院校的基本培养目标,而如何在不增加实验室、校外实习基地以及保证实践环节不脱离理论教学的前提下,在经管类课程中开展实践教学是众多高校所面临的
目的:探讨肩胛骨松解法结合关节松动术在治疗慢性肩周炎中的康复疗效。方法:对已确诊的慢性肩周炎患者60例随机分为A、B 2组各30例,均接受关节松动术治疗方案,A组并增加肩胛
白癜风是一种常见的色素障碍性皮肤病,病因及发病机理尚不明确。目前有自身免疫学说、遗传学说、神经学说、黑素细胞学说和角质形成细胞功能异常学说,但单一学说难以全面解释