论文部分内容阅读
网络技术在人们工作生活中的应用不断深化,互联网已成为承载海量数据信息的重要基础设施,在为人们带来巨大便利的同时,网络攻击如影随形,网络安全面临严重威胁。入侵检测和告警关联是网络安全技术体系中的重要组成部分,入侵检测能够通过收集和分析相关网络数据及时发现攻击行为,降低安全威胁,告警关联能够对多源信息进行融合分析,扩大入侵检测范围,提高告警质量。随着网络规模的扩大和网络攻击技术的多样化、复杂化发展趋势,待分析数据的维度和数量不断增长,传统的入侵检测和告警关联分析方法在处理海量高维数据方面面临巨大挑战。本文结合机器学习相关技术,以提高入侵检测性能和告警关联自动化程度为目标,在特征降维、数据流分类、异常检测和关联规则生成等方面开展研究,取得了一定的创新成果,主要研究工作如下:1.针对入侵检测过程中处理海量高维数据费时费力、实时性不高的问题,结合粗糙集理论和主成分分析方法对特征降维开展研究。特征降维的目标是在不降低数据分类能力和表达能力的前提下减少特征维数、提高数据分析效率。本文结合粗糙集理论和主成分分析提出一种新的特征降维方法,利用区分矩阵和信息熵完成特征选择,构造加权核函数完成特征映射和特征提取,结合两种方法对原始数据特征进行多层次深度提取,获取更为简洁的高级特征表示,提高入侵检测的实时性。2.分类是误用检测中经常用到的技术,通常利用标记数据完成分类模型的训练,待分析数据的动态数据流特性以及标记数据获取代价高的特点给传统方法带来了挑战。针对该问题,本文提出一种基于判决反馈的数据流分类方法,首先基于集成学习方法,利用数据流中的标记数据块训练初始分类模型,并利用该模型对无标记数据类型进行初始判决,然后结合该判决结果训练基于无标记数据的聚类模型,为数据分类提供约束信息,从而可将基于有监督方式的集成分类模型扩展为半监督方式,并基于模型一致性最大化的原则完成数据类型的精确判断,达到利用无标记数据改善数据分类性能的目的。3.异常检测通过建立正常用户行为轮廓模型去判断网络入侵等异常行为,实际环境中正常行为数据集的纯净度和完备性很难保证,从而影响异常检测模型的性能。针对该问题,本文结合主动学习提出一种基于半监督方式的增强式单分类支持向量机异常检测模型,该方法首先利用单分类支持向量机以无监督方式建立异常检测模型,然后结合主动学习的方法选取少量数据进行标记,利用标记数据信息将模型扩展为基于半监督方式的单分类支持向量机模型,并对主动学习的选择策略和终止条件进行了修正以兼顾数据纯净度和完备性需求,从而以较小的标记代价获取较大的异常检测性能提升。4.告警关联是网络安全领域研究热点之一,通过预定义规则指令对安全设备上报的事件进行关联分析,揭示隐藏在离散事件背后的有意义的联系,该领域的研究多集中在关联方法和规则表示上,而关联规则的获取更新多依赖于人工干预,从而限制了该方法的自适应性。针对该问题,本文提出了基于神经网络和遗传编程的关联规则生成方法,该方法首先利用神经网络模型完成基于攻击场景的事件分类,根据分类结果提取规则项并产生训练集,然后结合遗传编程生成关联规则并进行优化,完成关联规则的自动生成和更新,从而提升关联分析方法的自动化程度和自适应能力。综上所述,基于网络攻击日益复杂化和多样化的背景,针对当前入侵检测和告警关联方法面临的挑战,本文基于机器学习方法从特征提取、数据分类、异常检测和关联规则生成等方面进行了深入研究,提出了解决方案,并通过实验验证其可行性和准确性。本文研究成果有利于提高入侵检测的效率和准确性,提升关联分析的自动化程度和自适应能力,帮助人们从海量数据中更为实时准确地感知潜在威胁。