论文部分内容阅读
LTE(Long Term Evolution,长期演进)是4G广泛采用的通信技术,以其良好的带宽、频谱利用率,网络吞吐量等优势进入市场,受到越来越多用户的喜爱,引起了研究人员的广泛关注。然而随着LTE技术的流行,以LTE技术构建的移动通信网络(简称“LTE网络”)中的安全问题同样不容忽视。过去几年中,针对LTE网络安全的研究主要集中在提出有效的安全认证方案或是安全的访问控制策略等领域。但是数据分析方法兴起之后,便出现了基于LTE网络相关数据的研究。因为在数据分析方法中数据是知识发现及决策过程的基础,人们会通过对相关数据的处理与分析得到有价值的结论,例如处理与分析LTE网络数据去识别网络中是否存在某种攻击。而数据分析中的关键又是机器学习算法,它可以通过对训练数据集的学习去发现数据中存在的规律,再根据以往学习的经验知识对未知的数据进行预测来得到相应的结论。考虑到LTE网络安全研究的重要性,数据分析的重要性和机器学习算法在数据处理过程中的作用,在本论文中,我们研究了如何利用机器学习方法,快速、准确、自适应的采集LTE网络安全数据并对所采集的数据进行组合、处理与分析。现有工作中,已经有大量的研究针对LTE网络入侵检测。首先采集一些指定好的LTE网络安全数据,再利用机器学习算法来预测网络中是否存在某种攻击。但是据我们所知在大规模的LTE网络数据环境下,几乎没有文献专门讨论如何采集LTE网络安全数据才能避免因重复采集而造成的资源浪费和时间消耗,或因不完全采集而造成所采集的数据中包含的信息不够完全以致得到不准确的结果。也很少有文献讨论如何将所采集的LTE网络安全数据组合到一起共同分析整个LTE网络的安全状况。为了弥补LTE网络安全研究中数据采集与组合方法中存在的以上问题,本论文在设计了LTE网络安全数据采集与组合框架的基础上提出了自适应的LTE网络安全数据采集算法和LTE网络安全数据组合算法。我们的工作与传统方法的不同之处在于采用了采集策略的反馈过程和串并行结构的数据处理过程。所提出的两个算法均与机器学习算法相结合,主要用到的核心算法是机器学习中的特征选择算法和分类算法,在这两个核心算法的基础上我们针对LTE网络安全数据设计了基于局部互信息增益的特征选择算法和基于串并行结构的支持向量机算法。其中,特征选择算法用来计算LTE网络安全数据对分类结果的影响程度,然后根据特征选择结果制定相应的采集策略并反馈到网络采集器上用于指导未来数据采集;分类算法被用于串并行结构的网络数据处理中去识别并预测不同安全类别的组合数据具体反映哪种安全问题,进而对LTE网络中存在的安全问题进行评价。为了验证所设计框架和算法的性能,我们利用NS3网络仿真工具模拟了正常LTE网络环境和异常LTE网络环境,仿真了物理层的信号干扰攻击、多媒体接入层的带宽窃取攻击和应用层的拒绝服务攻击,并在所仿真的LTE网络的不同层中部署网络安全数据采集器来采集网络数据。然后,利用Python语言编程实现了论文中提出的数据采集与组合算法。最后,设计测试实验对本文所提数据采集与组合算法的性能进行测试,测试结果证明了我们的方法应用于LTE网络安全分析上的优势。