论文部分内容阅读
互联网的飞速发展对网络监管与网络安全等提出了更高的要求。网络流识别作为一项基础技术,正面临着更为严峻的挑战。随着NAT技术、端口隐藏等技术的普及,使得传统的基于端口匹配的网络流识别技术失去了意义。而由于深度包报文检测技术识别精度高,深度流检测技术存在处理加密网络流的优点,使它们成为网络流识别领域的重要研究方向。网络流特征集是网络流识别研究的基础和关键,目前深度流检测技术的研究成果主要为网络流特征集的抽取和识别算法的选择。本文主要研究了多层次网络流识别技术,并且在实验室环境下进行了实现。本文主要内容安排如下:首先,介绍了当前网络流识别技术的主要进展和现状,分别对深度流检测方法和深度报文检测方法进行了分析与讨论。其次,深入研究了网络协议栈与特征选择算法。研究发现,传统特征选择算法基于网络流中平衡平均字节的假设,导致网络流中字节分类不准确。而实际当中,各网络应用产生的网络流包含平均字节量越来越趋于“不平衡”。基于此发现,本文在Moore等人研究成果的基础上提出了一种更为稳定的网络流属性集。本文提出的基于集成代价敏感的网络流识别技术,在保证网络流分类准确率的前提下,提高了网络流字节分类准确率。然后,在已有深度流检测方法研究成果中,主要以Moore等人收集的不同协议网络流数据为基础,这难以满足现有网络监管的需求。本文在实验室环境下捕获了不同类型的精细网络流样本,并且研究了深度流检测技术方法对精细网络流的识别效果。通过使用网络主页网络流样本识别子网页的方法,减轻了DFI方法网络流本样获取困难的问题。最后,本文结合深度报文检测技术与深度流检测技术的优点,设计并实现了一套网络流识别系统。并对该系统的主要模块和关键技术进行了简要介绍。论文的相关研究工作对于进一步深入研究和优化多层次网络流识别技术具有一定的参考价值。