论文部分内容阅读
随着网络带宽的增加、安全需要的增长和网络业务的不断发展,报文分类技术在网络设备和网络应用的作用逐渐凸显,应用日趋广泛。作为报文分类技术的核心,报文分类算法的本质是计算几何中的多维空间点定位问题。由于分类规则具有多维度、优先级和交叠性等特点,报文分类算法通常复杂低效。因此针对报文分类算法的研究具有重要的理论价值和实践意义。 本研究主要内容包括:⑴在大量研究现有报文分类技术的基础上,对 IP报文分类技术进行综述,阐述了报文分类算法的应用背景、评价标准和设计方法,总结了几种经典的报文分类算法。着重分析和比较了不同分类算法的设计思想、时间复杂度、空间复杂度等评价指标。归纳出报文分类算法要基于具体的应用环境在时间和空间上寻找平衡点这一论点。为设计和改进现有报文分类算法打下了基础。⑵在仔细研究Hiucts算法的基础上,针对 Hiucts算法可用性不强的问题,提出了一种改进算法-Half-Hicuts算法。通过改进Hicuts算法的每一维度的切割份数大小,使得决策树的高度增加、宽度减少,减少了规则复制与冗余,进而达到降低存储空间,提高算法可用性的目的。实验测试表明,Half-Hicuts算法比Hicuts算法的分类速度降低不超过10%,规则存储数量和单条规则消耗存储空间降低40%以上,预处理时间降低5%~50%,提高了原始算法的可用性和规则更新性能。⑶在仔细研究基于TCAM的报文分类算法的基础上,针对TCAM存储规则时存在规则集膨胀的问题,提出了一种基于TCAM的报文分类算法-GD-TCAM算法。通过对规则集使用格雷编码进行存储的方案,在纵向上对规则集进行压缩。利用TCAM的剩余位宽,在横向进行扩展,通过纵向压缩和横向扩展降低规则集的扩张因子。通过使用带有预留表项的顺序移动法改进规则集的存储和更新,在查找时通过设置 TCAM的区间掩码寄存器和块掩码寄存器,减少每次查找TCAM的区域,进而降低TCAM功耗。提出了一种利用GD-TCAM算法的报文分类模型。实验测试表明,GD-TCAM算法的规则扩张因子在2~2.6之间,明显低于直接前缀扩展算法和基于格雷编码的前缀扩展算法,而且在存储空间、能耗、规则更新性能上的优势。