基于多核处理器的可扩放包分类算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zcom0907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的网络需要为用户提供更多、更快和更安全的服务。提供多样性服务需要以数据包分类为基础,数据包首先根据包头中的相关域(一般为源/目的IP地址、源/目的端口号和协议五个域)被划分到不同的流中,然后根据数据包所属的流进行相应的处理。包分类已成为目前网络处理的重要支撑技术之一。随着链路速度及网络流量的不断攀升,包分类已成为高速网络处理的性能瓶颈。目前,无论硬件方法还是软件方法都不能很好地满足数据包分类处理的需要。硬件方法能够提供很高的分类速度,但不具备动态分类要求的灵活性;软件方法灵活性好,但达不到高线速处理的要求。多核处理器的出现为实现高效、灵活的数据包分类提供了新的途径,利用多核处理器的计算能力既可以获得接近硬件的分类速度,同时又具有软件算法的高度灵活性。然而,多核处理器上的并行程序设计目前依然是一个难题,如何设计具有良好可扩放性的并行算法还有许多问题需要解决。本文工作主要包括两个部分。第一部分针对目前的并行加速比模型不能很好地解释在基于共享存储的多核处理器上出现的超线性加速及并行系统效率衰减的现象,提出了一种区分工作负载的并行加速比模型。该加速比模型将工作负载进一步区分为计算负载和访存负载,通过显式地引入系统访存能力对并行系统加速比的影响,从理论上较好地解释了超线性加速和并行系统效率衰减的现象,并通过实验验证了模型的有效性。根据该加速比模型,论文对基于多核处理器的并行程序设计提出了几个设计原则,作为对设计可扩放的包分类算法的优化指导。论文的第二部分工作是设计和实现了一个面向多核平台的高速数据包分类算法TIC(Two-stage Interpreting based Classification)。TIC利用分类规则集特征以及多核平台的体系结构特点,将五元组数据包分类过程分成针对源/目的IP地址的二维前缀查找和针对另外三个域的范围查找两个阶段。第二阶段采用基于解释器的范围查找,极大地减小了算法的内存消耗,同时利用多核处理器充足的计算能力来完成解释执行的任务。从本质上说,TIC通过平衡算法的计算负载和访存负载,在时间和空间复杂度上取得了最佳的折衷,从而保证了算法在多核结构上具有良好的可扩放性。TIC算法在Intel IXP2800网络处理器和基于X86架构的Intel Xeon5410四核通用处理器平台上均获得了10Gbps的分类速度。TIC算法分类速度接近或优于目前最快的软件分类算法,并且所需的内存空间及预处理时间均有大幅度的降低。
其他文献
集成了传感器技术、嵌入式计算、网络和无线通信四大技术而形成的无线传感器网络是一种新兴的信息获取技术,可广泛应用于工农业控制、生物医疗、环境检测等诸多领域。MAC层协
逆风区是一种强对流性天气中产生的天气现象在多普勒雷达速度图上的反映,是强烈降水区域的特有流场特征,该区域往往对应着强风,强降水,冰雹等灾害性天气。实现对逆风区的自动
交通流参数的正确检测与提取,是对高速公路监测与管理的重要基础。交通流参数检测方式多种多样,有电磁感应线圈、超声波检测器、微波检测器和红外线检测器等,而以视频交通流
为适应新世纪人才培养的目标,国内高校教育体制进行了大规模的改革,校与校之间合并、校区分散、学校规模不断扩大、专业设置日趋多样化,招生人数逐年增加,教学计划不断更新,
随着科学技术的发展,科学数据的爆炸式增长给其存储和分析带来了巨大的压力,如何高效的存储和分析科学数据成为一个巨大的难题。一方面,科学数据模型一般以数组为主,传统关系
随着生物技术的发展,DNA计算随之产生。由于DNA计算机所具有的巨大并行性、海量存储以及低能耗等有点,将有望在某些领域弥补现有计算机的不足。DNA计算是利用DNA双螺旋结构和碱
现今随着Web信息指数化的增长,传统的基于整个Web的信息采集技术由于其采集的主题范围过于广泛,导致无法保证对信息的及时更新,并且较少考虑采集信息是否与查询主题相关,已经
Ad hoc网络也称无线自组网,是由一组带有无线通信收发装置的移动节点自组织而成的多跳网络。由于Ad hoc网络中节点的移动性、资源受限、同时充当路由器以及无网络中心等特点,
学位
近年来,随着科技学技术的飞速发展,人们的生活、工作、学习都向着现代化方向迈进。在教育领域,无论是教授方式、还是学习方式,都发生了巨大的变化。教授方式由以往的传统教师与学