基于多分类器融合的移动网络流量识别方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:liujiecumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动网络的迅速发展及移动应用的繁荣,移动网络流量识别在网络管理与网络安全等领域的重要性越来越突出。不同于传统工作站流量,移动网络流量的特殊性给传统流量识别技术带来了极大的挑战,如需细粒度识别,流量加密,应用数量巨大等等。机器学习技术在众多领域中都表现出优秀的分类性能,对解决目前移动网络流量识别技术存在的问题具有重大潜力。本文基于机器学习方法对适用于真实网络环境的移动网络流量识别技术展开相关研究。主要工作如下:(1)为了能识别目标应用流量及检测大量未知应用流量,提出一种基于分类器融合的多层分类器架构识别移动应用流量。首先,为了避免受流量加密,隧道等技术的影响,提取的流量特征集仅包含流量的统计特征及少量原负载字节值。然后,训练基于决策树模型的多层分类器,在不同层实现细粒度的目标应用流量识别和未知应用流量检测。最后,收集一个具有代表性的,较大规模的移动应用流量数据集用于验证本方法的有效性。实验结果表明本文的方法具有高识别精度,能有效的检测未知应用流量。(2)提出两种模型调整算法用于优化基于FPGA的决策树加速实现,从而使得工作(1)提出的算法易于进行硬件加速。首先,给出一种决策树模型中的浮点数阈值整数化方法,消除模型中的浮点数。然后,提出一种决策树模型剪枝方法,根据硬件资源限制自适应调整模型,避免每次模型更新时重新编程硬件。(3)通过在服务层次分析应用流量的网络行为,总结不同服务下的流量的网络行为特征,从而对工作(1)中不能识别的大量未知应用流量进行初步的粗粒度分类。首先,K-Means方法用于识别具有相似行为的流量。然后使用流量分布图可视化流量的网络行为,并利用节点度数,连通域数及其他统计特征总结流量的行为特征用于识别未知流量。实验结果表明一些提供特定服务的流量可以通过这种方法有效的进行识别。本文针对移动流量识别技术面临的众多挑战,研究了基于多分类器融合的移动网络流量识别方法,对于将基于机器学习的移动流量识别方法部署于现实网络环境具有一定的指导意义和实用价值。
其他文献
当今世界已进入信息技术高速发展的时代,数据规模呈指数方式增长,大数据的价值越来越受到广泛的关注。随着网络化应用的加深,特别是互联网+、大数据、云计算、物联网等技术的
移动互联网的升级换代和移动智能终端的快速普及,促进了人类生活的网络化,导致了大量用户评论信息的生成。通过对用户评论信息的分析,了解用户的情绪,对于商家了解市场走向、
以GaN基结构为基础的半导体微盘激光器由于其高集成度、低阈值和低功耗的特性使其在集成光学和新型光电子器件等诸多领域有着广阔的应用前景。具有回音壁模式的光学微腔具有
近年来,随着人类对高性能芯片的需求逐步增长以及纳米技术和硅基光子技术的不断发展。多核芯片技术作为可以解决单核芯片设计所面临的功耗极限、互连延迟等诸多问题的一项新
随着军事电子技术和国民经济的飞速发展,迫切需要行波管具有更宽的频带,更大的输出功率,更高的频率、和更小的体积等其他工作特性。慢波结构是行波管的核心组件,其高频特性的
甘肃省特有少数民族传统体育项目具有鲜明的健身性、娱乐性和教育性特征,是我国体育事业的重要组成部分,是我国宝贵的文化遗产,也是人类智慧的结晶,蕴涵着丰富的历史文化信息
肘关节的运动在日常生活中发挥了较大作用,对肘关节有运动障碍的患者进行康复训练非常关键。外骨骼康复机器人因其康复效果好、成本低廉的特点最近得到了社会的关注和认可。
随着对不可再生化石资源的不断利用和开采,化石资源已经濒临枯竭,能源危机和环境问题越发严重。开发利用低碳、绿色、环保的可再生能源已成为当前的研究潮流。木质素是自然界
大涡模拟(LES)是重要的研究含颗粒物重力流(浊流)的模拟方法之一,它能够得到比雷诺平均法(RANS)更多的流动信息,又比直接数值模拟(DNS)节约计算资源。至今还未发现采用LES对
有机发光二极管发展至今,磷光和热激活延迟荧光器件由于理论上能够利用100%的激子发光而备受人们的关注。因此,在本论文中,设计并合成出1种磷光主体材料和4种热激活延迟荧光(T