基于机器学习方法的网络流量分类研究

被引量 : 0次 | 上传用户:re_man
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的日益发展和普及,网络流量数据正以惊人的速度增长,它在给人们带来方便的同时,也面临着如何有效地对这些海量数据进行分析,以提高互联网络服务质量以及促进互联网更快、更好的发展。这篇论文主要研究基于机器学习方法的网络流量分类以及相关技术。包括网络流量数据采集、特征产生、样本标识、特征选择,以及应用机器学习方法对网络流进行分类等技术。在基于机器学习方法的网络流量分类研究中,网络流量样本,包括训练样本、测试样本的获取是非常重要的一步。首先我们通过Sniffer的方法捕获网络报文,然后将采集到的报文按五元组进行分类为流,再结合Packet-Level和Flow_Level两个层面上的信息,在报文属性(大小、个数、时间、标志位)、流的属性(时间)上做了认真的分析和研究,产生了37个网络流量统计特征,形成了表示网络流的特征向量。在网络流量样本的标识上我们结合了基于端口、基于有效载荷,协议分解等多种方法,实现了样本的自动标识系统,标识的正确率高。在特征选择方面,运用特征距离以及遗传算法进行综合选择,这种方法可以有效地找到较好的遗传算法的初始群体。从而能在较少的迭代次数当中找到较优的特征子集,实验结果表明提出的方法可以减少特征的数量,减少学习和分类的时间,同时还因去掉不相关或冗余特征,提高了分类的准确性。在基于机器学习的分类研究中,运用了六种不同的机器学习方法,对常见的网络流量应用类型进行了分类研究,并给出了实验结果,实验结果表明基于机器学习方法的网络流量分类可以避免传统网络流量分类方法的缺陷,能够很好地分类那些采用动态端口或者协议加密的网络应用流量类型。在上述研究的基础上,设计并实现了基于机器学习方法的网络流量分类系统(Traffic Classification System Based on Machine Learning , TCSBML),系统包含网络流量数据采集、网络流量数据分析以及分类等几大功能模块,具有一定的实用价值。
其他文献
详细论述了汽车抛负载电压产生的机理,从理论上推导出了汽车抛负载电压的计算公式,实验表明其结果与理论计算公式吻合较好。
文章从眩晕源流、眩晕主症、辨治要领、个人重要经验等方面系统阐述了熊继柏教授辨治眩晕的学术思想和独到经验。熊教授认为:眩晕一证,历代医家论述较详,临床病机比较复杂,就
目的:了解大肠癌围手术期症状特点及证型分布规律。方法:采用临床调查方法,对210例围手术期大肠癌患者证候及症状进行研究。采用频数分析和卡方检验进行统计分析。结果:术前
多酚氧化酶(Polyphenol oxidase,PPO,EC.1.10.3.1)对茶叶品质的形成起关键作用,尤其与红茶品质的形成更是密切相关。茶树PPO除可应用于提高红茶品质外,还可应用于制备茶黄素
目的评估对家庭成员有躯体施暴行为的男性酒依赖者的人格特征和家庭、社会危险因素,为男性酒依赖者家庭躯体施暴行为的预测和干预提供理论依据。方法采用对照研究的方法,收集
本文采用反相沉淀的方法制备出聚甲基丙烯酸甲酯单链高分子纳米颗粒。通过配制高分子的稀溶液(稀溶液浓度<临界交叠浓度)将原来彼此互穿的高分子链分离,得到高分子单链颗粒溶
文章从哮喘主症、辨治要领、个人重要经验等方面系统阐述了熊继柏教授辨治哮喘的学术思想和独到经验。熊教授认为:哮必兼喘,哮证实为三位一体之证,即哮、喘、咳三症。哮证治
目前,随着社会的发展,我国建筑行业不断地发展,其中预制装配式施工技术得到了广泛的应用。现阶段,随着人们生活水平的提高,施工技术不仅可以确保建筑的质量,还能促进施工技术
几乎所有惯性导航系统都要在它们的工作时间内承受很大的振动。由于飞行制导应用的性质,这些振动常常伴随着很高的持续加速度,正如火箭发射和返回时所出现的情况那样。线振动
<正>1938年赛珍珠因其作品《大地》获得了诺贝尔文学奖。获奖评语这样写道:"获奖是由于赛珍珠对中国农民生活史诗般的描述,这描述是真切而取材丰富的以及她传记方面的杰作。