论文部分内容阅读
网络流量分类技术,是网络监测重要而基本的手段,被广泛运用于QoS保障、网络安全检测、计费等网络活动中。随着高速网络技术的不断发展,特别是G比特和T比特网络技术的出现,网络承载的数据速率越来越高,传统的测量方法会对路由器或接口卡产生很大的开销,因而适用范围逐渐减小,基于采样技术的网络流量监测逐渐引起人们更多的关注。对采样技术的研究不仅要关注网络流量分类的准确率,更应关注它的高效性、实时性以及高吞吐量等其他性能参数。为了达到这一目的,本文对基于采样的高速网络流分类技术进行了研究。论文首先对当今网络流量分类的基本方法做了系统的论述,并详细介绍了Weka软件中几种常用的机器学习算法:BayesNet分类算法、C4.5决策树分类算法和Adaboost.M1分类算法,紧接着研究了采样测量技术的分类和研究现状。在上述研究的基础上,我们在已有的网络流量分析分类系统(Traffic Analysis and Classification System, TACS)上实现了快速定位模块、采样模块及机器学习分类算法。文中介绍了该系统快速定位模块和采样模块的设计方案和实现方式,并详细介绍了系统中调用Weka源码实现机器学习的流程。论文中还结合网络流量分布规律,给出了采样前后主流业务分类和P2P流媒体业务分类实验结果的分析。最后,总结了该系统的特点及待完善之处。