网络流量识别中特征选择算法的研究与应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xielianqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络应用爆发式增长,网络流量急速膨胀,大量涌现的新型应用比传统应用具有更复杂的结构和流量模式基于流量识别技术,能够细粒度的管理和优化网络,引起了广泛的关注其中,基于流量特征采用机器学习的流量识别技术,具有较高的准确率,成为了近年来流量识别领域的研究热点特征选择通过去除无关冗余的特征,获得最优的特征子集,基于该特征子集能够降低学习算法的复杂度,提升分类的准确率及速度本文首先介绍了流量识别技术机器学习技术及特征选择算法的相关概念,并简单介绍了使用互信息进行度量及SU算法,在此之上提出了两种新的基于互信息的特征选择法:1.基于互信息的Filter式特征选择法运用改进的SU算法去掉不相关的特征,并基于互信息去掉冗余特征,通过反复调整阈值进行迭代,以提高分类准确率2.基于互信息的Wrapper式特征选择法运用改进的SU算法去掉不相关的特征,并基于互信息去掉冗余特征,直接使用分类器的分类准确率作为判断标准来指导算法进行迭代,以获得最佳阈值从而达到最好的分类效果在UCI数据集上的实验结果显示出,本文给出的两种特征选择算法具备较好的分类性能将本文所提出的特征选择法应用于网络流量的类别识别中,在Andrew W.Moore数据集上的实验结果表明,算法在保证了分类准确率的同时,取得了显著的特征约减效果本文选出的流量识别的最优特征子集,能够保证较高的分类性能并大大缩短分类器的分类时间,因此为合理且有效的特征子集
其他文献
随着通信技术、微电子技术的进步和智能化建设的发展,越来越多的设备如家电、电表、工业终端等都有了联网的需求,并且有大量的数据需要传输,而在很多场合有线连接的方式已经不能
随着计算机网络技术与多媒体技术的发展,数字多媒体作品的制作、复制与传输变得非常方便与快捷,与此同时,它们的版权与完整性保护也成为了迫切需要解决的问题。数字水印技术作为
蛋白质的三维结构决定其生物功能,同种折叠模式的蛋白质功能相似。自然界中的蛋白质结构约十万种而折叠模式的总数还不到一千。因此,蛋白质折叠研究不仅具有很重要的生物学意
拒绝服务 (denial of service,DoS) 攻击已成为网络上最难应付和最普遍的攻击之一,危害仅次于计算机病毒。它通过大量的恶意连接,耗尽网络或系统资源,从而使正常服务请求无法得到
本文设计并实现了一种全新的企业网解决方案——动态虚拟专用网络DVPN(Dyrlamic Virtual Private Network),它解决了传统 VPN ( Visual PrivateNetwork) 存在组网及配置复杂、
声纹识别技术,即说话人识别技术,以其独特的方便性、经济性和准确性等优点受到广泛瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式之一,有着广阔的市场应用前景。