基于深度学习的协议识别技术研究

来源 :中国工程物理研究院 | 被引量 : 0次 | 上传用户:chrisfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,通信传输能力日新月异,网络移动应用层出不穷,社会生活与网络之间越发密不可分。在网络发展的同时,网络恶意攻击活动如木马程序、蠕虫病毒等也随之升级扩大,在一定程度上影响了广大互联网用户的体验,情况严重时还会给企业造成损失,给社会带来危害,因此网络中的通信安全是如今的中心议题。而在网络安全领域中,协议识别是其他技术工作如漏洞挖掘、入侵检测等的前提基础,对保障网络中通信安全具有重要意义,近年来成为了科研人员的研究重点。现在网络环境中存在大量私有协议,其协议规范尚未公开,传统的协议识别技术都存在一定缺陷。基于端口的协议识别技术需要知晓预定义端口号,而目前的动态端口技术等使得端口不再固定;基于载荷和基于行为特征的协议识别技术需要大量的人力投入,特征统计繁杂。这些因素导致传统的协议识别技术已不满足当前高速便捷的要求。本文针对大规模应用层协议自动化精确识别的需求,借鉴目前较为成熟的深度学习相关方法展开研究,即分类中使用的卷积神经网络和聚类中使用的自编码器,分别构建了有监督的分类模型和无监督的聚类模型。本文详细研究工作如下:1.研究了基于卷积神经网络的协议识别技术,此技术针对的数据对象是已知协议,目标是有监督学习下的协议分类。将协议报文转化为适应于二维卷积神经网络输入的位图格式,交替通过卷积层和降采样层提取深层次特征。实验结果证明对于6种真实网络环境网络中采集到的已知应用层协议,协议识别模型经过训练后,对于测试集的分类准确率可以达到97.30%。2.研究了基于自编码器的协议识别技术,此技术针对的数据对象是未知协议,目标是无监督学习下的协议聚类。通过自编码器中损失函数改进为联合了自编码器重构误差和高斯混合模型聚类中极大似然函数,从而有目标地将原始协议数据降维到对高斯混合模型聚类友好的空间中。实验结果证明对于6种真实网络环境网络中采集到的未知应用层协议,协议识别模型的聚类准确率可以达到91.71%。
其他文献
对氨基苯甲酸经重氮化后再与2-氯乙酰乙酸乙酯反应制得(Z)4-[2-(1-氯-2-乙氧基-2-羰亚甲基)肼基]苯甲酸(1);1与二甲基环己二酮成环后再与对羟基环己胺完成酰胺化反应合成了一种新型H
随着人们生活水平的提高,市场对芳香植物的各种产品如精油疗法、护肤品、香水及用于芳香园林构建等的需求越来越多;同时,以芳香植物为生产原料的工业对其原材料品质的要求更
随着现代社会数据采集量和传输量的不断增长,数据也朝着高维、无结构化方向发展,数据挖掘成为当今不可或缺的工具。而无监督学习由于不需要人为的标注数据,成为了其中一个重要分支。聚类是一种无监督的将数据按一定规律划分为多个子类的方法。经典算法如K均值、DBSCAN等方法尽管在低维结构化数据上取得了不错的聚类效果,但是由于高维数据存在维度灾难问题,使这些方法很难直接应用。此后大量降维方法被提出并应用于聚类之
新型γ’相强化的Co基高温合金有与Ni基高温合金相似的微观组织与力学性能,是高温合金领域的研究热点,但由于γ相高温稳定性差且合金密度较高从而限制了其进一步应用,探究合