Obfs4匿名网络流量识别研究

来源 :北京交通大学 | 被引量 : 10次 | 上传用户:mantisli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
匿名通讯是通过一定方法隐藏数据流中的通讯关系,使攻击者无法直接获取或推测出双方通讯关系或任意一方的身份信息的技术。它为正常用户的提供了身份隐私服务的同时,也容易被恶意用户利用以隐藏痕迹避免追踪。因此,研究匿名通讯检测技术对改进匿名通讯以及打击利用匿名通讯的犯罪方面具有重要意义。Tor是目前最为广泛使用的匿名通信工具。为了对抗流量分析攻击,Tor采用了多种流量混淆插件。Obfs是Tor的常用混淆插件之一,基于加密和填充达到隐蔽流量特征的目的。Obfs4使用了抗静态特征识别的改进型椭圆加密算法与抗报文长度特征分析的随机填充机制,进一步提高协议匿名性。实现面向真实世界的Obfs4流量检测面临多个挑战:1)全随机性:Obfs4遵循全随机化设计,使用随机椭圆加密和随机填充,拥有极强的抗静态特征检测和抗报文长度特征检测的能力。2)海量流量:检测系统需要能承受海量数据,同时满足高精度和实时性。3)大量相似流量:真实环境存在大量类似Obfs4的混淆协议、以及正常流量中的相似数据。4)高精度与实时性的矛盾:检测算法精度提高,会导致时间效率的下降,同时满足时间和精度的要求面临很大困难。为了应对这些挑战,本文提出了一种基于多级过滤、动态和静态特征结合的Obfs4流量检测方案,实现了高精度和实时检测的目标。主要工作和贡献如下:(1)针对高精度与实时性的矛盾,提出多级过滤的策略,粗粒度快速过滤方法,细粒度精确识别,实现在保证高精度的同时满足资源占用和时间效率的需求。(2)针对Obfs4抗静态特征的随机化设计以及大量正常通信流量的非随机性特征,提出Obfs4随机性检测方法,将握手包负载进行按位重组后检测其随机性,并根据结果调整偏差函数的阈值。同时,为了控制实际使用中的资源占用,本文对比了不同负载长度对检测结果的影响并选出最优结果,最终达到提高时间效率,降低资源占用的目的。(3)针对大量干扰数据组造成的高误报率,分析Obfs4协议握手的时序特征,选择对Obfs4的握手部分数据包进行重组,根据Obfs4确认包收发时序特征与其他干扰协议进行区分。同时,为了应对在实际环境中对庞大的待检测数据,本文分析Obfs4的用户行为,采用分层次的报文长度过滤的方法,排除了近90%的干扰数据,极大的控制了误报率,并提高了检测效率。(4)经过大量样本数据特征相关性分析和效度分析,提取出包括方向、长度、方差和信息熵在内的4类16种流量特征,同时选用4397条正例与5128条反例,对SVM的惩罚系数、分片大小以及训练模型进行优化,并最终确定最优的特征和模型参数。实验表明,本方案识别Obfs4的流量的精确率达到了 99%以上,检测时间复杂度低于8000 CPU周期/秒,能满足真实环境对时间复杂度和精度的要求。
其他文献
本文根据国外文献及专著译编而成,内容包括钪的资源情况及从各类含钪物料中回收钪的方法。
目的 探讨阿司匹林联合硫酸氢氯吡格雷口服治疗脑梗死的有效性和安全性。方法 选取2016年3月至2017年11月我院收治的120例脑梗死患者,采取随机抽签方式将其分为对照组和观察
在积分区域具有某种对称性时,给出重积分及曲面积分所具有的相应性质,并通过例题给出这些性质在重积分及曲线、曲面积分中的应用方法.
在无机粘结剂水涂粉工艺中,采用化学处理方法改变纳米胶中钾离子的含量,分别将其应用在涂粉工艺中,制作出2U-9灯管,并分别测定其管压、光通量、光衰、显色指数等参数.指出钾
目的:分析视网膜脱落手术后综合性护理的效果分析。方法:本研究所选对象为笔者所在医院2014年1月-2016年12月收治的视网膜脱落患者100例,经随机数字表法将全部患者分为对照组
水肥一体化技术在干旱、半干旱区应用广泛,为了探究水肥一体化技术在酿酒葡萄上的应用效果及经济效益,以"赤霞珠"为研究对象连续3 a对宁夏贺兰山东麓传统水肥管理(CK)、滴灌+
在科学技术迅速发展的今天,计算机在各行各业的应用已经相当广泛。关于计算机技术和图论的融合机制,则不但具有定量优势,同时也存在相应的定性优势。结合控制算法实施网络图