基于DFI的HTTP流关联方法的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:liganggg1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HTTP流关联是指从网页浏览产生的HTTP流量中识别出包含访问页面URL的HTTP请求,将它所在的TCP流定义为主流,并将用于访问网页内嵌对象的HTTP请求所在的辅流关联到该主流上。HTTP流关联可应用于后向收费、网络故障定位、Web流量分析等领域。传统HTTP流关联算法有其固有的缺点,如基于IP与Think times的HTTP流关联算法无法应用于采用CDN加速技术所产生的HTTP流量:基于Referer与Think times的HTTP流关联算法则需要对HTTP请求内容进行解析,且无法处理加密流量:主动HTTP流关联算法则依赖于浏览器插件,只能作为一种辅助方法。本文提出基于DFI的HTTP流关联算法是一种基于流量行为的应用识别技术,无需解析报文应用层内容,通过TCP层以下的信息便能实现HTTP流关联,算法效率高且将来可以移植到HTTPS流量上。本文研究了互联网广告流量以及CDN加速技术对HTTP流量的影响,提出基于HTTP请求的流关联算法,通过该算法研究HTTP流量的特征,在此基础上提出基于DFI的HTTP流关联算法。本文的主要工作有:1)针对传统基于DFI的HTTP流关联算法无法处理采用CDN加速服务的HTTP流量以及互联网广告流量对HTTP流关联中主流识别部分的影响,本文研究CDN加速技术以及互联网广告流量对HTTP流关联的影响后提出相应的解决方案,并取得了较好的关联结果:2)针对手动采集和标记HTTP流量效率低下问题,提出了一种基于Selenium可自动模拟用户操作浏览器行为的方法,并实现了批量访问URL并收集相应HTTP流量的系统;3)为研究HTTP流量的特征,根据HTTP协议的特点提出了基于HTTP请求的流关联算法,并通过该算法实现对HTTP流的关联;4)在上述工作的基础上提出了基于DFI的HTTP流关联算法,并通过与基于HTTP请求的流关联算法计算结果对比,验证DFI关联算法的正确性。实验结果表明,本文提出基于DFI的ITTP流关联算法可以很好地解决HTTP流关联问题。
其他文献
随着我国城市化的快速发展,地铁在城市交通体系中所处的地位日益显著,成为必不可少的交通工具。地铁供电系统的可靠性和稳定性是保证地铁安全运行的必要条件。如果供电系统一旦
一、问题提出rn高三化学复习怎么整?做题、训练是常态化教学,但是是不是搞题海战术?实践经验表明,搞题海战术高耗低效,学生复习很累,而且效果不佳,容易出现学习疲劳,甚至有些
认知无线电是近年新提出的一种无线通信的技术,它利用未授权通信用户的频谱感知能力,动态的自适应的使用空闲频谱资源,从而提高整个频谱的利用率。认知无线电用户可以感知外部环
自2002年10月上海黄金交易所成立,国内商业银行尤其是五大国有银行进度飞快的参与到贵金属交易行业中来,银行贵金属交易量增长迅速,为银行带来了丰厚的利润,贵金属业务已在银
随着互联网的不断发展与普及,各种形式多样、功能不同的网站与应用层出不穷,例如具有社交、购物、学习等等功能的网站。这些网站中一般包含着用户对新闻事件、电影音乐、商品优
藏品一直以来是博物馆存在的基础,也是博物馆开展各项业务活动的前提条件。由于资金、意识及人才等等的限制,博物馆的藏品管理工作目前还处于初级阶段,与快速发展的经济不相
平行四边形定则是一切矢量运算的普适定则,利用平行四边形定则解题,确定平行四边形是最关键的一步.如果平行四边形四个顶点中有三个确定,这个平行四边形就是唯一确定的.例如
《镁铝铁及其化合物》一章涉及许多计算型选择题,采用常规方法解题,步骤烦琐;若采用一些计算技巧,则可轻松快速解题.本文就计算技巧进行例题分析和归纳总结.一、关系式法 Th
高考化学物质结构复习中,师生对电子式的写法总认为简单,常常“轻描淡写”、“一带而过”,结果往往造成不必要的失分.本文对常考物质电子式的写法给予归纳、整理,以期给高考
随着网络技术的快速发展,网络承载的业务种类越来越多,数量也越来越大。同时,用户对业务的要求也有所提高,这使得管控能力逐渐减弱,网络问题逐渐增多,难以保障各类业务的服务