基于加密流量分析和深度学习的移动应用程序识别关键技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zht336
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动互联网已经成为人们日常生活和工作中不可或缺的重要组成部分,针对不同的移动应用类型提供差异化的QOS服务成为了网络运营部门的重要任务之一。基于隐私保护等安全目的,移动应用大多采用加密技术,这为移动应用的识别增加了挑战。因而基于密文流量的移动应用类型识别技术成为了国内外学术界和工业界的研究热点。本文以加密流量分析和深度学习相关技术为基础,针对移动应用类型识别技术中的数据预处理、加密数据流特征提取和加密数据流算法建模三个组成模块分别进行了改进和创新,具体内容如下:(1)针对不同移动应用产生的相似干扰加密流样本,提出了一种基于信息熵的聚类簇纯度分析算法。该算法首先利用DBSCAN密度聚类算法对所有加密流样本进行聚类分析,接着根据每个样本的真实标签计算每个聚类簇的信息熵从而为聚类簇进行纯度打分,最后根据实验合理设置熵阈值过滤信息熵较大的聚类簇样本,实现相似干扰样本的过滤。(2)针对加密数据流特征提取阶段,提出了一种将加密数据包头部信息和负载信息相结合的特征提取方案。该方案将加密数据流抽象为数据包时间序列,提取数据包头部的数据包长度、端口号、TCP窗口等明文信息作为数据包头部特征,计算密文数据负载的多个连续字节信息熵作为数据包负载特征,最终将数据流中每个数据包的头部特征和负载特征组合为特征矩阵,利用LSTM算法验证该特征提取方案的可行性和有效性。(3)针对加密数据流算法建模阶段,提出了一种将卷积神经网络和LSTM相结合的Convolutional-LSTM移动应用识别算法。该算法将加密数据流特征矩阵视为灰度图像,利用卷积神经网络捕捉相临数据包的局部关联性,利用LSTM算法学习加密数据流的时序信息,并应用Dropout和正则化惩罚解决深度学习中的过拟合问题,最终实现Android平台下的移动应用类型识别。本文提出的三个改进和创新能够有效的实现Android平台下的移动应用类型识别,实验表明算法具有较高的识别准确率和召回率,最后本文提出了方法存在的不足和日后的研究方向。
其他文献
将凹凸棒土(ATP)和氨基化凹凸棒土(ATP-NH2)填充于聚偏氟乙烯(PVDF),制备了PVDF/ATP和PVDF/ATP-NH2复合材料。利用偏光显微镜(POM)观察复合材料中PVDF的结晶形态,傅里叶变换红外(FTIR)
在解答某文献中的一个问题的过程中,得到了一个命题.用不同的方法给出了该名题的多种证明.
目前,随着人们生活水平的提高以及当今科技的迅速发展,人们已不再满足于服装原本的遮羞、保暖、美观等基本功能,而是越来越注重服装的功能化、智能化。而要实现纺织服装产品
金寨县现有栗园面积50万亩,年产板栗3万吨,年创产值亿元以上,是广大农民经济收入的重要来源.剥苞难是困扰板栗生产的一大难题,特别是六、七成熟的板栗剥苞,手工剥苞耗时费力,
文章从先锋作家北村写作历程分阶段研究,探讨了北村始终苦苦思考并追求写作的终极意义和价值立场。作为作家与宗教徒的北村,其作品以“皈依基督”前后为分水岭,北村创作轨迹
随着物联网时代的来临,未来一切设备都将包含智能芯片和智能操作系统,任何物联网设备都可以采用网络协议相互通信,并且这些设备是全天候在线的。因为受到硬件尺寸和重量的限
深圳特区报讯(记者 姚卓文)记者昨日从市教育局获悉,近期市教育局首次“试水”引入第三方评价,委托专业调查机构开展义务教育满意度调查。调查对象覆盖全市义务教育阶段公办学校
报纸
目的探讨距骨剥脱性骨软骨炎的影像诊断要点及不同检查方法的应用价值。方法回顾性分析2007年10月至2014年6月在我院经手术病理证实的8例距骨剥脱性骨软骨炎患者的X射线、CT
随着我国文化产业飞速发展,播音主持专业越来越受到重视,成为未来就业的热点领域,同时也会面临更加严峻的挑战,如何在挑战中抓住机遇,赢得成功成为每个播音主持人的关注话题
马克思认为,人类想要实现生存,首先要解决的就是衣食住行,正因如此,在人类历史中产生的第一种活动就是为了谋求衣食住行而产生的活动,也就是物质生产。马克思主义唯物论告诉我们,“物质生产活动”是包括哲学思考在内的一切人类思维活动的原发点,是唯物主义哲学体系得以建构的本体性前提和基础。所以,吃饭问题就成了人类社会得以生存和维系的实体性基础。对吃饭问题展开哲学思考,在马克思唯物主义视域下建构一个思考吃饭问题