Android恶意应用检测中特征选择算法的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tengyao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,移动端应用程序呈现爆炸式增长。Android作为一个开源操作系统被大量手机厂商定制化使用,也正是由于其开放的特点,导致Android应用市场中涌现出大量恶意应用,目前绝大部分移动端恶意应用存在于Android平台。因此,研究针对Android应用市场的恶意应用检测技术是非常有意义的课题。在众多的检测技术中,基于机器学习的恶意应用检测技术是一个热点。通过机器学习检测Android恶意应用,首先要解决的问题是应用特征的提取和选择。现有研究主要采用的方式是提取特征后直接用于机器学习算法,或人工选择其中一部分作为输入,很少有进行特征选择过程,这样会带来建模和分类时间长,准确率和召回率较低等问题。为了实现高效的Android恶意应用检测,本文首先设计了 AppExtractor自动化工具提取应用的特征集合,并利用两种常用的特征选择算法对集合进行分析,发现这些特征存在“分布偏移”和“长尾效应”两种现象。其次本文提出了一种新的特征选择算法FrequenSel,现有的其他特征选择算法主要通过计算特征在统计学意义上的重要性来决策如何选择特征,而FrequenSel通过比较特征在恶意应用和正常应用之间出现的频率差异进行特征选择,使得最终用于机器学习的特征能够训练出在恶意和正常应用数据集上具有十分接近准确率的高效分类器,并且召回率也能达到准确率水平。在实验中检测了7972个应用,准确率和召回率均接近98%,每个应用的分析时间约6.5秒。结合大数据场景下Android恶意应用检测的实际需求,本文还提出了一种基于深度学习的特征选择算法DBNSel。严格地讲它是一种特征学习算法,因为它采用深信度(DBN)网络架构。同作为特征选择算法,FrequenSel从原理上是特征数量的“量变”,而DBNSel是特征的“质变”,因为DBN的输出是输入特征的另一种表达形式。通过合理设计DBN网络结构可以使得输出特征维度远小于输入维度,在输出集合上运用普通的机器学习分类算法便可以实现恶意应用检测。在实验中采用上述同样数据集,最优准确率达到98.3%,并且在开放测试中得到99.4%的准确率和召回率。通过全面的实验说明,本文中提出的两种特征选择算法适合于Android应用市场进行批量化的恶意应用检测场景。
其他文献
无线充电是解决无线传感器网络所面临能源限制问题的一项极具前景的技术。最近研究表明,在无线可充电传感器网络中引入谐振中继器来实现对传感器节点的多跳充电,可显著地延伸
课堂理答行为属于问答行为的一部分,是教师对学生回答的反应与处理,由于理答行为表现细微,在课堂教学中不易引起教师的重视,但教师的理答行为对于学生的学习发展甚至终生学习确实有着不可忽视的作用。当前高中化学课堂教学中理答现状如何?存在哪些问题?造成这些问题的原因是什么?根据原因分析提出具体提高化学教师理答行为水平的策略,都是本文需要观察与解决的问题。本文依次采用分析文献法、课堂观察法、专家咨询法和熵值赋
学位
近几年移动设备和移动网络服务的发展迅速,在蜂窝网络中产生了巨大的流量。流量暴增带给运营商巨大的挑战,运营商需要提出一种高效并且低成本的方法解决蜂窝网络资源紧缺的压
抽象语义表示(Abstract Meaning Representation,AMR)结构是一种新的旨在对整个自然语言句子进行语义表示的结构形式。AMR通过引入一个带根节点的有向无环图表示句子的语义,
随着信息化进程的推进,许多计算机应用中会用到图数据库,如:推荐系统、知识图谱、社交网络等。但是,由于在获取、解析数据的过程中存在误差、干扰等因素,常常会导致这些应用
随着大数据与移动互联时代的到来,数据呈爆发式的增长,海量的异构化数据相互交织,数据可视化已成为数据挖掘和数据分析过程中的重要技术。图表作为数据可视化的利器,一直被广
频率选择表面(Frequency Selective Surface,FSS)是由周期阵列结构排列而成的无限大平面结构,它可以根据需要对入射电磁波实现选择性传播。该结构在电磁波技术的诸多方面得到
随着国家城市化的快速发展,越来越多的人们离开乡镇到县城买房,孩子也随家长迁徙到县城,使得县城初中学生人数不断增加。笔者所在的学校是地处江苏苏北响水的一所初级中学。
步态是人走路时所表现出来的姿态,是一种复杂的运动过程。步态识别技术是一种新兴的生物识别技术,通过对人体行走方式进行客观地记录并对其进行有效的评估及分析,旨在通过生
无线传感器网络(Wireless Sensor Network,WSN)作为物联网的神经末端,负责对现实物理世界进行信息监测,随着物联网的发展其作用日益凸显,被认为是21世纪最重要的通信技术之一