论文部分内容阅读
随着全球3G/4G网络的快速普及、移动智能设备性能的不断提升、移动智能终端的带宽瓶颈不断突破,移动恶意应用程序快速涌现。根据某安全机构2013年报告显示,2013年1月到12月,Android(安卓)平台新增恶意软件及木马763351个,被感染人数超过1.03亿人次;Symbian(塞班)平台新增恶意程序30049个,感染人数超过409万人次。恶意软件不断跟进当前技术发展并隐藏自身,并且不断通过多种手段窃取用户隐私信息、非法牟利,甚至远程控制用户移动智能设备,形成黑色产业链,因此开展面向海量移动应用程序的安全评估的研究工作迫在眉睫。目前面向移动应用的安全评估所采用的评估手段还是依赖于人员的能力和经验,主要工作集中在漏洞收集、恶意样本行为提取、简单的恶意样本行为关联挖掘方面,而缺乏针对移动智能设备呈指数级增长的恶意攻击事件的压制能力。本文基于移动互联网操作系统进行研究,从恶意样本的多行为属性入手,通过多种不同的数据挖掘决策模型:C4.5决策树、贝叶斯信念网络、神经网络模型、二阶段复合分类,寻找针对恶意样本的最低误报率和漏报率的组合,最终提出自主研究的多属性专家决策模型,并取得了一定成果,本文主要贡献总结如下:(1)研究移动应用数据来源、数据格式,并对应用行为属性类别划分,以及对应用属性模型和算法进行归并提取,并利用该模型针对移动互联网应用安全属性的移动应用的签名属性、敏感字符串判定属性、敏感函数判定属性进行基于KNN最邻近结点算法的模型适配,实现对各种敏感信息的选取。(2)提出了具有高检测率和低误报率的选择分类算法模型SCAM(Selection Classification Algorithm Model)。利用此模型根据需求做出选择,将基础分类算法进行选择、聚合和切割,并采用KNN算法解决了算法分类时的漏报问题。SCAM专家决策模型无需通过增大算法的检测半径来实现对未知样本的分类。另外,本文还提出了基于最大距离的初始算法器生成机制和针对数据噪声和算法重叠覆盖的处理机制,利用精简的算法模型覆盖大量的分类样本,并采用选择机制搜索最优算法模型。通过对已有的C4.5决策树算法、贝叶斯信念算法、模糊神经网络算法和二阶段复合分类算法进行对比,证明了SCAM专家决策模型的优越性。(3)从一个新的视角研究移动应用安全,提出针对海量样本的自动化规则分析,有利于建立恶意软件研判云,针对当前恶意软件爆炸式增长提供一定的压制手段。(4)提出一套针对移动应用安全评估的模型,并建立基于分布式架构的大规模未知样本自动分析平台,用于对移动应用进行安全评估。通过实验证实,经过一定移动应用样本训练后的模型,能够达到95.71%以上的恶意样本识别率,并且针对恶意混淆后的样本,识别效果较好。