恶意代码检测技术研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:zhy724458069
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,计算机已经成为人们日常生活中重要的一部分,娱乐休闲、商务办公乃至国民生产,都与计算机技术息息相关。然而,伴随其应用的广泛性,计算机安全威胁也无处不在,对我们日常的计算机使用造成了极大的困扰和危害。虽然目前广泛使用的病毒查杀软件已经为我们提供了一定的安全保障,但是由于不可预知的新型恶意代码层出不穷且传播迅速,造成了传统的检测技术具有一定的滞后性,使得计算机安全问题存在着长期的隐患。本文基于机器学习方法对恶意代码检测技术进行研究,针对传统检测技术对未知类型恶意代码的检测能力的薄弱之处,重点应用单类分类方法进行检测,全文主要工作从以下几个方面展开:(1)基于TF-IDF和LSI的特征表示方法本文以特征项在样本中出现的频率分布构成机器学习过程的知识结构,为规避原始数据集中冗余信息和噪声给学习带来的影响,使用词频-逆文档频率(TF-IDF)方法对原始数据进行量化表示,形成加权样本特征矩阵;最后,使用隐语义索引(LSI)方法进行特征重构,以加强特征的表示能力并减少计算消耗。(2)单类分类方法应用于恶意代码检测相对于正常代码样本,恶意代码样本往往难以获得,使用两类分类方法进行检测时极易出现数据不平衡问题,并由于样本知识所限对未知类型恶意代码的检测能力偏弱。单类分类方法以正常代码样本作为正例进行训练学习,可将异常类样本(包含已知类型恶意代码及未知类型恶意代码)全部拒绝于正常之外。实验表明,单类分类方法应用于恶意代码检测可获得良好的检测性能。(3)提出单类直推式支持向量机方法为有效利用大量未标号样本信息,本文将直推式学习机制引入到恶意代码检测中,以提高学习器的性能。针对恶意代码检测中异常样本相对较少的数据不平衡问题,对两分类直推式支持向量机进行适应性改造,提出了单类直推式支持向量机方法——OCTSVM。OCTSVM利用未标号样本对训练集进行自适应调整,使其分布更加准确化,从而提高其检测能力。(4)不平衡问题研究由于恶意代码样本的稀缺性以及大量无标记样本的存在,不平衡问题广泛存在于恶意代码检测中。不平衡问题使得分类器偏向于样本数较多的一类,影响分类效果及性能评估。单类直推式向量机通过对样本的自适应调整,提高了对不平衡问题的适应能力。而使用对不平衡免疫的AUC指标对分类方法进行度量,可获得比准确率方法更为可靠的性能评估。
其他文献
随着网络应用和统一通信技术的不断发展,即时消息和呈现服务已经成为网络服务中的一项基本业务。在具体实现上,呈现服务可以使用的协议、标准和规范比较多。基于SIP协议的SIM
随着计算机在多媒体技术和虚拟现实技术等方面的不断提高,3D模型在计算机辅助设计(CAD),机械工程和娱乐等各个领域的应用已经越来越普及。随着计算机图形硬件性能的提高和几
并行计算系统是计算机科学中的重要研究领域,作为并行计算系统中的重要组成部分,互连网络的性质对整个系统的性能在很大程度上起着决定性的作用。迄今已经有多种互连网络被提
在通信行业中,海量的客户数据被存储在数据仓库中得不到充分应用,这些数据中隐藏的信息不仅可以为决策者提供决策支持,还能为通信行业挖掘出潜在的客户,实现业务增值,同时通
数字图像处理的主要目的是提高图像质量、提高图像中的特征等以便人或者计算机的识别和分析。随着人类的需求的不断提高,图像处理的应用几乎在所有的科学研究、工程技术和人
随着移动互联网的高速发展,越来越多的移动信息终端被用于完成计算任务,如手机,上网本,平板电脑,掌上游戏设备等。和微型计算机使用的通用处理器不同,移动设备中大量采用定制化的嵌
随着互联网技术的飞速发展和大规模普及,基于互联网的各种开发应用已经进入到人们日常生活中的每个角落。与此同时,伴随着人们日益增加的互联网活动,网络信息安全变得日趋重要,原
随着互联网的发展和科学技术的不断进步,各行各业都出现了海量的数据,这些数据是传统的技术所无法处理的。例如在经济、金融、电信等行业都出现了海量的数据。在这样的大数据
随着网络和计算机的飞速发展,人们日常的生活越来越离不开电脑和网络。整个社会的运转对计算机和网络的依赖越来越大,政府、军队、商业机密信息的保密机制需要不断加强。然而
虚拟植物研究是一种针对植物个体或种群,集植物学、系统生物学、应用数学、信息科学和计算机图形学、可视化技术等为一体的交叉学科研究,是目前大家广为关注的热点研究之一。