未知恶意代码检测方法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lxfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的快速发展与广泛应用,计算机系统的安全受到严重的挑战,基于特征码检测法的计算机病毒检测技术,虽然能够有效地检测出已知各类病毒,但是对于新出现的病毒却无能为力,未知恶意代码的检测技术可以发现未知的恶意代码,有效地改善查杀总是落后于新病毒产生这一现状。本文在分析了基于字符串的贝叶斯方法和基于N-Gram的贝叶斯方法之后,发现朴素贝叶斯方法假设属性独立带来了检测精度降低的问题,为了解决这个问题,放弃条件独立性假设,在朴素贝叶斯的基础上增加属性间可能存在的依赖关系,用最短描述长度(MDL)度量贝叶斯网的构造,并实际应用压缩算法来解决问题。本文在MDL原则的指导下,提出了一种基于压缩算法的未知恶意代码检测技术,首先,忽略未知恶意代码结构将其看成字符串流,依据事先确定的阈值限制所抽取的最长模式,以实现处理效率和性能间的折衷;其次,将所抽取的模式按照其类别建立符合其统计特性的相应压缩字典,即正常代码和恶意代码字典;最后,通过判断利用正常代码和恶意代码字典对待测文件进行压缩得到不同的压缩率,依据最短描述原则将其归类为能取得最好压缩率的类别,从而达到检测未知恶意代码的目的。   本文的主要内容包括以下几点:   研究了常用的未知恶意代码检测技术及框架,包括特征提取与分类算法。分析了各种方法的原理及优缺点,并对基于字符串和N—Gram的贝叶斯检测方法进行实验,通过得到的结果分析相应算法存在的缺陷。   基于最短描述长度原则的指导下,提出了一种基于压缩算法的未知恶意代码检测方法,通过实验验证了本方法的性能,并同传统方法进行了对比,结果显示本方法确实能够有效地检测未知恶意代码,最后对实验结果进行了详细地分析。  
其他文献
随着科学实验规模和精度的不断提高,很多科学工程领域产生了大量的实验数据,这些数据的规模往往呈GB、TB甚至PB级别,并且在以更大的规模不断增长。当前,大跨度建筑和桥梁、高
生物种群资源是一种可再生资源。人类在发展社会经济的同时,却在不断破坏赖以生存的生态环境,过度开发导致自然资源趋于枯竭,严重制约人类社会、经济的发展。为使生物种群资
归纳推理是人脑最重要的高级思维功能之一,是学习、问题解决等其他高级认知功能的重要组成部分。自然类别的主要功能之一是支持归纳推理。目前,基于类别的归纳推理存在两种不
为了保证可信计算机核心模块的实现质量,对其进行详尽的测试和验证是十分必要的。可信计算机的符合性测试可以证明该产品是符合规范并且是功能完备的。然而,可信芯片的符合性
在中国有大量聋哑人群,手语是他们的第一语言,是他们生活、工作和学习的主要手段。近代以来,随着社会的进步和计算机科学的发展,基于计算机合成的中国手语表达给聋哑人群更好
税控系统是一种重要的局域网应用,应用在商业收款机系统上的税控系统,是用来实时地监控收款机的每一笔销售数据并进行税控处理(添加税控码到小票),然后汇总统计以达到以票控
近年来,全球范围内影响公共安全的灾难事故频频发生,给人们带来了难以承受的损失和伤害,比如最近发生的日本地震以及由此引发的海啸、核危机等。但同时也让人们开始反思如何更好
荔枝是南方特色水果,经济价值较高,在我国,荔枝的生产与加工已形成了一个产业。由于荔枝果实形态、颜色及生长环境的复杂性,实现自动化采摘非常困难,但是从长远看,自动化采摘具有很
我国的税务部门通过不断的信息化建设,各个不同平台的业务系统都积累了大量的税务管理数据。但是随着税务信息化的不断深化,税收数据的一般利用已经不能满足税收管理现代化的
无线传感器网络是一种应用了无线通信、传感器、网络、嵌入式等技术的新型数据采集处理网络系统,越来越受到世界各国的重视,不久的将来它的应用将会遍布所有领域。本论文所设