基于Stacking算法的恶意软件检测方法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:as78dfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恶意软件是在计算机系统上执行恶意任务的程序。随着互联网技术的发展,恶意软件攻击的频率呈指数级增长,恶意攻击已成为威胁互联网安全的关键所在。恶意软件的检测方法对于防范安全漏洞、数据盗窃和其他危险至关重要,因此,恶意软件检测已经成为一个重要的研究领域。传统的检测方法容易受到混淆和变形技术的干扰,这些干扰降低了恶意软件检测的正确率和效率。随着机器学习和深度学习技术的兴起,部分研究人员已经将这两种技术应用到恶意软件检测的领域中,并取得了显著效果,但是现有的恶意软件研究中,并没有考虑恶意软件数据集的属性重要度问题,导致检测效率低,无法凸显有效信息,另一方面数据集的不平衡性会影响恶意软件检测的正确率。针对这些问题,本文提出一种基于Stacking算法的恶意软件检测方法。主要内容包括以下三个方面:(1)针对恶意软件属性维度高、筛选重要属性困难,导致检测正确率和效率低的问题,本文利用天牛须搜索算法能够寻找最优值的特性以及属性重要度公式,对PCA降维算法进行优化,从而去除重要度较小的属性,降低维度的同时得到重要属性。该方法在保证原有数据分布和重要信息的情况下,有效地简化数据,凸显重要信息,降低检测方法的时间和空间复杂度。(2)针对数据集的不平衡性和属性重要度会影响恶意软件检测方法正确率的问题,本文对随机森林算法进行改进,提出一种基于模糊决策的随机森林优化算法,将其作为Stacking算法的基分类器之一,解决数据的不平衡问题,提高检测正确率。(3)将优化后的随机森林算法、梯度提升树算法以及逻辑回归算法融合成最后的Stacking算法,将预处理后的数据集以交叉验证的方式作为恶意软件样本,利用Stacking算法进行恶意软件检测,并对本文提出的检测方法以及优化算法进行对比实验分析,采用正确率、精确率、召回率以及AUC值等客观评价指标进行多维验证。实验结果显示,与当前流行的恶意软件检测方法相比,本文的方法有效地提升了检测的正确率和效率。
其他文献
近年来,心血管病发病人数持续增长,针对其最有效的方法就是介入手术治疗。可目前介入手术医生缺口较大,加之手术环境影响医生健康,亟需介入手术机器人的出现。精准安全稳定地
为保证日益复杂化和大型化的工业系统能够安全可靠运行,采取及时有效的基于解析冗余的故障诊断策略是目前行之有效的措施之一。线性离散时变(Liner discrete time-varying,简
合成作战是现代警务机制建设的重要环节,对提高公安机关的整体效能,发挥多警种优势,实现优势互补,高效实战具有重要作用。然而当前的合成作战系统存在的人员责权不明,装备保
由于高铁技术的成熟,跨省旅客的运输方式已经由原来的长途大巴转变为高铁定点、定时发送,这样既节省了成本,同时大大节约了旅客的出行时间。但是,省内短途旅客的运输,如果采
氧是维持动植物生命活动、有机体新陈代谢所必须的重要元素。在环境、医疗、生物、化学、工业、食品等诸多领域对氧含量的精确监测具有重大的战略意义,发展相应的氧检测技术
轴承是旋转机械中不可或缺的一部分,其性能关乎着整个机械设备的寿命和可靠性,因此在投入使用前,须对其各项性能参数进行实验测试及验证。而现有的轴承试验装置大多针对中大
在露天矿采掘生产过程中,如何高效合理的利用采运设备进行生产,是矿山企业发展面临的重要问题。行程时间作为衡量道路通行能力的重要参数,对其进行实时预测,可以实现卡车在运
在互联网迅猛发展的今天,信息过载的现象愈发严重,在这种情况下,信息的生产者和消费者都会受到不同程度的影响。一方面,信息的生产者难以确保他们的信息或产品能够被目标市场
多任务优化是优化领域中一个新兴的研究方向,研究如何同时、有效地处理多个优化问题。基于演化算法的多任务优化利用基于种群搜索的潜在并行性来实现多个优化问题的跨域优化
图像采集设备和网络通讯技术的进步以及图像处理技术的发展,使得图像逐渐成为通信的重要载体。但也给不法分子带来了可乘之机,如果在新闻报道、法庭取证、保险理赔、国际事务