基于强化学习的云端未知威胁检测技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:TemplarLee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,云计算的相关概念得到广泛普及,基于云平台的应用技术也成为研究热点,云数据中心在信息和互联网技术中扮演着不可或缺的重要角色。但与此同时,其快速发展的同时,面临的潜在安全威胁也逐渐凸显。云数据中心网络监控的性能开销大以及云端恶意软件更新频繁的问题日益突出。如何有效地提高我们对云端恶意软件的主动检测能力对于如今云平台安全防护起着至关重要的作用。本文对基于强化学习的云端未知威胁检测技术进行了研究,从而实现对云平台下Windows恶意软件的主动防御,本文主要做了以下三个方面的工作:1)设计一个基于云平台下Windows恶意软件静态特征提取的对抗样本生成模型:Gym-plus。此模型针对云端大量复杂Windows应用,使用python中的LIEF库对其进行静态特征的提取。使用现有的高检测模型对提取的静态特征进行检测,判断其是否恶意。通过强化学习的方法不断学习训练,使其产生新的可以绕过检测的对抗样本,大大提高恶意样本绕过检测模型检测的能力。2)提出一个基于云平台下Windows恶意软件动态特征提取的对抗样本生成模型:Mal-RL。此模型主要针对云端Windows恶意软件动态API调用特征进行提取检测。通过虚拟机将Windows恶意软件动态API调用特征提取出来,建立高效的检测模型,使用强化学习方法对所提取的API调用特征集合进行修改,引入了最小修改成本、虚拟善意样本、最佳对抗样本等概念,提高修改效率,加速对抗样本的生成。实验结果表明,Mal-RL所产生的对抗样本攻击成功率比传统的随机方式更高。3)设计一个基于二级训练的云端未知威胁主动防御系统。将两模型串行起来进行强化学习训练,弥补了 Gym-plus精准性与Mal-RL处理样本速度上存在的不足,高效地将两模型融入到一起,处理样本速度快,精准性高。同时系统分析现有检测模型的优缺点,并针对现有检测模型无法有效甄别“伪装善意软件”(即对抗样本)的问题,提出一种两级训练方法。方法包含基于大规模数据的预训练和基于对抗样本的重训练两部分。实验证明,通过两级训练方法,得到的检测模型的检测准确率从15.75%增加到93.5%,效果显著,大大提高模型的主动防御能力。
其他文献
随着脑影像技术的快速发展,可利用的数据量与日俱增,对多数据集的组分析发展成为大脑成像数据分析中的一个重要课题。组分析主要关注于从多个数据集中提取群体的共性特征和差异特征,其优势在于利用大数据得到可靠的分析结果。目前组分析技术存在两个问题:一是多次数据降维导致的定阶问题,二是先验信息利用不充分的问题。本文分别针对这两个问题给出了改进思路,并提出了优化的组分析方法,主要工作总结如下:提出维度优化概念并
大数据时代迫切需要性能强劲的计算基础设施为企业和个人提供服务,构建分布式系统是一种比较合适的方案。随着分布式软件基础架构越来越复杂,新的复杂问题陆续显现。其中,性能和可靠性对于分布式系统非常重要,缓慢低效和不可靠的分布式系统容易让用户遭受到经济损失。虽然近十年分布式软件发展非常迅速,其性能也得到了明显的提高,但是性能缺陷仍然危及分布式系统的可靠性。虽然对于单机系统中的性能缺陷已经有了不少的研究,但
目标识别基准图制备是飞行器目标识别的关键技术之一,该技术为景象匹配提供基础的数据保障。高精度高时效性的基准图像制备技术对于提高识别的精度至关重要,基准图像中的像素定位误差直接影响识别的精度。近年随着惯导相关传感器精度的提升、无人机控制技术成熟,利用无人机拍摄的航空影像数据已成为制备识别地面目标所需基准图的趋势。本文利用基于带成像平台的无人机拍摄图像接开展基准图制备方法的研究。在制备完成基准图后深入
随着信息技术在教育中应用更加广泛,大规模在线开放课程作为信息时代一种新的教育形态,快速渗透到我们生活之中.在线学习不受时间、地域的限制,提升互动体验,实现在线学习的个性化学习.但是也面临着投入时间不足、缺少计划、突击浏览、随机终止、高辍学率、低通过率等问题.传统课堂的质量分析方法(专家主导、基于标准、阶段性)又很难适应于分析在线课程视频吸引力.需要提出新方式、新方法研究在线课程视频吸引力.从而加深
关联成像是近年来发展出的一种新型成像方式,它区别于传统的直接成像,在抗散射成像、医学造影、低成本红外遥感等方面具有巨大的潜力和应用价值。关联成像是一种非点对点的成像,具有光路的非定域性,通过收集物体反射或者透射光的总光强值,与参考臂光场做关联运算提取出物体的透射率或者反射率信息。光的偏振很早就被人们所熟知,但其实际应用却是近几十年才得以发展。近年来依据偏振原理的偏振去雾、水下成像、伪装识别等应用也
随着选择性激光熔融(Selective Laser Melting,SLM)等金属3D打印技术的日渐成熟与发展,改变了金属零件设计受传统加工工艺制约的局面,使得封闭内腔、复杂曲面等复杂结构的制造成为可能,极大的拓宽了机械零件的设计思路。利用3D打印技术可以实现战场装备维修的柔性保障和伴随保障,然而装备零件大多数是根据传统加工工艺要求进行设计的,零件内部往往存在材料冗余,严重影响零件3D成形的速度,
MOOC(Massive Open Online Course,大规模开放在线课程)等在线教育模式的普及为全球学习者带来了革命性的教育资源升级的同时,也使更多的学习者陷入知识迷航的困境。为了提高在线教育资源的利用率,深入挖掘MOOC之间的关系,本文围绕MOOC资源知识图谱的构建和应用展开研究,以构造一个多源实例丰富、内部联系充分、实体关系准确的跨平台的MOOC资源知识图谱为目标,为使用者提供更具针
目前,人工智能在图像处理领域已经取得了很大的成功,这主要归功于以深度神经网络为代表的一系列机器学习模型。在大规模训练数据的驱动下,通过层次化的图像特征提取,机器学习在很多图像处理任务上已经超过了人类极限。具体来说,目前主流的图像特征提取方法大多数都是建立在训练数据和实际测试数据有着较强的一致性这个假设之上的。然而,在大多数实际应用场景中,实时处理的数据流(测试数据)和训练数据的分布之间通常存在较大
新城区的发展对城市整体结构的合理化和社会经济的可持续发展起着重要的作用。从中国城镇化发展的角度来看,新城区的发展是推进城市空间向外扩张、重新进行城市产业布局、实现城市兼并乡村的有效途径。吕梁新城区自2012年10月动工以来,城市扩建取得了显著成效,但瑕不掩瑜,吕梁新城区在其建设发展过程中也存在规划设计不够合理和城市建设融资困难等问题和不足。本论文采用资料收集法和经验总结法,通过总结和借鉴国内外理论
随着信息化装备相继配发部队并普遍运用,仅依靠部队自身力量已经不能满足装备故障应急快速抢修任务需求,而依靠民用抢修力量并有效整合军地间资源,可以有效提升部队的装备精确保障能力。装备精确保障的核心和实质是利用“信息流”导引“物质流”,即开展基于军民融合的装备故障应急快速抢修的关键是各级保障机构通过信息系统实现各种保障信息地获取与利用,并通过科学预测、综合评估,实现保障机构的高效协同。本文围绕基于军民融