基于图表示学习的恶意软件检测

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mqkxxmvo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及与互联网的高速发展,恶意软件的数量和种类越来越多,给恶意软件检测带来了前所未有的挑战。现有的检测方法可以分为基于统计特征、文本语义和行为图进行检测,虽然这些方法可以检测恶意软件,但都存在着各自的不足。基于统计特征的方法高度依赖专家经验进行特征码提取,很难识别经过混淆和加壳处理的恶意软件;基于文本语义的方法对硬件性能要求过高,无法处理过长的序列数据,导致恶意软件可轻易绕过序列检测窗口;基于行为图的方法依赖于复杂的图匹配算法以及深度学习模型,可解释性不高,无法应对采用高级对抗技术的恶意软件。因此,如何弱化人工特征提取环节,提高恶意软件的检测效果是一个亟待解决的问题。针对恶意软件检测方法的不足,本文研究了恶意软件的相关知识,包括恶意软件定义、发展趋势、检测对抗技术以及恶意软件执行过程中的典型操作行为,并在此基础上结合当前深度学习领域的研究成果,提出了基于图表示学习技术的恶意软件检测方法。该方法将函数调用序列转化为函数调用图,并结合多种方法提取各个节点的编码特征、功能特征和行为特征,从而将函数调用图转化为特征函数调用图,再通过图表示学习算法对特征函数调用图进行基于邻域跳层聚合的嵌入表示学习,最后将图节点嵌入表示输入到全连接神经网络进行分类训练。同时,针对恶意软件检测可解释性不高的缺陷,本文首次引入图像识别领域中的卷积可视化技术,对基于图表示学习的恶意软件检测模型进行了可解释性提升,通过将输出层的权重投影到图嵌入表示层,从而找到对目标类别影响最大的函数节点嵌入表示,从而定位恶意软件的关键函数与相关调用行为。本文对比了主流的恶意软件检测方法与基于图表示学习的恶意软件检测方法,并在公开的数据集上进行实验分析,精确率、召回率、F1-score等评估指标证明本文方法可大幅提升检测效果,且不过分依赖人工特征提取。同时,本文随机抽取测试集中的良性样本、恶意样本以及真实环境下的WannaCry勒索病毒进行了可解释性测试与验证,分析表明本文提出的可解释性方法能够很好地提升恶意软件检测模型的可解释性。
其他文献
本文对格木的群落分布、濒危机制、繁育及造林技术、遗传多样性、病虫害防治等方面的研究进展进行综合评述,指出后应加强格木种质资源保护、木材性质、无性繁殖等研究,重点开
从2012年开始中国白酒行业经过3年的调整后现进入了缓慢恢复期,GD省是全国最大酒品区域市场,其在全国白酒行业占有非常重要的地位。而HL白酒公司作为GD省著名的专业酿酒企业,
本文首先介绍了网络学科资源导航库和超链接结构,然后讨论了网络学科资源导航库中超链接自动生成技术、超链接的导航优化和超链接信息的检索技术.
公共艺术所体现的空间精神,引领着一座城市的风尚。文章阐释了公共艺术外部空间精神和内部空间精神的内涵,并举例论证了公共艺术作为一种当代思想表现形式,不仅能够美化城市
我国盐碱地总面积接近5.5亿亩,其中83.6%未被开发利用。为了对盐碱地进行改良,保障粮食增产和耕地面积,筛选和培育耐盐性强的水稻品种具有重要意义。本研究以辽宁省新育成的118份水稻新品系为试验材料,通过苗期和生育期不同浓度的NaCl溶液处理,筛选强耐盐性的水稻品系。同时以2份杂交粳稻和2份常规粳稻为试材,在不同浓度NaCl溶液下进行生育期鉴定,比较盐胁迫对粳稻农艺性状的影响,分析耐盐性上的差异。
贵州省碳酸盐岩分布广泛,具有典型的重金属地球化学异常特征,其中土壤和沉积物中镉的地球化学背景值为0.31×10-6,是中国地球化学丰度值的2.5~3.5倍,这种异常条件下重金属在
本文论述了国际竞争环境中知识产权信息开发的重要性,分析了企业竞争情报活动中知识产权信息资源开发利用的地位及途径,重点研究了基于知识产权信息开发的企业竞争情报战略的