基于图结构的源代码漏洞智能检测技术应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zilong2006min
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,代码漏洞的数量和种类日益增加,这给软件系统安全和网络安全带来了极大威胁。漏洞检测技术可以为漏洞修复提供参考依据,有效规避代码漏洞带来的风险。传统的代码漏洞检测方法依赖于人工分析,检测成本较高。基于传统机器学习的代码漏洞检测方法只能获得代码的浅层特征,难以适应复杂的代码漏洞检测任务。深度学习技术能够学习样本的内在规律和深层次特征,从而自动化代码漏洞检测过程。目前,基于深度学习的代码漏洞检测技术仍处于探索阶段。现有方案存在代码表示涵盖信息不全、扁平化代码图表示丧失结构信息等问题,检测效果不佳。此外,基于深度学习的代码漏洞检测还面临缺乏标注数据的问题,难以进行有效的模型训练。并且受数据分布差异的影响,检测模型会在跨域检测时出现明显的性能下降问题。本文针对上述问题展开研究,主要工作内容如下:首先,本文设计了基于图结构的源代码漏洞智能检测方案。针对现有方案中代码表示涵盖信息不全的缺陷,该方案为源代码构建了一个涵盖信息更为全面的图结构表示,并对图结构数据中的顶点和边进行数字化、规整化处理,使其在保留代码信息的同时适应模型输入。同时,为了避免扁平化代码中间表示图导致结构信息丧失的问题,方案采用门控图神经网络模型学习代码漏洞特征,并通过注意力机制生成图嵌入向量,最终实现了代码漏洞分类。其次,本文设计了基于度量迁移学习的漏洞检测方案。针对标签数据缺少导致模型训练不足的问题,方案在基于图结构的源代码漏洞智能检测方案的基础上通过学习源域样本与少量目标域标签样本,获取代码的高级表征并构建源域与目标域间的变换矩阵,实现了知识从源域到目标域的迁移。该方案为基于图结构的源代码漏洞智能检测模型提供了跨域检测方法,使其能更好地应用于真实世界中的漏洞检测任务。最后,本文通过一系列的实验,评估了方案的可行性与有效性。实验结果表明,基于图结构的源代码漏洞智能检测方案在具有单一漏洞类型的人工合成样本数据集上平均F1分数可达91.5%,在具有多种漏洞类型的真实项目数据集上平均F1分数可达90.5%,比现有的方案具有更加优异的检测性能。同时,实验表明使用迁移学习方案的模型在跨域检测任务中的F1分数提升了10%以上,证实了迁移学习方案能够有效减缓数据分布差异的影响,实现模型在缺乏足够标签的数据集上的漏洞检测。
其他文献
自从2008年区块链问世以来,区块链在金融和数字货币、社会治理、数据存证与溯源、游戏和教育等多个领域行业的探索创新与应用不断地推进,呈现百家争鸣的盛况。然而区块链种类繁多,实现方案参差不齐,使得区块链系统之间的存在明显的异构化问题,区块链之间互联的难度也大大提高。另外其安全措施、共识算法和隐私保护等安全措施的差异性,导致了区块链系统安全性差异较大,区块链间的互通难、互信难的问题日益突出,形成了区块
学位
随着全球向数字化信息时代的转变,各行各业都掀起了一场数字化浪潮,尤其是我国电子商务和电子支付的迅猛发展,使得企业在财务报销和税务管理方式上发生了深刻的变化。面对电子发票开具量的急剧增加,分布式存储架构成为支撑电子发票管理、查询和维护的首选方案。然而,在构建高效、便捷、快速的电子发票服务系统的同时,分布式架构的数据管理性能、非关键字查询效率和数据有效性查验等方面依然存在诸多不足,因此还需寻找并研究高
学位
学位
目的:(1)通过对古代典籍以及近20年现代文献有关色诊源流和舌、面诊图像校正方法的整理研究,为舌、面诊图像标准色卡和数据库的建立提供理论和技术上的支持;(2)系统整理课题组积累的舌、面诊图像资料,建立规范的典型舌、面诊图像数据库,有利于推动舌、面诊图像数据的规范管理和资源共享;(3)针对舌、面诊数字化中舌、面图像颜色色差的问题,以舌、面诊典型图像库为基础,设计舌、面诊图像专用色卡,以期规范统一舌、
学位
自动驾驶汽车(Autonomous Vehicle,AV)又被称为无人驾驶汽车或者轮式移动机器人,是一种通过电脑系统控制实现的、在无人驾驶的情况下自动行驶的智能汽车。自动驾驶汽车属于机器人的范畴,是一种快速轮式自主移动的机器人。机器人操作系统(Robot Operating System,ROS)是一个开源的元操作系统,提供了必要的操作系统服务,许多成功的自动驾驶操作系统都建立在ROS的基础之上,
学位
当今社会中,网络交流在日常生活中占据着重要地位,同时也带来了一系列的信息安全问题。为了防止网络中的恶意第三方假冒正常用户,通常需要进行身份认证,即通过一定的技术手段,对网络中的用户身份进行确认。身份认证方案的构造方法也很多,比如基于密码学知识的认证,基于生物学特征的认证等等,相比较而言,基于密码学上的困难问题构造身份认证方案的应用更加广泛。目前,大量身份认证方案的构建基于密码学里传统的困难问题,例
学位
云计算技术的发展为用户提供了诸多便利,使其在享有海量计算资源和存储资源的同时,极大地减少本地的开销。然而,由于云计算模式下数据所有权与管理权相分离的特点,用户将数据加密后外包成为了必然趋势。因此,如何实现云环境下对密文数据的高效检索成为了研究热点。可搜索加密技术作为实现高效加密数据检索的关键技术,受到了学术界和产业界的广泛关注。可搜索加密技术通常基于服务器诚实且好奇的模型设计,即假设服务器会忠实执
学位
双驱互联式电磁阀是一种采用双阀芯集成式串联布置的分步直动式电磁阀,适用于核电等诸多领域的介质通断控制。介绍了驱互联式电磁阀的结构组成、工作原理,并对该阀进行了应力分析。
期刊
综控结构化通用平台采用软件化飞行器测控的思想,解决现有飞行器测试中组件难复用、测试周期长和硬件耦合深的缺点。从功能角度来看,综控结构化通用平台涉及的各个功能模块采用低耦合高聚合的集成和支持策略,单个模块独立自主,各模块之间耦合度低,在保证功能完善性和可用性的前提下,同时又整合在一个平台之下使其具有规模性和效率性;从控制角度来讲,综控结构化通用平台对测控涉及到的各个流程进行规范化处理,整体流程具有一
学位
云计算和物联网的快速发展导致了数据量呈爆发式增长,越来越多的用户选择将数据外包给云服务提供商,减少数据的存储和管理成本。然而在云环境下,用户数据的管理权和所有权会产生分离,这会对用户存储在云端的数据造成威胁。具体来说,由于软硬件的故障或人为等因素的影响,云可能会错误地篡改或删除用户的数据。然而,用户本地并不存储外包数据,所以无法直接验证云端数据的完整性。因此,如何保障外包数据的完整性成为数据安全领
学位