基于Q-Learning的马尔可夫决策过程源代码对抗样本生成方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户：w11425635

【摘要】

：

【作者】

：

王辰欣

【机构】

：

河北大学

【出处】

：

河北大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,深度学习理论和技术都取得了突破性的进展。应用基于深度学习的技术自动识别和分类程序源代码,提高了开发人员对程序的理解和分析效率,并且有助于后续软件的开发和维护,在代码分类实际应用中有着出色的表现。然而,深度学习模型往往容易受到恶意对抗样本的干扰,致使其做出严重的错误决策。针对这类问题,如何有效生成对抗样本来参与对抗训练提高模型的鲁棒性引起了源代码处理领域研究人员的广泛关注。源代码的离散化和结构化特性为源代码领域生成对抗样本带来了新的挑战,针对现有对抗样本生成方法只对代码执行单词级和字符级执行标识符重命名以及死代码地插入,对代码结构特征关注不足。本文提出了一种基于Q-Learning的马尔可夫决策过程方法（Q-Learning-Based Markov Decision Process,简称QMDP）,在代码结构信息粒度进行攻击生成对抗样本。本文主要工作如下:（1）本文定义并实现了一组对抗攻击方式对代码结构执行等效转换,全面地运用代码的高度离散化和结构化的特征,解决现有对抗样本生成方法对代码结构信息考虑不足及对抗操作过于单一的问题;（2）本文提出了基于Q-Learning的马尔可夫决策过程方法,引入强化学习的思想,将代码转换空间的组合问题转换为转换操作序列的排列组合问题。解决了现有的对抗样本生成策略执行效率低、时间和资源消耗大的问题,实现更快更有效的对抗样本生成方案;（3）本文在公认的源代码分类开源数据集Open Judge（OJ）上设计了实验进行评估,验证了源代码结构特征具有非鲁棒性,验证了本方案生成对抗样本的有效性。实验结果证明使用本方案生成的对抗样本对用于OJ数据集上的源代码分类模型LSTM和ASTNN执行对抗训练后,模型的对抗鲁棒性可以分别提高44.0%和44.8%。

其他文献

鲁棒极限学习机算法研究

鲁棒极限学习机因其较高的泛化能力和较快的学习速度。已经成为比较常用的机器学习工具之一,并在现实中的许多方面得到应用。然而,传统的鲁棒极限学习机还有不足之处:一、大多数鲁棒极限学习机以2L范数为损失函数。众所周知,2L范数对于异常值非常敏感,更容易受到极端异常值的影响,当数据中含有过多极端异常值时,大多数算法将崩溃。二、鲁棒极限学习机对于神经元数量非常敏感,当神经元数量过多时,可能会发生过拟合,导致

学位

基于区块链的策略隐藏访问控制方案研究

物联网技术的不断发展极大的改善了人们的生活质量,同时也带来了一些新的挑战。万物互联时代离不开数据的交互,访问控制被认为是实现数据安全交互的一种重要方式,然而现有的访问控制方案大多都是基于集中式服务器构建的,存在单点故障问题。区块链应用了多种技术实现了去中心化,被认为是一个很有前途的分布式解决方案,能够有效提高访问控制系统的可靠性。因此,本文对基于区块链的访问控制机制展开研究,主要工作如下:针对传统

学位

基于区块链的可仲裁数据持有性证明方案研究

基于云计算平台的云存储系统为用户提供了海量、可弹性扩展、低成本和低能耗的远程存储服务,因此越来越多的人选择将自己的数据外包给云服务器,进而不受本地有限存储空间的约束。然而,用户一旦将数据存储到云服务器,将失去对数据的物理控制,存储在云服务器中的数据便面临着泄露、恶意删除和被篡改的风险。随着云存储安全的问题日益凸显,审计云数据完整性的持有性证明方案成为研究者们关注的重点,学术界提出了多种数据持有性证

学位

基于折叠与多重注意力的点云补全和配准方法研究

随着机器视觉在三维领域的发展,点云以其便于采集、数据量小和信息丰富准确的优点得到了大量关注,相比于其他数据表现形式,诸如体素、mesh网格等,点云的特性使其更适用于自动驾驶、机器人视觉等需要快速处理的应用。点云通常由激光传感器或深度相机扫描获取,会出现物体不完整和坐标系不统一的情况。点云补全是从不完整的点云中挖掘信息,补全点云的缺失信息,构成一个完整对象,常用于解决扫描物体不完整的问题,点云配准是

学位

基于MAPANet网络的车辆图像再识别模型

车辆再识别是在海量车辆图像或视频中检索目标车辆的过程,属于图像检索的子问题。在交通系统中引入车辆再识别技术,既能提高交通管理自动化程度又能保证对车辆定位追踪的准确性,传统的车辆图像处理技术不能很好的提取车辆特征,从而影响后续车辆再识别的效果。本文针对车辆特点及其所处复杂外界环境的特点,研究有效的车辆图像再识别算法。主要工作有:（1）基于MAPANet的车辆图像特征提取。依靠车辆图像中具有区分性的局

学位

漏洞数据集对智能漏洞检测方法的影响研究

软件漏洞导致了许多系统攻击和数据泄露,软件安全问题逐渐引起关注,软件漏洞检测现已成为一个重要的研究方向。近年来,深度学习技术已应用于漏洞检测,基于深度学习的漏洞检测方法不需要手动定义特征,实现了低漏报和低误报。深度学习技术依赖于数据集,最近的研究发现,不同的漏洞数据集对基于深度学习的智能漏洞检测方法的效果有不同的影响。漏洞数据集的真实性、不平衡性和重复率会影响基于深度学习的智能漏洞检测方法的有效性

学位

基于流特征的智能物联网设备识别方法研究

近年来,随着大数据、人工智能、高速网络等技术的发展,入网的物联网设备数量迅猛增长。物联网设备在智能家居、智能电网、智慧城市等应用场景下为人们生活生产带来便利的同时,也给网络带来了潜在的威胁。为了保证物联网网络的安全,需要对物联网设备进行高效,准确的管理和识别。针对物联网设备进行管理时,时效性要求较高,这意味着在网关处进行设备识别和管理具有十分重要的意义。然而目前提出的物联网设备识别方案普遍开销较高

学位

几类新型模糊蕴涵与应用研究

模糊蕴涵是模糊集理论中一类主要的逻辑连接词,在模糊逻辑、近似推理、模糊控制、模糊专家系统、模糊神经网络、图像处理和数据挖掘中发挥着重要的作用。一方面,广泛的应用推动着模糊蕴涵理论的研究。另一方面,随着人工智能的发展,模糊蕴涵在不确定性知识表示与推理中发挥着不可或缺的作用。因此,在过去十几年中,关于模糊蕴涵的性质、刻画、构造方法与应用一直是模糊逻辑中的研究热点。本文主要围绕几类新型模糊蕴涵的性质、构

学位

抗锯齿无锚框目标检测模型及其压缩方法研究

随着各领域对目标检测任务的需求日益增多,目标检测模型面临的挑战也逐渐多样化。虽然无锚框目标检测模型当前性能突出,但在特征学习过程中存在锯齿问题,并且对多尺度目标处理的结果不够理想,因此,设计了一种抗锯齿无锚框目标检测模型;针对无锚框目标检测模型存在的参数量冗余、计算复杂度高等问题,设计了一种由注意力模型引导的模型压缩方法。具体研究内容如下:（1）抗锯齿无锚框目标检测模型为了解决无锚框目标检测模型存

学位

跨数据孤岛的联邦学习数据隐私保护方法研究

隐私问题限制了数据的流通和利用,使拥有数据的各方形成了一座座数据孤岛。联邦学习和同态加密或差分隐私相结合能够实现跨孤岛的联邦学习,打破这种数据孤岛。基于同态加密的联邦学习在实现分布式机器学习的同时能够保护用户数据隐私,但加密后的数据是透明的,无法检测正确性,因此对恶意节点的容忍能力不足。使用差分隐私能够在联邦学习过程中保护各节点的数据隐私,但在模型参数中添加噪声会降低模型检测的准确率和收敛效率。针

学位

基于Q-Learning的马尔可夫决策过程源代码对抗样本生成方法研究

其他学术论文