面向软错误的程序可靠性分析与优化技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:jojoyks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路制造工艺的不断进步,电子器件的集成度和工作频率越来越高、工作电压越来越低,致使其受宇宙射线、电磁辐射等因素影响而发生软错误的概率显著增加。为应对软错误对计算机系统可靠性带来的挑战,国内外纷纷展开了针对软错误的容错技术的研究。容错技术从实现方式上通常分为硬件容错和软件容错,与需要重新设计或改造硬件设备的硬件容错技术相比,软件容错技术以其开发成本低、周期短、可灵活配置等优势而备受关注。软件容错技术一直面临着时间开销大的问题,已有研究表明,程序整体的可靠性主要受程序中的某些关键数据和代码的影响,且不同编译优化序列会对程序整体的可靠性造成不同的影响,为了能以较小的时间开销获得程序可靠性的提升,研究人员开展了对程序可靠性优化技术的研究。其中,对影响程序可靠性的关键数据和代码进行分析以及对程序整体可靠性进行评估是实现程序可靠性优化的必要步骤,如何快速、准确地对程序可靠性进行分析与评估是实现程序可靠性优化的首要问题。本文围绕软错误影响下的程序可靠性分析与优化两个方面展开研究,主要贡献如下:1.提出了一种基于程序动态特征的可配置故障空间等价类划分方法。为了对影响程序可靠性的关键数据和代码进行分析,通常需要分析程序中每个可能发生故障的位置对程序的影响,即完整故障空间分析。目前,该领域最为常用的技术是故障注入技术,然而,由于程序中全部故障发生位置的数量通常十分庞大,利用故障注入技术进行完整故障空间分析通常需要很大的时间开销。为此,本文提出了一种基于程序动态特征的可配置故障空间等价类划分技术EMO-Pruner,在只针对部分故障位置实施故障注入的基础上,即可得到对完整故障空间的分析结果,同时,该技术还提供了可配置的解决方案,可以让用户在分析精度和时间开销之间取得权衡。EMO-Pruner将故障空间等价类划分问题视为针对等价类数量和划分精度的多目标优化问题,利用故障位置之间的机器状态相似性和数据流等价关系,建立了基于BP神经网络的数据流等价关系判定模型和基于多目标优化技术的等价类划分模型,并利用进化多目标优化算法,同时针对等价类划分精度与等价类数量两个目标进行优化。实验表明,EMO-Pruner能够将完整故障空间分析的时间开销降低2~3个数量级,分析精度可以根据需求灵活配置,在相同的故障空间删减率下分析精度高于同类技术Rapid和Smart Injector。2.提出了一种支持DWC软加固技术的程序错误传播分析模型Quinary。在程序可靠性评估领域,除故障注入技术外,研究人员还采用错误模型分析技术根据错误对程序的影响规律进行建模分析,以获取程序的可靠性指标。相对于故障注入技术,错误模型分析技术不需要反复对程序进行模拟执行,因而具有更高的分析效率。然而,现有的错误模型分析技术普遍没有考虑软加固机制对错误传播的影响,因而无法针对软加固后的程序给出准确的分析结果。本文针对目前软加固技术中最具代表性的复算校验(DWC)技术展开研究,分析了在DWC软加固实现中可能影响其保护范围的几种因素,提出了支持DWC的错误传播分析模型Quinary。该模型考虑了错误在静态数据依赖、控制流、内存、跨基本块的活跃变量上的传播,并考虑了错误检测机制对错误传播的影响,在支持对未加固程序进行错误传播分析的基础上,支持对DWC软加固后程序的错误传播分析。实验表明,Quinary在DWC软加固后的程序上对SDC率和故障覆盖率的分析结果能够达到与故障注入实验结果相当的准确程度,且在分析效率上可超过故障注入方法3个数量级以上,弥补了经典模型分析技术针对软加固后的程序不能得到准确分析结果的缺陷,同时,由于Quinary模型可分析的错误发生位置范围更广,且考虑了跨越基本块的活跃变量对错误传播的影响,Quinary在未加固程序上相对于经典模型Trident也具有更高的准确性。3.提出了一种基于强化学习的面向程序可靠性的编译优化序列生成方法。传统的软加固技术通常通过添加冗余计算来实现错误检测和恢复,造成较大的时空开销,在某些对计算资源限制较为严格或对实时性要求较高的应用领域,其代价往往难以接受。本文通过实验,研究了不同的编译优化序列对程序容错能力、运行性能以及可靠性的影响,并利用强化学习技术的自动学习能力,挖掘程序特征、编译优化序列和程序可靠性三者之间的内在联系。在LLVM编译器基础上建立了面向程序可靠性的交互式迭代编译框架ROICF,并将编译优化序列生成的过程定义为一个马尔可夫决策过程,然后提出了一种基于强化学习技术的模型ROPOA3C,通过多个异步运行的智能体与ROICF进行交互与更新,学习到获取最大奖励值的行动策略,使之具有对新程序自动生成面向可靠性目标的编译优化序列的能力。实验表明,ROPOA3C能够将在训练集中学习到的策略快速应用于新的程序,可靠性相对于原始程序平均提升3.62倍,平均可靠性增益有95%以上的概率超过O3优化0.2137~0.3459,与现有的同类方法GA相比,ROPOA3C在经过训练后,能够以低于其4~5个数量级的时间开销在新程序上达到与之相当的可靠性增益。
其他文献
地球系统中的各个分量之间具有紧密的相互作用,其中大气和海洋是两个最重要也最活跃的分量系统。随着海气耦合模式在天气气候研究中的广泛应用,人们对海气耦合资料同化的需求随之兴起。基于耦合模式框架,耦合资料同化可将多个分量中的观测信息吸收到耦合系统中,并允许观测信息在不同分量间进行传递和交换,因而理论上能够为耦合模式提供更加平衡和协调的耦合状态估计。耦合资料同化一般可分为弱耦合同化和强耦合同化,其中弱耦合
学位
波达方向(Direction of Arrival,DOA)估计是阵列信号处理领域的核心问题之一,在雷达、导航、数字通信、目标检测等领域都有着广泛而重要的应用。均匀线性阵列拥有规则化的阵列结构,与其匹配的DOA估计算法得到了广泛的研究,并形成了相对成熟的技术。但阵列孔径与阵列自由度受限于实际阵元的数量。基于均匀线性阵列的DOA估计算法需要通过增加实际阵元数量来提升阵列自由度,并提高精度和分辨率。近
学位
随着信息技术,尤其是传感器网络与物联网等技术的飞速发展,各类复杂系统的数据呈海量性增长,从这些数据中挖掘与系统相关的规律与模式,对于理解、分析、运用与改造复杂系统具有至关重要的作用。作为数据挖掘的基础性工作,相似性度量方法直接关系后续数据挖掘任务的实现,一直是数据挖掘研究的热点与难点。属性网络作为有效的复杂系统建模工具,其相似性度量方法主要考虑节点在整个网络中的拓扑结构特征,往往忽略了节点自身的非
学位
混合模糊测试是一种新近提出的软件漏洞挖掘技术,由黑盒模糊测试和白盒符号执行两种方法结合,很快成为软件安全领域的研究热点。混合符号执行作为其中的重要技术之一,具有求解精确、指向性强、资源消耗巨大等特点。由于真实软件系统庞大复杂,基于二进制的混合符号执行依然存在可伸缩性(scalability)问题,导致混合模糊测试效率低下,不能实用。传统的混合模糊测试提升技术多聚焦于利用多种动静态分析手段辅助模糊测
学位
移动通信的演进升级得益于系统关键性能指标的全方位倍增,加强对移动通信的性能增强研究对于加速生产生活数字化转型、促进经济发展、引领军事变革具有十分重要的意义。调制方式是决定通信系统传输性能的关键因素。空间调制技术作为一种新型的数字调制技术,突破将信息调制到电磁波的幅度、频率、相位的传统思路,以天线的激活状态作为调制手段,可实现更加高效可靠的数据传输。然而传统空间调制技术面临天线激活状态检测准确度低、
学位
在大数据时代,为了解决多源数据相互冲突问题,真值发现已广泛应用于群智感知、健康医疗、众包、知识库构建等多个场景中。但是在真值发现过程中,数据源以及真值发现平台都面临着隐私泄露威胁。具体来说,数据源向真值发现平台提交的数据通常包含了数据源的健康状况、行动轨迹、个人习惯等敏感信息;与此同时,真值发现平台通过估算获得的数据源可靠性信息可能会反映出数据源的性别、年龄、专业、受教育程度等个人属性特征;此外,
学位
物理不可克隆函数(PUF)是一种新型的物理安全原语。类似于人类的生物识别技术,它能对不同的物理实体产生不可克隆、不可篡改和不可预测的固有特定响应。PUF与传统的基于密钥的密码系统不同,它不需要在设备上存储私密信息,而是利用物理实体在制造过程中不可控的纳米级工艺偏差来产生私密信息。与传统基于密钥的硬件安全原语相比,PUF具有更高的安全性和更小的硬件开销,从而使其适用于资源有限的嵌入式系统。PUF的安
学位
数据中心为大数据存储和大数据处理提供了硬件基础。在数据中心内部,多台计算节点通过高速网络互联为分布式计算系统,并广泛用于大数据处理等应用。近年来,面向大数据处理的数据并行计算平台(如Hadoop和Spark等)受到了来自于学术界和工业界的广泛关注。大数据处理平台的调度技术会直接影响大数据处理作业的执行效率。本文从数据中心用户和数据中心管理者的需求出发,围绕大数据处理作业的资源分配和作业调度,研究以
学位
无人机是未来战场中无人作战的中坚力量,集群化是其未来发展的重要趋势之一,无人机集群具有任务拓展能力强、执行任务成本低等特点,可满足未来高动态、强对抗等复杂环境下的作战任务需求。随着无人机数量的增加、协同要素的复杂度提升和作战使用方式的拓展,如何确保无人机集群的任务成功率和任务维持能力,已逐渐成为制约无人机向大规模集群化发展的瓶颈之一。韧性主要用于描述和评估系统在遭受干扰后的恢复能力,基于韧性视角研
学位
当前,全球化“工业4.0”革命进程和我国的“中国制造2025”战略计划中,机器人均作为核心技术受到了前所未有的重视。以美国为例,谷歌公司的无人驾驶汽车、多足仿人机器人,亚马逊公司的仓储自动导引车,以及美国太空总署的好奇号火星车等都在吸引着全球媒体的目光。欧洲、日本和中国等也纷纷出台了自己的机器人研究计划。面对机器人系统及其集群任务复杂而多变的安全性需求以及恶劣与不确定性外部环境,如何安全地控制各个
学位