基于传播链的缺陷定位及修复技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：deng_95132

【摘要】

：

缺陷作为软件系统设计和维护过程中不可避免的产物,随着软件系统的规模和复杂程度的增加也在不断增加。将软件缺陷的定位与修复工作进行自动化,对于提升软件调试效率以及软件

【作者】

：

李唯实

【出处】

：

国防科学技术大学

【发表日期】

：

2016年期

【关键词】

：

缺陷定位自动程序修复错误传播链缺陷容忍缺陷排除错误深度巧合正确性聚类分析可疑代码集过滤分组迭代修复

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

缺陷作为软件系统设计和维护过程中不可避免的产物,随着软件系统的规模和复杂程度的增加也在不断增加。将软件缺陷的定位与修复工作进行自动化,对于提升软件调试效率以及软件质量有着重要意义。多年来学术界和工业界一直致力于高效的、准确的缺陷定位和自动修复技术的研究,取得了不少进展。然而由于软件缺陷作用机理的复杂性,目前的缺陷定位和自动修复技术仍然面临很大挑战。本文基于软件执行过程中错误的传播过程,对现有的缺陷定位技术以及基于缺陷定位的自动修复技术修复效果进行研究分析,并针对缺陷定位、补丁生成以及补丁验证三个方面,研究基于测试用例聚类的缺陷定位优化技术、基于可疑代码集过滤的程序自动修复技术以及基于测试用例分组的迭代修复技术,提出了一系列提高缺陷定位能力和自动修复能力的优化技术,并通过对大型开源软件真实历史错误进行缺陷定位和修复实验,依据科学统计和度量方法验证了这些优化技术的效能。论文的主要研究工作及创新点如下:1)从缺陷容忍和缺陷排除的角度出发,对现有的程序自动修复工具的修复效果进行分析在研究领域,缺陷容忍和缺陷排除是两类主流的提升软件可靠性和安全性的方式。现有的程序自动修复工具均专注于通过补丁生成的方式来修复目标程序暴露出来的故障,却忽略了对修复效果的分析研究。本文通过收集两种主流的软件自动修复工具:Genprog以及CETI所生成的修复补丁,分析各个修复补丁中所修改的代码与目标程序中的软件缺陷之间的关联性,研究现有修复工具的修复效果是倾向于实现缺陷容忍还是缺陷排除。此外,本文还提出了缺陷复杂程度和错误深度的概念,通过缺陷所涉及的代码数来简单表示缺陷的复杂程度,以及通过从缺陷到失效所经过的传播链的长度和缺陷所影响的错误传播链的数量来定义程序中所包含错误的深度,并分析统计了缺陷的复杂程度、错误深度与最终修复效果(生成补丁是属于缺陷容忍还是缺陷排除?)之间的关联程度。分析结果表明,现有程序自动化修复工具更多地是以缺陷容忍方式而不是缺陷排除方式来修复目标程序,缺陷的复杂程度越低、错误深度越小,就越可能通过缺陷排除的方式进行修复,反之,则只能通过缺陷容忍的方式进行修复。2)提出了基于测试用例聚类的缺陷定位技术优化方法基于程序谱的缺陷定位技术(SFL)是目前最为流行的一种缺陷定位技术,然而由于其是根据测试用例集来进行统计定位缺陷的,它的定位精度必然受到巧合正确性现象(coincidental correctness)的影响。巧合正确性是指在测试用例执行过程中,缺陷所在代码被执行,但缺陷并未被激活或错误的传播并未导致失效的情况,由于sfl是根据执行测试用例所覆盖的代码以及执行结果来统计得到各个程序代码为缺陷所在的可疑度,巧合正确的测试用例越多,其定位缺陷的精度就越受影响。本文通过对部分缺陷程序进行缺陷定位实验,观察到在巧合正确的测试用例之间,测试用例执行过程中的错误的传播链之间具有很高的相似性,基于这个观测结果,假设在执行所有巧合正确的测试用例时,其行为之间均具有很高的相似度,并提出了一种基于聚类分析的缺陷定位优化方法tsar(testcaseselectionandreconsitution),通过将测试用例进行聚类,并基于聚类来构建新的覆盖矩阵来进行缺陷定位的可疑度计算,从而尽可能地削弱巧合正确性现象对sfl的定位精度的影响。实验结果表明,在大部分情况下,通过tsar能有效提高sfl的定位精度。3)提出了基于可疑代码集过滤的程序自动修复技术优化方法目前,自动化的程序修复技术往往是通过修改一处或多处的代码来产生修复补丁,这些可进行修改的代码集合通常是通过缺陷定位技术来得到的,且被称为可疑代码集。然而,现有的可疑代码集中往往包含大量与成功修复无关的代码,这些代码影响了自动修复的效率。本文提出了一种过滤可疑代码集中无用代码的方法sfcsf(suspiciousfaultycodesnippetfiltering),在保证修复成功率的同时可以有效地减少可疑代码集的大小。sfcsf依托于基于程序谱的缺陷定位(sbfl)技术来获得各个代码的可疑值。基于错误的传播链,sfcsf只从可疑代码集中过滤出在错误传播链上那些可疑值即将发生变化的节点处代码作为过滤后的可疑代码集进行自动修复。实验结果表明了sfcsf在大多数情况下能够大大提高了自动修复工具的修复效率,但同时,sfcsf的有效性也受到了测试用例集的制约:程序谱过于相似的测试用例集将使得sfcsf失效。4)提出了基于测试用例分组的迭代修复技术在补丁验证阶段,自动化的程序修复技术往往使用测试用例集来验证所生成补丁的有效性:只有使得所有测试用例的执行结果均正确的补丁才是正确的修复补丁。这种验证方式表明现有的自动化的程序修复技术仍是基于缺陷排除的思想来生成并验证补丁的,而忽略了部分修复的可能性。而本文之前的研究表明,修复结果大部分是缺陷容忍的。自动修复技术的目标与结果之间的矛盾性使得修复的成功率和效率受到很大影响,特别是针对复杂缺陷,现有的自动修复技术的修复效果并不理想。本文从实现缺陷容忍的角度出发,提出了一种基于测试用例分组的迭代修复方法,该方法根据测试用例的代码执行信息将测试用例进行分组,并基于迭代的方式对程序进行修复:每次迭代的目标在于生成能够满足一组或多组测试用例的中间补丁,通过多次迭代,最终获得满足所有测试用例的修复补丁。实验结果显示,本文方法能够大大提高对程序缺陷特别是复杂缺陷的修复能力。

其他文献

分析个性化口腔护理方法在口腔颌面外科患者中的应用效果

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

个性化口腔护理方法口腔颌面外科应用效果

传播视域下高校外宣翻译策略探微——以《四川文理学院外宣手册》英译为例

以《四川文理学院外宣手册》的英译为研究文本,从传播学的角度分析外宣和外宣翻译的定义,阐释传播与翻译的内在关系,探究外宣翻译原则和传播途径。在具体的研究中,对英译文本

期刊

外宣翻译传播翻译原则传播途径《四川文理学院外宣手册》

带有通配符和长度约束的模式匹配问题求解及其应用研究

带有通配符模式匹配是模式识别领域中重要的研究方向之一,在计算生物学、信息检索、网络安全等研究领域中都得到了广泛关注。它是通过在模式识别问题中引入通配符这种特殊字

学位

模式匹配通配符限长空位相似性度量

共生视域下隔代教育的透视与思考

摘要：现代社会经济在不断的发展中，人们的生活方式发生了重要的变革，一些年轻家长为了更好地投入到生活和工作中，将孩子的生活护理和教育辅导等责任交给了孩子的祖辈家长。隔代教育虽能使年轻父母节约精力和时间，减轻生活负担，但是基于事物的两面性思考，隔代教育也带来了一系列的问题，尤其是给祖辈家长带来了更大的责任和压力。共生视域下的隔代教育是从价值观角度对隔代教育展开新的思考，对隔代教育的内在价值进行深度发掘

期刊

隔代教育共生透视思考Intergenerational educationsymbiosisperspectivereflection

叶面喷施褪黑素调控水稻幼苗耐盐性的浓度效应研究

为了探讨褪黑素（MT）对植物耐盐性的调控,以水稻＂盐稻12号＂为试验材料,研究了外源MT对75 mmol L^-1 Na Cl胁迫下水稻幼苗株高、干重（DW）、根冠比（R/S）、氮磷钾（NPK）及钠（Na）含量的影响,并

期刊

褪黑素喷施水稻幼苗盐胁迫氮磷钾营养离子稳态

蔬菜品牌创建实现路径、机制创新和支撑政策研究——基于乡村振兴战略视角

人民日益增长的对美好生活需要与不平衡不充分发展之间的矛盾和农产品品牌息息相关。本文在阐述了发展品牌蔬菜对实施乡村振兴战略的意义之后,分析了品牌蔬菜发展中面临的困

期刊

乡村振兴蔬菜品牌路径体制机制政策

基于面网格的物理仿真方法及其在数字化制造中的应用

物理仿真是基于真实世界物理规律,在计算机中虚拟地重现流体运动、弹性体形变等各种物理现象的过程。由于物理仿真能够达到很高的精度,而成本比物理实验要低,因此被广泛应用

学位

流体仿真表面张力平均曲率流曲面着色3D打印粘性薄膜水转印塑性薄膜热塑成型纹理映射

基于传播链的缺陷定位及修复技术研究

其他学术论文