【摘 要】
:
软件缺陷定位是软件工程领域的一个重要研究方向。由于缺陷数量和代码规模不断增长,如何自动定位缺陷位置成为研究人员近年来关注的热点之一。面向软件缺陷报告的缺陷定位方法以缺陷报告作为查询,以项目的源代码作为语料库,通过分析缺陷报告与源代码单元之间的相关性识别缺陷对应的源代码单元,实现缺陷定位。目前方法级细粒度软件缺陷定位工作将方法作为独立的代码单元考虑,忽略了方法和文件的从属关系,导致了较低的定位准确度
【基金项目】
:
国家自然科学基金面上项目(编号:61972335);
论文部分内容阅读
软件缺陷定位是软件工程领域的一个重要研究方向。由于缺陷数量和代码规模不断增长,如何自动定位缺陷位置成为研究人员近年来关注的热点之一。面向软件缺陷报告的缺陷定位方法以缺陷报告作为查询,以项目的源代码作为语料库,通过分析缺陷报告与源代码单元之间的相关性识别缺陷对应的源代码单元,实现缺陷定位。目前方法级细粒度软件缺陷定位工作将方法作为独立的代码单元考虑,忽略了方法和文件的从属关系,导致了较低的定位准确度。此外,尽管缺陷定位已经有不少的研究工作,但是缺乏实用的缺陷定位工具。为了提高细粒度缺陷定位准确率,本文研究了细粒度软件缺陷定位方法并构建了一个缺陷定位工具。本文工作主要包含以下几个方面:(1)提出使用文件信息增强的方法级软件缺陷定位技术FMBL。它考虑方法与文件之间的从属关系增强缺陷定位的准确性。FMBL综合考虑代码与缺陷报告的词汇相似度、语义相似度和代码长度来度量它们之间的相关性。在六个开源软件项目上进行实验研究以评估该方法的有效性,六个项目上的平均Accuracy@10、MAP、MRR分别达到0.436、0.223、0.296。和 BugLocatorm、BLIA、BugPecker 相比 FMBL 在 MAP 指标上分别提升 153.1%、209.1%、22.8%。(2)提出基于预训练模型的缺陷定位查询重构方法,通过大量的历史缺陷数据训练CodeBERT模型,并以此为缺陷报告补充相关缺陷信息。然后使用重构后的查询输入FMBL定位缺陷,称为FMBL-QR。相比FMBL,FMBL-QR能更准确地定位到相关代码单元,六个实验项目上的平均MAP指标提升7.2%。(3)构建了一个缺陷定位工具,集成封装了历史缺陷信息自动收集、缺陷信息自动处理、缺陷数据集构建及缺陷定位功能,并且该工具以VSCode插件的形式发布,方便使用。
其他文献
《义务教育英语课程标准》(2022)要求初中生敢于在课内外英语活动中积极用英语进行交流。但教师不恰当的纠错方式会提高学生的英语口语焦虑,从而降低其英语口语学习的积极性。与其他研究不同,本研究以《外语口语焦虑自我图式量表》(FLSAS)为测量工具,在对比分析、错误分析和情感过滤假说的基础上,通过快速聚类分析将初中生分为不同的英语口语焦虑类别,探讨了以下问题:1.初中生英语口语焦虑的总体水平如何?2.
<正>为提升企业经营效率,确保财务报告可靠,具体业务合法合规,公司必须进行有效的内部控制。作为内部控制五大要素之一,风险评估工作开展的好与坏,直接决定企业内部控制的成败。风险评估要重点做好风险管理组织和目标、风险识别、风险分析评估、风险应对与控制、风险信息沟通与监督等关键环节,确保企业内部控制能够有效实施。
沥青路面水损害一直以来都是影响路面使用寿命及服务能力的主要病害之一,大量的工程实例证实许多沥青路面在使用初期就产生了大面积的水损害。深入研究发现路面内部的动水压力是引发早期水损害的主要原因。饱水路面在车辆荷载的作用下会产生循环变化的动水压力,进而产生高速水流对沥青混合料冲刷,这种冲刷作用会极快的加速水损害的发展。然而,目前的沥青混合料水损害评价体系中的试验方法基本都是基于静态水条件,并没有考虑动水
工业运行控制系统中往往存在着各种形式的约束如输出约束、预设性能和时变约束等等。为了使系统能够稳定运行,通常需要对系统的状态和输出过程进行约束,若不对系统进行约束,会使得系统运行不稳定,严重的话甚至会使系统无法运行,所以对受约束条件下的系统进行稳定性研究是非常有必要的。系统的运行环境中通常也存在着随机因素,在对系统进行建模时也需要考虑随机因素的影响,如何解决随机因素的影响一直以来都是非线性系统研究的
伴随着互联网技术的迅速发展,我们迎来了信息爆炸的时代。我们在享受获取信息便利性的同时,同样苦恼于如何从大量的信息数据中快速准确地获得自己真正需要的信息。近年来,推荐系统作为有效解决信息泛滥的手段引起了国内外大量研究人员的关注。其中,协同过滤(Collaborative Filtering,CF)方法通过利用用户的历史交互信息来挖掘用户的兴趣偏好,获得了巨大成功。然而,基于CF的方法通常存在数据稀疏
肠道不仅具有消化和吸收功能,同样也是仔猪体内重要的免疫器官。由于仔猪自身的免疫系统不完善,在仔猪阶段极易受到环境以及营养变化等因素的影响,诱导仔猪机体的氧化损伤。当仔猪受到氧化应激时,仔猪肠道也会受到氧化损伤。如何缓解仔猪的氧化损伤,提高仔猪的抗氧化功能和生长性能成为研究热点,课题组之前的研究证实茶树油具有一定的抗氧化功能并且可以提高仔猪的生长性能。而4-萜品醇(TER)为茶树油的主要成分,本研究
Event-B是一种计算机领域中针对系统级建模和分析提出的形式化方法。对于复杂软件系统,Event-B通过需求的不断扩充,在不同的抽象层级上使用精化策略来表征系统。在整个系统建立以后,用数学证明去验证每一层精化后模型的一致性。在完整模型通过验证后,完善先前的需求设计,规避在后续开发阶段可能出现的错误。随着新冠疫情的爆发,人体免疫学方面的研究,成为当下的热点话题。免疫系统在面对病毒入侵时,会进行两种
车联网(Internet of Vehicles,IoV)以车辆为主要载体可以实现多种方式的智能交互,能有效引导交通信息的传输,提高城市交通的安全性以及智能化水平。但是,以车为基本单元向外延展的通信,如车与车(Vehicle to Vehicle,V2V)、车与基础设施(Vehicle to Instructure,V2I)和车与网络(Vehicle to Network,V2N)都是在无线网络环
文本简化任务主要目的是降低文本内容和句法的复杂性,同时保留源文本的主要信息和含义。文本简化的主要功能是帮助语言知识储备量较少的人群更好的理解文本内容。现在的文本简化方法大多基于神经网络模型,这类文本简化方法通常需要大规模的平行语料,对神经网络进行训练,从而达到文本简化的效果。但是现有的文本简化语料库包含了很多问题,如语料库提供的简化不够充分、简单句和复杂句的意思不一样等等,导致训练出来的文本简化模
随着现代计算机技术的不断发展,二十一世纪迎来了人工智能的辉煌时代,在自然语言处理、计算机视觉、音频处理这三大领域的技术突破最为明显,自然语言处理上,出现了文本生成和文本挖掘等技术,在计算机视觉上出现了图像风格迁移、图像生成、语义分割等技术,音频处理领域上有声纹识别、人声生成、音乐生成等技术。常规的深度学习神经网络都致力于研究回归或是分类,但是自从生成对抗网络被提出来之后,基于深度神经网络与大数据的