【摘 要】
:
软件缺陷是软件系统中需求、体系结构、设计和应用上的错误。测试人员发现缺陷,将缺陷记录在缺陷报告中,通过缺陷报告将缺陷告知给开发人员,并对缺陷进行追踪和管理。缺陷报告是测试人员与开发人员之间重要的沟通方式。正确预测软件缺陷严重性,有助于及时将各种缺陷报告分派到合适的开发者手中,使其对缺陷进行修复,进而提高缺陷修复的效率与质量。现有的缺陷报告严重性预测手段主要是使用机器学习或深度学习方式从大量的缺陷报
论文部分内容阅读
软件缺陷是软件系统中需求、体系结构、设计和应用上的错误。测试人员发现缺陷,将缺陷记录在缺陷报告中,通过缺陷报告将缺陷告知给开发人员,并对缺陷进行追踪和管理。缺陷报告是测试人员与开发人员之间重要的沟通方式。正确预测软件缺陷严重性,有助于及时将各种缺陷报告分派到合适的开发者手中,使其对缺陷进行修复,进而提高缺陷修复的效率与质量。现有的缺陷报告严重性预测手段主要是使用机器学习或深度学习方式从大量的缺陷报告文本中提取严重性相关的特征,利用这些特征进行预测。传统的严重性预测方式大多基于缺陷报告Summary文本进行,然而由于Summary较为简短,信息可能不足,本文研究了融合Description和Summary信息来进行严重性预测的方法。为了去除Description中的噪声,本文研究了标签替换的去噪方式和基于图排序的关键词抽取算法,通过以上方式获取更精练的Description信息。然而基于图排序关键词抽取的严重性预测模型和传统的严重性预测方式都存在一个共同的问题,较为关注文本内容本身与严重性之间的联系,忽略了目前待预测的缺陷报告可能和其他缺陷报告之间的联系。为此我们考虑使用图卷积神经网络来缓解此问题。相比其他图神经网络,图卷积神经网络存在共享参数的机制,并且每个节点包含邻居节点的信息,高层图卷积可以把邻居信息携带进来,再进行计算的时候信息更充分,层数更多,感受域更加广泛。本文研究了基于频谱卷积的图卷积神经网络和基于非频谱卷积的图卷积神经网络,分别提出了基于频谱卷积GCN的缺陷报告严重性预测模型和基于非频谱卷积GCN的缺陷报告严重性预测模型。图卷积神经网络抽取特征时会破坏文本语序信息,因此本文将Bi-GRU结合图卷积神经网络来进行改进,并且通过子图采样的方式缓解了严重性预测时邻居爆炸的问题。基于频谱卷积的图卷积神经网络存在不能在线处理的问题,需要将整个语料库缺陷报告建图,在实际工作过程中存在不便。为了缓解这一问题,本文研究了基于非频谱卷积的图卷积神经网络,用单个缺陷报告文本建图来代替整个语料库建图,缓解了在线处理的问题的同时保留了缺陷报告之间联系的信息。为了提高模型的泛化能力,减少单独子任务的噪音。本文提出了将图卷积神经网络与多任务学习结合的缺陷报告严重性预测模型,并且为了针对下游子任务更好地融合语义信息特征和全局信息特征,本文研究了使用Transformer来进行特征融合,通过Transformer更好地分配每个特征的权重,使得对特定的任务,模型能学到最适合该任务的特征。相比现有方法,该模型在F1值指标上提升了5%左右。
其他文献
第一部分Ⅵ型分泌系统(T6SS)在血流感染肺炎克雷伯菌中的致病作用和耐药性目的VI型分泌系统(Type VI secretion system,T6SS)是肺炎克雷伯菌的一种新型毒力因子。这项研究旨在调查T6SS阳性血流感染肺炎克雷伯菌的临床和分子特征,并探讨了T6SS基因型是否是肺炎克雷伯菌血流感染死亡的预后标志物。方法从2019年7月至2021年1月,共收集了我院119例非重复性肺炎克雷伯菌血
目的探讨接受直肠癌保肛根治手术的患者在术后后发生低位前切除综合征(LARS)的危险因素,依据筛选出的危险因素构建列线图风险预测模型,并对模型的准确度和预测效能进行验证。方法回顾性分析安徽医科大学第一附属医院普外科2019年10月至2020年9月期间行直肠癌前切除术或Dixon术并顺利出院患者的临床资料,在随访过程中根据患者的LARS量表评分结果,将轻度及重度患者分入LARS组、无症状患者分入无LA
目的检测血小板反应蛋白4(THBS4)在肝细胞癌患者中的表达水平,评估THBS4与甲胎蛋白(AFP),AFP异质体(AFP-L3),高尔基体蛋白73(GP73)单独及联合检测对肝细胞癌的诊断价值,提高AFP阴性肝细胞癌的诊断水平。方法1.收集16例AFP阴性肝细胞癌患者癌组织及其对应癌旁组织;2.收集110例肝细胞癌患者(其中AFP<20ng/ml 48例,AFP 20-200ng/ml 21例,
随着清洁燃烧技术的不断发展,第二代富氧燃烧技术表现出了无氮氧化物、硫氧化物排放优势的同时还具有较高的二氧化碳捕集率的优势从而得到众多研究机构及学者青睐。但是高含量CO2或者H2O作为稀释气体的引入也为燃烧带来了燃尽率降低、燃烧稳定性较差等挑战。因此,对如何改善利用CO2或H2O作为稀释气体条件下的燃烧特性研究具有重要意义。低温等离子体因其含有较多的自由基及激发态物质具有较强的化学活性,可以有效促进
目的研究中性粒细胞与淋巴细胞比率(NLR)和血小板分布宽度(PDW)联合在可切除胃癌患者预后中的应用价值。方法根据纳入及排除标准,回顾性收集2014年12月至2016年6月期间在安徽医科大学第一附属医院普外科接受根治性手术的210名胃癌患者的数据。通过ROC曲线分析确定术前患者外周血PDW和NLR的最佳截断值,再通过Kaplan-Meier生存曲线分析、对数秩检验以及单因素和多因素COX比例风险回
生物质作为一种富含碱金属、分布广泛的可再生能源,目前存在着利用率低下,能量利用效率低等问题。煤作为一种不可再生的化石燃料,一直以来都是通过直接燃烧的方式供热或者发电,这种做法存在着污染环境、利用率低等问题。虽然近年来煤和生物质的清洁利用已经逐渐开始引起人们的重视,但以往的研究多关注煤和秸秆的静态热解以及单一气氛热解,使用回转窑动态装置进行热解及改变热解气氛还少有论及。为此,本文以褐煤和玉米秸秆按不
目前,非物质文化遗产已进入“后申遗时代”,甲骨文作为我国汉字发展脉络的源头,不仅是维系中华民族文化的纽带,也是中华文明真实而又丰繁的镜像。研究人员已经证实,运用数字化技术增强非遗文化传承的多样性和鲜活性是可行的,这为非物质文化遗产的传承和发展提供了新的研究方向。另外,非物质文化遗产的传承与创新需要依靠不同领域之间的相互协作,而设计不仅能引导大众审美,还能为非遗提供符合当下传播形式的方向,是发展非遗
目的:探究基于机器学习结合MALDI-TOF MS快速检测碳青霉烯耐药肺炎克雷伯菌(CRKP)和碳青霉烯敏感肺炎克雷伯菌(CSKP)的方法,分析CRKP以及CSKP在哪些峰特征中出现明显的改变,并分析这种分类方法性能的优劣。方法:随机收集95株CRKP菌株以及76株CSKP菌株作为实验菌株,在哥伦比亚血平板上培养18-24小时后使用MALDI-TOF MS进行菌种鉴定并采集它们的质谱数据,然后使用
目的:(1)通过比较肝癌肝移植患者和良性终末期肝病患者术后并发症发生情况及生存率情况,探讨本中心肝癌肝移植患者的疗效和预后;(2)探讨术前降期治疗对术后并发症和短期生存率的影响;(3)初步总结肝癌肝移植复发防治的经验体会。方法:回顾性分析本中心于2015年2月至2021年9月期间收治的125例肝移植患者的临床病理资料。(1)根据术后病理结果,将全部病例分为肝癌肝移植组27例和良性终末期肝病肝移植组
背景:据报道,血浆纤维蛋白原(Fibrinogen,FIB)或全身炎症反应指数(Systemic Inflammatory Response Index,SIRI)升高与几种癌症的不良预后有关。纤维蛋白原和全身炎症反应指数(F-SIRI)已被证明是预测胃癌预后的有价值的工具。我们希望评估术前F-SIRI水平对肝细胞癌(HCC)患者肝切除术后预后的价值。肝细胞癌(Hepatocellular car