【摘 要】
:
软件缺陷预测作为软件工程领域的研究热点,其主要的目标是发现软件中存在的缺陷从而提高软件质量。以往的研究大多数致力于项目内缺陷预测,项目内缺陷预测是指采用一个项目中的历史数据来训练缺陷预测模型,在同一个项目上测试软件模块的缺陷倾向性。然而同一个项目中如果没有足够的历史数据,会导致项目内缺陷预测效果变差。此时跨项目缺陷预测作为一种新的解决方法,通过采用其他项目的历史数据来建立一个缺陷预测模型,并在一个
论文部分内容阅读
软件缺陷预测作为软件工程领域的研究热点,其主要的目标是发现软件中存在的缺陷从而提高软件质量。以往的研究大多数致力于项目内缺陷预测,项目内缺陷预测是指采用一个项目中的历史数据来训练缺陷预测模型,在同一个项目上测试软件模块的缺陷倾向性。然而同一个项目中如果没有足够的历史数据,会导致项目内缺陷预测效果变差。此时跨项目缺陷预测作为一种新的解决方法,通过采用其他项目的历史数据来建立一个缺陷预测模型,并在一个新的项目上进行预测。然而跨项目中的数据分布差异显著和数据集的类不平衡问题往往会导致缺陷预测模型的性能变差,本文基于这两个问题,将深度自编码器技术应用在跨项目缺陷预测中,提出3种不同的方法来提高缺陷预测的性能。首先,为了解决跨项目中的数据分布差异问题,提出了一种基于共享隐层自编码器的跨项目缺陷预测方法。该方法首先设计了一种共享隐层自编码器的网络结构,通过利用隐层参数共享机制来有效减小源项目和目标项目二者的特征分布差异。其次,设计了一种类内鉴别性损失函数来有效约束隐层公共子空间中的特征,提高类内特征的紧凑性。最后采用提取的深度源项目的特征来构建缺陷预测模型,提高了缺陷预测模型的准确度。其次,为了解决跨项目缺陷数据集中的类不平衡问题和有标记数据较少的问题,提出了一种基于半监督代价敏感改进自编码器的跨项目缺陷预测方法。该方法在深度自编码器训练过程中结合监督学习和无监督学习,对于训练过程中的监督部分加入类内鉴别性损失,对无监督部分重构损失。同时引入代价敏感学习技术来有效缓解类不平衡带来的影响,做法是通过对不同类别的样本施加不同的误分类代价值,缺陷预测的性能得到进一步的提高。最后,为了得到紧凑性更好的类内特征和分离性更优的类间特征,提出一种基于焦点损失改进自编码器的跨项目软件缺陷预测方法。该方法在深度自编码的训练过程中加入类内鉴别损失项和类间鉴别损失项来使源项目和目标项目在共享子空间中的分布更相似。此外使用一种更好的损失函数来处理类不平衡,采用焦点损失函数结合类别加权和难度加权。它的做法是通过给不同类别的样本施加不同的权重,并且考虑样本的难易分类程度,对难分类样本和易分类样本施加不同的权重,来有效解决类不平衡问题。与其他的几个跨项目对比算法相比,本文提出的3个方法在RELINK、NASA、AEEEM数据集上的实验提高了缺陷预测的性能。
其他文献
目的:结合食管癌患者临床资料,探讨食管癌原发灶18F-FDG PET/CT代谢参数SUVmax与淋巴结转移的相关联系,建立一个食管癌淋巴结转移模型并评估其诊断效能,为临床决策提供参考。
近些年来,随着原子力显微镜(AFM)技术的发展,其对显微镜测头部分的力传感器要求越来越高,而传统AFM中的硅悬臂力传感器由于品质因数低、稳定性差、检测装置复杂、探测范围有限等缺点,已经不能满足AFM对于高精度、高稳定性的进一步追求。与此同时,基于石英音叉的AFM相关研究已取得一些进展,且将石英音叉用作AFM测头的力传感器时,可以实现品质因数高、稳定性好、自激励自检测、探测范围广等功能,因此,将石英
分子印迹聚合物对气态分子的结合行为研究是一个新的领域。本论文分别以2-异戊基环戊酮、N-二甲基亚硝铵及棕榈酸等几种化合物为模板,采取沉淀聚合法制备了分子印迹聚合物微
存在句是语言中普遍存在的语言现象。从语法的角度看,存在句是一种特殊而复杂的句式。然而它的语义本质的限制性和语用性,引起了众多语言学家的兴趣。并且已取得很多成果。英语存在句的句法研究一直是学界探讨的焦点,存在句最常见的结构是:There+be+NP+locative expression(+temporal expression),表示某处有某人或某物。在语言学界的研究史上,描写语言学、生成语言学和
异腈是与CO类似的等电子体,含有二价碳原子且结构稳定的化合物,是有机合成反应中一个重要的合成子,能够参与到多种多样的反应中,尤其是异腈参与的多组分反应(IMCR)应用的非常广
全球化分工的不断深入使得国际分工模式发生了巨变,同一产品某环节的产品内分工逐渐取代了传统的以产品为界限的产业间、产业内分工。各国经济飞速发展享受红利的同时也面临了严峻的挑战:气候变暖,其主要原因是二氧化碳的排放。在2018年底全球碳计划组织发布预测报告显示全球27%的碳排放来自中国,因此,从全球价值链分工的视角来探讨我国低碳经济转型的制约因素,深入研究参与全球价值链程度与碳排放之间的内在关系是非常
随着科技的发展以及社会的不断进步,人类对能源的需求量也随之增多。化石能源更是如此。然而,化石能源属于不可再生能源,其有限的储量,高昂的开采和使用成本,以及在使用过后造成的酸雨,雾霾以及温室效应等环境问题,决定了其不能够被持续和大量的使用。因此,有必要开发可再生的绿色能源以缓解当前的能源压力。氢能无疑是其中的典型代表,众所周知,氢气具有燃烧热值高,无污染,储量丰富的优点。作为一种典型的制氢方式,电化
环境规制执行过程中的多方冲突导致的规制无效率是在当前环境保护日益受到重视的背景下亟待解决的问题。然而,当前对环境规制实施所涉及多方主体的行为与冲突的研究比较匮乏。本文从政府和企业行为与冲突的视角研究了影响环境规制实施偏差的要素。首先,本文从腐败的角度实证研究了政府寻租行为在环境规制与企业雇佣需求之间扮演的角色并对它们影响企业雇佣需求的机制作了分析和检验。其次,本文细化了冲突的主体,从地方政府、中央
中国的资本市场诞生时间较晚,国家对股票市场的调控与改革从未停止过。自2005年股权分置改革以来,包括非流通股在内的我国上市公司大股东所持有的股票都可以随时在市场上进行买卖。因此,公司股票在资本市场表现如何直接关系到了公司大股东的切身利益,所以,上市公司的大股东需要想尽一切办法稳定公司股票市场的价格,一方面保障自己的权益和利益不会经受巨大缩水,另一方面也对公司的前景和发展起到稳定、促进的作用。于此同
目的:代谢综合征在高血压患者中较为常见,其在原发性醛固酮增多症(primary aldosteronism,PA)中更为常见。而PA主要包括两种亚型:单侧型PA和双侧型PA。本研究旨在探讨不同亚型PA患者代谢综合征的患病率。方法:连续纳入2017年1月至2017年12月在新疆维吾尔自治区人民医院高血压中心住院治疗的169例PA患者,这些患者均行肾上腺静脉取血术进行分型定侧,根据结果将患者分为单侧型