基于机器学习的软件缺陷预测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:BlueHeart1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的不断发展,各类应用软件的问世给人类的日常生活带来了巨大的便利。但是随着软件需求的不断增长,软件开发的迭代次数也日益增加,在迭代过程中无法避免地会产生各式各样的缺陷。进行软件测试有可以重现和记录缺陷,进而改正缺陷,但是过度的测试工作会导致大量时间和人力成本的浪费。研究者们提出利用软件缺陷预测技术,通过软件的特征属性和缺陷数据构建预测模型来预测软件缺陷,它有助于合理分配人力和时间成本,提高产品迭代质量,而且不仅丰富了软件测试的手段,还促进了计算机科学中各方面的发展。本文将机器学习技术和软件缺陷预测结合在一起,并根据当前特征选择算法和跨项目缺陷预测数据集存在的问题给出了相对应的解决方法,如下所示:为解决缺陷数据集中的不相关的特征影响预测性能的问题,提出了基于样本分布和加权最近邻特征选择方法。根据待预测样本和历史样本之间的相关性,计算样本间的距离,再根据距离权重函数来赋予权重,通过梯度下降法不断进行迭代,最终得到一个特征排序列表。在公开数据集上使用提出的特征选择方法进行特征选择并给出预测结果,为保证实验结果的准确,将提出的基于样本分布和加权最近邻特征选择方法作为实验组,另外几种特征选择方法作为对照组,并且根据实验效果进行分析性能的优劣。除此之外,还通过两种不同的检验方式进一步探讨基于样本分布和加权最近邻特征选择方法的有效性。通过实验结果进行对比和分析,提出的基于样本分布和加权最近邻特征选择方法的性能与其他常用算法相比性能相当甚至更优。考虑到跨项目数据集之间除了样本分布差异也存在冗余特征的问题,因此在进行跨项目预测之前先进行特征选择从而提升预测的准确性。通过分别对历史项目和目标项目进行特征选择,根据特征子集分别构建数据子集,利用历史项目数据子集对构建的软件预测模型进行训练,目标项目数据子集作为测试集进行预测。在公开数据集上使用提出的跨项目缺陷预测方法进行跨项目预测并给出预测结果,实验除了验证特征选择对跨项目缺陷预测的有效性,还采用其他特征选择方法和提出的基于样本分布和加权最近邻特征选择方法分别在相同的预测模型上进行对比。实验结果表明,跨项目预测时先进行特征选择可以得到更好的预测结果。
其他文献
当今社会,互联网已成为人们生活不可或缺的部分,在各个领域得到广泛应用,极大地提高了人们的生活效率。然而,随着互联网的发展,涌现出大量的数据,这些数据占用了大量的本地资源,而云计算技术可以解决大量数据占用本地资源的问题。因此,越来越多的用户或机构选择将数据上传至云端,但上传的数据可能包含就诊记录、账单、家庭住址等隐私信息。如果这些信息被攻击者获取,那么攻击者有可能从中推断出用户的行动轨迹,这会对用户
学位
近年来,无人机技术迅速发展,且在众多领域得到了广泛应用。然而,由于无人机飞行作业缺乏飞行员现场操作,而无人机内部系统结构又日趋复杂,因设备故障引起的无人机灾难事故频繁发生。对无人机系统进行异常检测,精确感知其异常状态,是提高无人机运行安全性和可靠性的重要手段。然而无人机的数据特点和模式切换的特殊性,为其异常检测带来了诸多挑战,大部分异常检测算法并不符合无人机的实时性、鲁棒性和适用性要求。针对以上问
学位
遥感成像一般是指在卫星或飞机上搭载相机对地面目标进行探测、记录以及解释。在遥感应用中,遥感目标检测在军事侦察和灾害监测等领域中具有重要作用,目标检测的精度和速度是这类应用的关键技术指标。随着遥感技术的发展,当前遥感图像空间和时间分辨率不断提高,其数据量迅速增加,给现有计算平台的算力和功耗都带来了巨大的挑战。为了提升遥感目标检测的精度和速度,实现快速部署,本文提出了一种基于超分辨率辅助的目标检测算法
学位
<正>阴道上皮内瘤变(vaginal intraepithelial neoplasia,VaIN)是局限于阴道上皮内不同程度的不典型增生性改变,多为阴道浸润癌的癌前病变。早在1952年,Graham和Meigs首次报道了3例因子宫颈原位癌子宫切除术,术后随访发现的阴道原位癌患者,提出了阴道上皮内瘤变这一概念[1]。迄今为止,VaIN依然是少见的下生殖道癌前病变,大多在子宫颈病变筛查或因其他指征随
期刊
隐私保护集合交集协议作为安全多方计算的一条重要分支,是一种解决特定问题的分布式隐私计算方法。用户的隐私数据可以用集合的形式表现出来,在保证隐私数据安全的基础上,运用隐私集合求交的方式,就可以得到不同用户所持有的隐私数据中相同的部分。因此有很多学者提出了大量的两方隐私保护集合交集协议,而在多方协议中,隐私性、安全性、实用性等方面仍有待改进。本论文分别针对多方隐私保护集合交集协议的隐藏输入集合大小和在
学位
随着遥感技术的蓬勃发展,高质量光学遥感图像的获取变得越来越容易,基于遥感图像的目标检测技术也已广泛应用于国防军事及民用经济等领域。近年来,基于深度学习的目标检测网络由于良好的特征提取及表征能力,在自然图像目标检测领域中逐渐成为了主流方法,取得了令人瞩目的检测效果。然而,因为遥感图像目标检测任务与自然图像存在较大差异,所以将自然图像的目标检测方法不做针对性调整与改进,直接应用于遥感图像效果并不理想。
学位
超声成像技术和X射线成像技术、磁共振成像技术、核医学成像技术被公认为现代医学四大成像技术。声场调控是获得聚焦超声,实现超声成像的重要途径。常用的聚焦方式有球压聚焦、固相声学透镜聚焦和阵列超声换能器。然而,球压聚焦易损坏压电阵元,固相声透镜声传输效率低,并且这两种方式一旦制成便不能调节。阵列超声换能器虽可实现动态聚焦和调焦,但工艺复杂,价格昂贵。因而,本文提出了一种基于声学液体透镜的可调声场超声换能
学位
随着声学的不断发展,对超声换能器及其测试系统都提出了更高的要求。超声换能器是进行超声成像的核心器件,超声换能器的核心参数主要有中心频率、频率带宽、声束宽度等,需要多种专用仪器测量。各种仪器价格昂贵、操作方式均不相同,既耗费资金又导致学习成本上升,因此需要开发集成多项功能的超声成像系统对超声换能器性能进行评价。LabVIEW能够便捷地连接仪器并进行控制,因此有必要基于LabVIEW开发超声换能器成像
学位
工业作为立国之本、强国之基。随着科学技术的稳步前进促使工业自动化逐步实现,在提高了生产力的同时,也使人力资源得到了高效利用。工业仪表作为机械运作的性能检测设备,已在各个领域普遍应用。监测工业仪表数据是保障机械安全、正规运作的必要环节。然而,大量企业及大小型工厂中均采用人为检测记录数据。这对企业来说,不仅带来高额的人力成本、造成生产效率较低,并且有时会在特殊环境下可能为人员带来意外安全隐患。因此在当
学位
目标跟踪技术在军用和民用领域都有很重要的研究意义,如军事领域中对敌机群的实时跟踪技术、对敌方导弹的跟踪拦截技术等,在民用领域中的无人驾驶技术、人脸识别技术等。本文主要针对目标跟踪领域中的多目标跟踪、航迹关联、航迹预测和航迹中断补全问题进行了研究,具体的研究内容如下所述:首先,研究了基于随机有限集(Random Finite Set,RFS)的多目标跟踪问题,阐述了目标运动模型和卡尔曼滤波算法,接下
学位