特征描述方法在软件缺陷预测中的应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:titaige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件产品广泛应用于工业制造、金融、交通运输、军事等领域,随着软件的规模和复杂度不断增加,如何保证软件产品的质量和可靠性成为软件工程研究的重点和难点。软件缺陷是影响软件质量的重要因素之一,在软件测试中进行软件缺陷预测能够以较低的成本获得其缺陷分布情况,将主要的人力和财力集中于含缺陷软件单元的测试,对保证软件的质量和可靠性具有重要价值。机器学习中的分类技术是当前软件缺陷预测的主要方法。影响分类预测模型最重要的两个方面是特征描述和分类器的选择。针对软件缺陷数据的特点,本文以NASA数据库为例,探究软件单元特征描述的新方法,以进一步提高软件缺陷预测的准确度。主要工作如下:①针对特征空间中软件单元描述特征多样,预测模型精度低和算法复杂度较高等问题,提出基于相异空间特征描述的软件缺陷预测模型。首先利用训练数据生成代表集,然后选择适合的相异性度量,将软件单元特征空间描述转化为相异空间描述。最后在相异空间中建立分类器完成软件缺陷预测。在NASA数据库中实验结果表明:相异特征描述可以在保证软件缺陷预测的精度的基础上,有效降低其计算复杂度。在CM1、KC1、KC2和PC1四个数据库中,计算效率提高了1%到67%不等。②从扩大软件度量特征类别区分度的角度出发,提出软件单元的分类特征描述方法。首先在各维数值特征中建立一维特征分类器,然后将分类结果作为新特征代替数值特征描述软件单元,最后在分类特征描述下建立预测模型。本文提出基于均值准则和最小错误率准则的两种特征分类器算法。实验结果表明分类特征描述可以有效地提高软件缺陷预测效果。四个数据库中,最优正确率分别从65.61%、71.79%、69.67%和65.01%提高到了71.29%、75.99%、78.05%和73.96%。③考虑到软件单元各类型度量特征的计算方法和分布各不相同,提出了基于集成特征描述的软件缺陷预测方法。针对基于支持向量机分类器特征集成算法存在的计算复杂度高、抗噪性能低和忽略各类型特征权重差异等缺点,提出基于LS-SVM和Boosting的特征集成框架。首先在各类型特征中建立LS-SVM分类器获得集成特征,然后利用Boosting算法获得各集成后特征权重,最后利用加权后集成特征进行软件缺陷预测。实验结果表明:特征集成描述可获得较好预测效果。四个数据库最优正确率分别提高到了74.04%、75.05%、77.22%和75.21%。
其他文献
近年来,无缝针织工业在世界范围内发展迅速,随着市场的变化,企业在设计针织物的时候,希望可以找到更快的设计方式,设计出适应市场需求的产品。传统上,新产品在设计时需要多次
随着计算机科学技术的高速发展,三维模型因其较二维图像更为接近现实、更符合人类视觉习惯和更生动直观的立体效果,广泛地应用于虚拟现实、文物考古、医疗成像系统以及影视游
随着科技的发展,信息技术已经深刻的影响着人类的方方面面,而数据海量化给存储技术带来了巨大挑战。相比传统的存储系统,分布式存储系统通过利用大量的小型服务器甚至个人PC
农村农产品卖难问题一直阻碍着农村经济发展,而城市农产品买难也日益凸显,为了克服双方的障碍,本文工作的主要目的是为农民设计农产品电子商务概念和交互原型,以期让农村的农
在科学领域与信息技术不断地迅速进步的近些年来,信息共享与资源互利已经越来越受到人们的各种关注。与此同时,这些信息资源给人们带来各种生活中的好处,也带来了人们隐私数据信
随着计算机数字化和可视化技术的发展,对文化遗产的数字化保护和虚拟展示也提出了更高的要求。秦始皇陵陪葬坑中的兵马俑文物原本是周身彩绘,但由于千年来的自然侵蚀和考古发
随着信息技术和多媒体技术的快速发展,音乐已经成为人们日常生活中不可或缺的多媒体资源之一。同时,音乐作为人类最重要的交流媒介之一,包含着丰富的情感信息,利用计算机技术来分
虚拟现实技术是伴随多媒体技术发展起来的计算机新技术,采用三维图形生成技术、高分辨率显示技术和多传感交互技术,生成一个逼真的三维虚拟环境。虚拟现实技术的应用前景是非常
随着企业业务流程的日益复杂,作为一种流程定义、管理和监控的核心技术,工作流技术已经得到广泛应用。一个完整的工作流管理系统一般应包括过程与任务定义、过程定义的完整性
在计算机网络技术飞速发展的背景下,互联网环境下的软件形态和功能正发生着深刻的变化,这给国产办公软件的发展带来了机遇,网络集成化办公已成为趋势。在该领域中,SaaS(Software-a