基于迁移学习的异构软件缺陷预测方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:li875
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件的规模和复杂程度的不断增加,在软件开发过程中引入缺陷的可能性越来越大。而软件缺陷的存在可能会导致软件无法正常运行,甚至会危及人们的生命和财产。如果能够在软件发行之前发现缺陷,就可以合理有效地分配时间,降低成本和提高软件的质量。在实际的开发中,通常需要预测一个新的项目,或者项目所拥有的标签数据很少,在这种情况下,异构项目的软件缺陷预测应运而生。
  近年来,迁移学习方法的引入,解决了异构软件缺陷预测的特征差异问题。但现有的方法仍存在着一些问题:类不平衡、特征冗余或不相关、单源信息不足、数据孤岛。通过对以上问题的分析和研究,本文对基于迁移学习的异构软件缺陷预测方法进行了研究。
  设计并实现了基于流形迁移学习的异构缺陷预测方法。首先,对源项目进行综合多数类采样,在密度曲线上生成新的有缺陷样本,平衡数据集。其次,利用梯度增强树算法和拉斯维加斯算法,计算各特征的重要性,以及量化项目间的相似度,去除不相关和冗余的特征。最后,源项目和目标项目在流形空间完成迁移,转换后的源项目和目标项目最大相关,避免了在原始空间迁移的特征畸变。利用逻辑回归分类技术实现对目标项目进行预测。实验结果验证了该方法不仅解决了异构问题,也减少了类不平衡与特征冗余对预测模型的影响,提高了预测性能。
  设计并实现了基于联邦迁移学习的异构缺陷预测方法。从模型层面出发,利用知识蒸馏方法实现各参与方私有模型的通信,通过公有项目在各私有模型的Softmax输出共享信息,不接触底层数据与模型参数。各参与方的私有模型由公有数据的预训练模型通过迁移和微调得到,解决标签不足和异构问题。在各参与方通信前,各自的私有数据通过秘密共享技术进行了同态加密,保证了数据的隐私安全,且不影响预测结果。实验结果表明,该方法验证了多源数据共享能够取得较好的预测性能。
其他文献
汽车多媒体娱乐系统集视听娱乐、导航、通信、安全功能为一体,已成为目前汽车不可缺少的一个组成部分。传统的汽车多媒体娱乐系统采用单个核心主芯片,传递的信息量较少,且视频图像分辨率与刷新率较低,屏幕画面单调,已经无法满足驾驶员对高质量、全方位的车载影像系统的需求。因此如何研究设计一款具有更高性能的汽车影像系统,符合日益发展的市场需求,也是当前面临的实际问题。本课题基于某车载多媒体影像系统的软件设计项目,
滚动轴承在工业生产领域中应用广泛,并且实际生产中滚动轴承规格繁多,不同规格滚动轴承振动信号的故障频率之间存在很大差别,传统单一规格下的故障诊断方法直接应用于不同规格情况时错误率可能偏高。因此,以高准确率实现不同规格轴承故障诊断具有重大意义。本文提出两种方法用于解决不同规格滚动轴承故障诊断问题。提出一种基于深度条件对抗网络的不同规格滚动轴承故障诊断方法。该方法首先将滚动轴承一维振动信号转换为二维图像
学位
随着人工智能的兴起,在医学图像处理方向上,数字医疗技术和智慧医疗技术开始步入医疗诊断系统中,应用计算机视觉技术取得了新进展。医学图像的信息丰富度和图片清晰度,一直是临床医生诊疗的关键判别依据。现有的医学成像方式未充分利用功能成像及解剖成像的优势,通过融合技术将两者有效结合,最大化的呈现患者病理信息,辅助医生诊断病情,有效弥补单一模态下医学图像信息缺失的缺陷。单模态的医学图像特征较简单,有效信息较少
随着工业4.0的到来,电子产品生产企业成为经济发展的重要组成部分,企业规模逐渐扩大,生产需求也随之提高。目前路径规划的效果还不够快速和精准,无法完全适应环境变化。蚁群算法以其较强的鲁棒性和优秀的寻路能力在AGV(自动引导车,Automated Guided Vehicle)路径规划问题上有广泛的应用前景。然而在实际设计过程中,基本蚁群算法非常容易陷入局部最优解,并且收敛速度缓慢。因此本文针对应用蚁
学位
指纹识别技术是目前应用最广泛的身份验证方式,这项技术的核心在于如何精准快速的提取可靠且数量多的指纹特征。为解决主流的指纹方向场获取方法存在图像灰度极值区域纹线方向不可靠、平滑操作易导致细节点方向丢失和只提取单一方向场特征的问题,本文提出图形化指纹方向解析算法。本文方法不同于基于形态学操作获取指纹特征的算法,通过建立指纹图像和二维信号之间的联系,以信号解析为主线获取指纹方向场特征。主要研究内容如下:
学位
目前钢板表面缺陷检测技术大多依靠人工目测和传统的机器视觉等方法完成。这些方法存在难以提取缺陷的本质特征、易受外界环境干扰等缺点,这些缺点导致检测精度受到影响。因此,本文研究基于深度学习的钢板表面缺陷处理技术。针对传统方法的缺点,本文引入VGG16网络模型并对其进行改进。首先在网络中加入通道注意力机制,以提高识别精度;其次采用深度可分离卷积替换网络中部分3×3卷积,以减少网络参数量和计算量,增加网络
近年来,随着全球化信息化的到来,产生了海量的数据,与此同时,频繁的数据交流和复杂的系统构建以及数据处理的时效性,对信息的网络传输和存储空间提出更高的要求,可见数据压缩在工业生产生活中越来越重要,数据压缩主要分为有损和无损压缩,其中无损压缩广泛应用于航天、医疗等技术领域。无损压缩中基于字典的压缩以自适应性强、复杂度低、编码效率高等被广泛利用,因此对无损压缩的算法研究具有十分重要的作用和意义。本文从数
学位
当今社会基于人类特征提取的生物认证技术不断发展,说话人识别作为其中之一,是通过发音人的声音来辨别身份的。该生物认证技术也被叫做声纹识别,其核心内容是将语音样本信号中提取出的能代表发音人身份的信息进行处理进而实现对各类别说话人的识别。由于近年来生物认证方法在机器学习的推动下获得了巨大进展,有着广阔的发展前景和重要的研究价值,说话人识别也深受其影响,学者们逐渐从基于传统方法的说话人识别的研究方向转移到
随着指纹识别技术的应用越来越广,人们对其识别效率和准确性要求越来越高,而现实中受采集环境或自身皮肤状况影响仍存在大量低质量指纹图像无法得到有效识别。现有低质量指纹图像识别算法以图像增强为主,在一定程度上能减少伪细节点数目,但经过特征提取后仍会存在大量伪细节点,最终导致整个指纹识别系统的性能下降,使得及时、准确识别低质量指纹图像成为目前亟待解决的一个问题。本文提出一种低质量指纹图像识别算法,该算法主
随着社会的发展和通信与信息处理技术的不断进步,生物识别技术与民众的信息安全联系越发紧密。声纹识别作为生物识别技术的一种,受到越来越多的关注,被广泛应用到手机支付、智能终端、医疗服务以及刑事侦查等领域。但是由于声纹识别的研究较短,所以仍然有很多问题尚未解决。在提取说话人的声纹特征时噪声会使说话人语音频谱发生畸变。传统自然语言处理模型由多个步骤组成,每个步骤是一个独立任务,其结果好坏会影响下一个步骤,
学位