基于图表示学习的代码异味强度排序模型

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:kyn5210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件结构设计不佳的症状可通过正确的重构步骤解决。多数代码异味检测工具仅输出检测结果,忽略了结合开发者的需求对检测出的异味按照其强度进行排序,从而将判断异味重构优先级的耗时过程留给了开发人员。部分异味排序模型仅关注代码度量等结构特征,而代码间的层次结构及关联关系等语义信息在较多软件工程研究中被证明有效,却在代码异味排序领域少被研究。本文根据类级代码异味特征以及图结构可对对象及其相关关系建模的特性,考虑开发人员对于异味强度的主观感知,提出了基于图表示学习方法的代码异味强度排序模型CSSRM(Code Smell Severity Ranking Model,CSSRM),为开发人员的重构优先级决策提供参考。本文模型以存在异味的类为节点、类间相关语义关系为边,构建语义结构图,同时考虑代码的结构特性,将类的代码度量值作为节点的属性特征,实现对代码间复杂关系的进一步刻画。通过三种图表示学习方法学习语义结构图的节点嵌入表示,同时将项目开发者感知到的异味强度作为标签值,结合下游机器学习模型实现对异味的强度排序。本文对比了三种图嵌入表示方法的性能差异,针对4种代码异味,在7个Java开源系统上进行实验,结果表明效果最佳的模型相较于基线方法,其F1值最高提升了10.35%,验证了模型的有效性。同时,本文探究了不同嵌入维度以及不同分类器对模型效果的影响。以三种嵌入表示方法中性能较优的CSSRMSM为基础,针对4类代码异味,对比采用不同嵌入维度对模型性能带来的影响,发现当嵌入维度取32时模型整体效果相对更佳;并比较了模型在4类机器学习分类器上的性能表现,结果显示随机森林对应的模型具有最优效果。
其他文献
半导体激光器拥有体积小、波长覆盖广、相关性高、可批量生产、可单片集成化等优点。中红外波段是大气的窗口波段,且覆盖很多重要分子的特征谱线,因此对该波段光源的研究已成为目前世界上的热门课题。锑化物涵盖Al、Ga、In、As、Sb等Ⅲ-V族半导体元素,是目前中红外器件首选材料。而有源区带间级联的结构特点使器件能拥有比较低的电压,阈值电流密度和功率损耗。目前以Al Ga As Sb作为波导包层的ICL的研
学位
光场技术作为一项前沿的技术推动光场相机的应用,光场图像是多个摄像机从不同角度拍摄同一场景所获得的图像的集合。近年来光场成像设备不断发展,光场图像处理被广泛研究。但由于光场相机的传感器分辨率有限,光场相机面临着空间分辨率和角度分辨率之间的权衡。为了捕捉场景中光线的强度和方向,光场相机无法同时获得高空间分辨率和高角度分辨率的图像。针对以上问题本文对视图一致性的光场空间超分辨率重建和光场角度超分辨率重建
学位
为适应不断变化的软件需求,开发者需要通过软件变更来实现软件的维护和修改。过于频繁的软件变更预示着代码存在可维护性问题,尽早地识别具有更改倾向的代码类可以极大地提高维护效率和质量。在对软件类的变更倾向研究中,已有通过代码异味相关信息进行软件类级变更预测的实证研究,代码异味强度在对易变类的预测中表现良好。社区异味是代码异味概念在开源软件开发社区中的衍生,可用于识别开源软件开发社区中存在的不良沟通和协作
学位
在传统摄影中,相机通过记录不同方向的光线形成像素值,但这导致了光线方向信息的丢失。光场相机克服了这一缺点,在相机主镜头和图像传感器之间插入微透镜阵列,实现了视点的密集采样,并将测量数据转换为不同视点的多视点光场图像。光场图像包含了场景的深度线索,在人脸识别、自动驾驶、三维重建等方面有着有趣的应用。本文基于注意力机制优化深度学习框架,提升模型训练效果,设计构建了光场深度估计算法和光场超分辨移位窗口优
学位
热带气旋是一种强气旋性涡旋,其在热带海洋上形成,并具有暖心结构。近几十年来,在热带气旋的路径和强度预测方面取得了显著进展,然而有关热带气旋的生成预报仍然充满挑战。因此,准确预测未来某一时刻热带气旋的生成时间和位置对于政府相关部门制定防灾减灾计划至关重要。现如今,与热带气旋相关预测的方法主要有:数值、统计和统计动力预报。数值预报常用于台风生成的预测,而统计动力模型则基于气候学和持久性来预测未来的强度
学位
随着云、雾、边缘计算及物联网的快速发展,网络中信息的安全传输变得越来越重要。信息的安全传输内容包括数据、图像、音频和视频等,图像包括传统图像和光学图像。随着光学技术和网络技术的发展,光学图像在网络中的安全传输也变得越来越重要。近年来,基于密码学的非对称光学图像加密既克服了传统DRPE和变换域加密的线性问题,也改善了PTFT光学非对称加密技术安全性不足的缺陷。但是,在基于RSA非对称算法的光学图像加
学位
图像分割是计算机视觉中的基本任务之一,它是对图像进行分析理解的前提。图像分割效果容易受到噪声,光照和背景等各种因素的影响。因此,很难提出一种通用的算法来实现图像分割。聚类算法已被广泛应用于图像分割,其中,密度峰值聚类算法(DPC)简单高效,是常用的图像分割算法之一。由于DPC及其改进算法不是专门为图像分割设计,分割结果不一定能同时满足主观感觉和客观指标。针对上述问题,本文提出了基于相对扩展密度峰值
学位
随着机器人和传感器技术的高速发展,移动机器人的应用场景逐渐从无人化工厂转移到生活服务业中。其中,SLAM(Simultaneous Localization and Mapping)技术是移动机器人领域的核心技术之一,即同步地进行自身定位与环境地图的构建,结合路径规划技术能够实现移动机器人的自主导航。定位、建图和路径规划均依赖于机器人搭载的外部传感器对周围环境进行实时感知。激光雷达以测量精度高、抗
学位
深度学习相关理论的进一步发展与计算机硬件水平的不断提高,为目标检测领域的发展提供了巨大的推力。通用的目标检测算法对于大,中目标已取得了不错的成果,但对于小目标的检测效果往往不尽人意。与此同时,航拍图像对于城市交通、环境监测等领域的地位越来越重要,而航拍图像中存在着众多的小目标。因此,基于航拍图像的小目标检测是一个十分具有前景的方向。小目标检测的难点在于像素占比小,特征提取困难,同时目前主流的检测算
学位
《中国制造2025》重点领域技术路线中明确提出要实现航空发动机、发电设备等高端装备的实时故障诊断,提高我国工业信息化水平。流体机械装备在航空航天、发电机组、军工领域均有着大量应用,掌握流体机械装备的故障特征,对确保航空航天、发电机机组等领域的安全生产和可靠运行具有重要意义。随着智能制造的发展,传统故障诊断方法在实际应用与发展中具有很大局限,深度学习有着强大的自主学习和模式识别的能力,在工业设备的故
学位