【摘 要】
:
开源软件项目作为一种群体协作创新的产物,其迅猛发展积累了海量的可复用资源,为软件创新学习和创新实践提供了坚实的基础。然而项目的快速迭代以及全方面发展,也同时为项目资源的检索和复用带来了挑战。目前大多数搜索引擎和开源社区通过搜索关键字获取开源代码,然而这些关键字大多是基于代码的。因此,当开发者不知道如何实现某个方法时,就无法通过搜索代码来得到自己想要的代码片段;而如果项目注释质量低,代码注释就很难对
论文部分内容阅读
开源软件项目作为一种群体协作创新的产物,其迅猛发展积累了海量的可复用资源,为软件创新学习和创新实践提供了坚实的基础。然而项目的快速迭代以及全方面发展,也同时为项目资源的检索和复用带来了挑战。目前大多数搜索引擎和开源社区通过搜索关键字获取开源代码,然而这些关键字大多是基于代码的。因此,当开发者不知道如何实现某个方法时,就无法通过搜索代码来得到自己想要的代码片段;而如果项目注释质量低,代码注释就很难对用户产生帮助,那么用户就需要花费大量的时间去分析代码。所以有效地评估代码注释质量并提高代码注释质量是提高代码复用率、开发效率、软件检索效率的重要途径。本论文立足于Github开源社区中优秀的开源项目以及代码标注,我们构建了基于代码结构和标注语义的标注质量评估方法。此外,我们构建在线标注平台CodePedia,并依托平台组织大规模标注大赛,通过设计标注评分机制,并将标注质量评估方法用于大赛标注质量评估,与人工评分进行对比,验证了工作的有效性。本文的主要贡献主要包括以下三个方面:第一,基于代码结构特征的注释重要性评估方法。我们提出了基于代码结构特征的标注重要性评估方法,该方法依赖于代码良好的结构性和语义性,从当前代码行的上下文代码中提取代码结构特征以及代码语义特征作为评估注释重要性的主要依据,并训练标注重要性评估模型。第二,基于语义的多维度众包标注质量评估方法。我们提出了基于可读性、完备性、准确性的融合多维度众包标注评估方法。其中标注的准确性评估依赖于提取标注间的关键词和代码句法分析提取的关键词,而可读性评估方法,我们构建了N-Gram模型,并创建了基于困惑度的可读性公式用于计算注释的可读性,在标注完备性评估方法中,我们根据各注释类型的规律,提取各个注释类型的关键词。第三,在应用方面,我们搭建了一个基于群智的代码检索复用系统CodePedia,通过合理的比赛内容设计、比赛阶段设计以及评分机制设计,基于CodePedia平台,设计并成功举办了全国开源标注大赛。除此以外,我们设计了基于克隆检测、无用注释筛选处理的流程处理标注,以及结合专家评分、标注重要性评估、标注质量评估方法相融合标注评估方法。
其他文献
无线宽带高速数传技术是构建天基综合信息网的关键技术之一,目前由于通用滤波多载波(UFMC)技术不需要循环前缀,且凭借着良好的带外干扰抑制可能作为下一代通信关键技术而被广泛关注。本文针对UFMC仍然面临较大的计算复杂度与UFMC高速数传接收端的同步技术与非理想特性补偿这两大关键技术存在的现有技术难题进行研究,在UFMC高速数传系统性能,降低实现复杂度方面具有重大意义。本文以“十三五”民用航天预研项目
抗辐射集成电路在空间应用中起着保障系统正常运行不可或缺的作用,单粒子瞬态(Single Event Transient,SET)已经成为空间应用中发生软错误的主要原因。先前的研究工作主要针对65nm及以上工艺,对单粒子瞬态及多瞬态的特性机理进行了仿真和实验研究,发现传播引起的脉冲展宽和寄生双极放大效应等因素使得SET脉冲宽度的趋势越来越复杂,单粒子瞬态脉冲的平均宽度以及最小宽度随着工艺尺寸的缩小而
面对日新月异的发展形势,新型的通信技术更是层出不穷,更短的通信时延,更快的传输速度,更大的通信容量始终是现代通信技术追求的终极目标。新型的通信技术正是本研究课题的重点关注所在。作为一种新型多载波调制方案,通用滤波多载波技术拥有更高的频谱利用效率,更强的抗干扰性能,更低的同步要求等的优势,但是也存在峰均功率比高,系统计算复杂度高等问题。因此,为了进一步提升通信系统性能,通用滤波多载波技术的研究意义十
当前无人驾驶与智能交通的发展对车载导航的精度、可靠性提出了更高的要求,单一的导航方式总是存在其固有缺陷,为了实现多场景变化下的无缝导航,一般需要使用多传感器组合导航。本文主要研究工作和创新点如下:(1)提出了基于状态变换卡尔曼滤波ST-EKF的改进MSCKF算法。详细推导了MSCKF算法的状态方程和观测方程,针对MSCKF算法中存在的状态方差估计不一致的问题,使用ST-EKF代替传统的EKF,可以
近年来,随着芯片集成程度的增高和So C(System-on-a-Chip,片上系统)技术的快速发展,微电子机械系统其中一个重要分支微机械陀螺仪的性能也在不断的提升。微机械陀螺仪可以为惯性导航系统提供导航信息,同时还可以应用于汽车、消费电子应用中,用途十分广泛。通常情况下,接口电路往往会成为微机械陀螺仪的发展瓶颈,因此本论文研究其中最重要的模数转换器。Sigma Delta ADC(Analog-
近年来军事指挥信息系统的建设成果十分显著,但未来战争会存在更高要求的态势理解、快速决策等问题,这些都是系统智能化所面临的瓶颈。面对这一现状,同时考虑到信息化军事指挥决策带有的“人-机”特性,在军事指挥信息系统中通过智能人机交互帮助指挥员提高关键信息的获取能力、提升决策效率,是突破系统认知智能方面瓶颈的重要发展方向。以语音交互为主的人机交互形式能大幅度提升指挥员的作战态势感知能力和决策水平。此交互过
高功率微波在受控热核聚变、雷达通信、新材料、环境保护等很多学科领域具有巨大发展前景,作为高功率微波产生系统的重要组成部分,高功率微波源被高度关注和研究。为了拓展应用前景,高功率微波源需要向紧凑轻小型方向发展,以适用于不同的平台,同时,当高功率微波器件工作在长脉冲条件下时,其单脉冲能量和系统整体运行效率将大幅提升,从而大幅提高其作用效力。Ku波段高功率微波有较大的应用潜力,但是受高频段器件尺寸影响,
随着互联网技术的不断成熟,在线教育也得到了蓬勃的发展。尤其是在IT编程领域,由于其技术类型品类繁多,更新换代快,按需教学的在线教育模式正好迎合了广大IT人士的深层需求。计算机领域属于典型的工科领域,单纯的文字或视频课程教学缺乏实践性,学员在课上学习到的内容不能得到有效吸收;而现有的部分在线编码平台,仅仅能提供一些传统的基础算法知识的在线编程和考核,无法提供工程级技术的支持,编程教育存在着与企业需求
表面等离激元(Surface plasmon polaritons,SPP)在本质上属于一种电磁场,存在于介质与金属层之间且由集体电荷振荡产生。它能在亚波长区间实现对光场的控制、局部增强效应、突破衍射极限等。电磁感应透明(Electromagnetically Induced Transparency,EIT)效应是本质上说是原子与外界光场的一种量子层面的相互作用,这种相互作用会产生强烈的干涉效应
随着国家城镇化进程不断推进,城市越来越拥挤,人们的出行效率逐渐变低。出租车(网约车)是城市公共交通工具之一,每天都在产生大量的订单数据,它的出行订单需求和订单分配一直影响着出行公司的决策和车辆调度,从而影响人们的出行效率,准确的出行订单需求预测有助于人们错峰出行,合理的订单分配策略可以减少人们在出行过程中消耗的时间。当前订单需求预测和订单分配分别还存在以下不足:(1)可利用特征少,未考虑区域特征对