基于特征提取的开源社区FORK摘要自动生成

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:bazzi89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基于Pull-Request的分布式协同开发已经成为开源社区中的主导软件开发方式。开发者通过Fork复制软件项目的版本库,创建自身分支,并在此进行独立开发。由于P/R协同开发模型的开放性、透明性和并行化的特点,开发人员在Fork项目时难以掌握项目的整体Fork概况,不知道其他开发人员是否已通过Fork开展相同或类似的开发工作,从而容易产生出现重复性的贡献和冗余性开发。因此,这就需要开发者能够直观、全面、高效的获取Fork信息,但是现有的Fork工具不能满足这些需求。针对这个问题,本文提出了一种Fork摘要的自动生成方法以帮助项目管理者加强项目管控,避免冗余贡献,增强合作交流。本方法首先爬取开源社区中具有Feature和Bug标签信息的Issue数据,采用随机森林方法训练一个分类器模型,以对Fork特征进行分类;随后收集Fork分支的软件开发活动数据,采用Text Rank算法生成Fork详细信息以解释Fork的主要目的;最后设计了一组组合规则及相应的算法来整合Fork的类别、特征和其他信息,以成完整的Fork摘要。为了检验方法在指导分布式协同开发方面的有效性,论文基于上述关键技术开发了Fork Xplorer工具,并基于该工具开展了实验。本文在Github上进行了30组的人工测试来检验该方法生成的Fork摘要的准确性和60组的实际案例测试用以检验Fork摘要的有效性和实用性。结果表明,方法所生成的Fork摘要达到67.2%的准确率,实验中76%的项目管理者认为Fork摘要有助于更好地管理项目、加强沟通与合作。
其他文献
由于指纹、虹膜等生物特征设备在笔记本、平板、手机上的日趋普及,以及基于Linux内核的操作系统在市场上的占有率越来越高,其上的生物特征认证系统也就越发重要。然而当前的Linux类操作系统上的生物特征认证方案在用户体验、易用度上都与Windows等商用操作系统存在较大差距。因此构建Linux上成熟完善的生物特征认证系统显得尤为重要。本文针对该问题,进行了深入的研究与方案的设计,设计并实现了一种基于事
论文立足科研项目管理实际要求,针对综合计划部门的实际管理工作中效率低、人工存档出错率高等相关问题,利用软件工程设计的思想,以科研管理信息系统软件的设计与开发为课题研究内容。本文的主要工作和贡献如下:(1)对科研项目管理工作进行了需求分析。通过前期对综合计划部门业务工作的深入调研,充分分析和优化了各个项目管理工作的组成、流程和数据需求等情况,进一步明确了用户需求,对需求分析进行文字描述、绘制了工作流
随着科技的飞速发展,论文作为科技成果的主要展现形式也已经累计到了一个惊人的数量,抽取论文相关信息构建学术知识图谱是当前充分地挖掘论文学术价值的主要方法之一。目前主流的学术知识图谱(如全球最大的开放学术知识图谱OAG、东北大学的Tech KG和上海交通大学的Ace KG)都是基于期刊和会议论文构建的,没有利用信息更丰富、学术价值更高的学位论文。本文就如何基于学位论文构建学术知识图谱并挖掘学位论文价值
事件相机DAVIS(Dynamic and Active-pixel Vision Sensor,动态和主动像素视觉传感器)作为一种新的视觉传感器,能够在同一像素阵列下同时输出图像帧和事件流。由于事件流的数据格式完全不同于图像帧,传统的特征点跟踪和三维重建方法无法直接应用在视觉传感器DAVIS上,因此需要新的算法出现来最大限度的发挥事件相机的优势。本文提出了一种基于DAVIS的事件特征跟踪方法,并
从古至今,战争一直是人类社会发展、国家间相互竞争不可避免的议题。从徒手搏斗到冷兵器,由长枪短炮发展到飞机舰艇,战争形态随科技、社会的改变而改变。当前国际形势下,战争的作战理念、作战样式和制胜机理都出现颠覆性变化,摧毁国家瓜分土地,获取自然资源和劳动力的传统战争理念受到限制,国家利益的维护和扩展方式发生转变,混合战争应运而生。论文理论与实践相结合。理论层面,梳理混合战争产生的历史基础和现实因素,分析
步态识别作为新一代生物特征识别技术,在远距离行人身份识别上具有得天独厚的优势,其在军事、刑侦、公共安防和智能家居等领域有着非常广阔的应用前景和现实需求。但是步态识别容易受到衣着服饰、携带物、视角变化和光照变化等行人本身以及外部因素的影响,严重阻碍了其商业化进程。本文主要围绕图像预处理、步态特征图像提取、普通机器学习算法和深度学习算法等相关内容展开深入研究,解决复杂协变量条件下的步态行人身份识别问题
迈克尔·I.汉德尔是美国著名情报理论家和战略学家,先后任教于美国陆军战争学院和海军战争学院,其研究成果丰硕,涉及情报史、情报的价值、情报分析、情报与欺骗、突袭与情报预警、情报与决策关系等诸多领域。汉德尔也是情报学领域享有盛名的刊物《情报与国家安全》的创始人之一,对于情报学科走向公开和成熟起着重要作用,其情报理论也是国内外学术界关注的重点。本文围绕汉德尔的情报思想展开研究,共分三个部分。第一章绪论主
当前,随着人脸识别相关产品的不断推出和广泛应用,人脸识别系统的安全问题越来越引起人们的关注。传统的人脸识别系统中,对真实人脸和欺骗人脸难以准确区分,一些非法分子正是利用该漏洞对人脸认证系统进行欺骗攻击,如采用照片或视频录像等手段假冒他人身份牟利等,使人脸识别系统成为易受攻击的对象。因此,在人脸识别系统中加强活体检测功能显得非常必要,对确保整个系统安全具有十分重要意义。本文在分析国内外各类人脸活体检
随着航天技术的快速发展,越来越多的卫星被发射到太空中执行各种各样的任务。而电源系统为卫星在轨运行提供动力,一旦电源系统出现故障,卫星将无法正常工作。随着卫星系统功能愈加复杂,在轨故障率明显增加,电源系统的健康状态常常是制约卫星的重要因素。因此采用故障诊断与健康管理(prognostics and health management)技术对卫星电源系统进行有效可靠的健康评估具有非常重要的现实意义和应
随着互联网应用的普及,大数据时代下各类互联网应用所产生的关于用户不同类型的信息大量累积,如何从海量数据中有效、快捷地提取出用户深层次信息从而提供更个性化、智能化的服务是亟待解决的问题。在时空数据研究领域也不例外,对海量数据进行高效的挖掘,实现数据到知识的转变是走出当前困境的关键。因此,本文从用户产生的海量时空数据入手,针对用户行为进行深入分析,探索数据挖掘在此方向上的应用,具体对以下内容进行了研究