基于深度学习的代码摘要生成方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:Richie911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码摘要是代码的自然语言描述,高质量的代码摘要能够帮助开发人员更好地理解软件并进行开发和复用,以减少软件开发的时间和人工成本。随着深度学习在自然语言处理领域的应用愈发深入,将深度学习技术应用于代码摘要自动生成任务中逐渐成为新的研究方向,这对开发人员进行程序理解、项目维护以及代码重构具有重要意义。本文通过总结代码摘要自动生成的相关技术,研究如何将深度学习模型有效地应用到代码摘要生成技术中。在研究基于深度学习的代码摘要自动生成技术中,主要有一个问题亟需解决:与自然语言弱结构性相比,程序语言具有强结构性。因此,如何充分利用代码的结构信息和语义信息以生成充分、完整的代码摘要是自动生成代码摘要的关键问题。最为常见的解决方法是将代码文本通过解析器转为抽象语法树,然后对其进行遍历再通过循环神经网络的编码器进行编码。得到代码的上下文向量后输入到解码器进行解码,最终根据概率分布输出相应的代码摘要。然而传统的“编码器-解码器”模型难以解决长期依赖问题,并且对程序的语义和结构信息的独立编码并没有考虑二者之间的联系。针对当前的基于序列到序列研究方法忽略代码文本与结构信息之间的关系的问题,本文选择Transformer模型中提出的自注意力机制来解决长距离依赖问题。其原理是利用注意力机制动态生成不同的权重,从而处理长序列,因此可以准确捕获长距离依赖关系。针对结构信息和语义信息单独编码会导致二者关系信息被忽视的问题,本文提出了将程序转为数据流图并作为模型的输入序列的方法,该方法充分考虑了程序的变量之间的依赖关系。结合上述的解决方法本文提出了基于Transformer的CStrans代码摘要生成方法,其摘要生成步骤如下:首先对代码和摘要进行预处理。相较于诸多方法中,将代码解析为AST的预处理方法,本文在预处理阶段选择从AST中提取变量以及变量之间的依赖关系构造数据流,这样当有相同变量名称却表示不同语义时,可以通过数据流表明依赖关系。然后将含有语义信息和结构信息的序列通过Transformer模型的编码器进行编码、解码器进行解码后生成对应的代码摘要。本文以DeepCom的Java数据集为实验数据,选取了数据集中收藏数量前10的项目进对本文提出的方法进行了多次实验验证。实验结果表明,与其他代码摘要生成方法相比,本文提出的方法对于代码摘要自动生成性能有较好的效果。
其他文献
教育部对初中学业水平考试命题提出了明确要求,深入探索物理试题背后的理论支撑对确保试题的科学性、严密性具有重要意义。
2022年1月1日区域全面经济伙伴关系协定(RCEP)正式生效,本文指出,在RCEP背景下,广西物流业将会迎来一个前所未有的大发展,这为加快发展广西的物流金融提供了良好的发展机遇。本文首先阐明了广西为何要加快发展物流金融即必要性,及其加快发展物流金融有利于促进广西物流产业转型升级和发展。然后对广西物流金融发展现状进行分析,阐述了广西应该加快发展物流金融,接着分析广西发展物流金融的条件,认为广西拥有
食品在生产加工各环节易被微生物侵染而发生腐败变质,全球每年因腐败变质浪费的食物约占产出量的三分之一。随着人们生活水平提高,食品需求品质升级。发展绿色环保的保鲜剂,满足居民对天然食品原料的需求备受关注。利用具有营养强化和保鲜作用的天然食品原料及副产品成为研究热点。杨梅素(myricetin,MYR)来源于新资源食品显齿蛇葡萄叶,根皮素(phloretin,PH)存在于苹果果实和果皮。二者均具有良好的
通过“初中物理情境创设研究”课例,探讨在中考物理复习教学中,如何运用情境创设“问题链”,设计出既符合学生认知能力,又能让学生动起来、思维活起来的特色课堂。通过情境问题讨论及恰当的评价引导,集中学生的注意力,在高度参与的生成性课堂学习中教学相长,将物理知识转换为学科素养,有效地促进学生核心素养的提升,同时增强师生教与学的主动性、积极性、创造性。
农村学生的学习能力较弱,容易导致物理复习课堂出现问题,针对这一问题,同时也为了优化课堂设计,提高复习效率,本文从问题引领和二次整合的教学方法出发,通过设置“单刀直入式地导入”“层层递进地追问”“思维导图的构建”“由点到面的拓展”四个环节,积极构建物理复习课的新模型,致力于提高农村中学学生的物理水平。
<正>技术从实验室走向产业化,需要经历复杂的过程,而专业的技术转移机构在其中发挥了桥梁以及催化的作用。在全球化与知识经济的大背景下,国际之间的技术转移已成为推动技术创新和技术进步的重要手段之一。2018年6月,时任上海市市长应勇出访以色列时提出:上海和以色列优势互补,创新合作潜力巨大,希望将上海打造成为中以创新全面伙伴关系示范区。国家技术转移东部中心(以下简称“东部中心”)是国际技术转移和交易枢纽
期刊
目的 总结急性胰腺炎(acute pancreatitis,AP)合并门静脉系统血栓(portal venous system thrombosis,PVST)的相关危险因素及预防措施。方法 查阅近年来国内外有关AP合并PVST的一般临床特征、发病机制、危险因素及预防预后方面的文献并进行综述。结果 AP合并PVST的发病率呈增长趋势,其发病机制复杂,主要与胰腺炎症及直接静脉压迫引起血流停滞和血流动
物理实验素养是学生个体的修养在物理实验活动中所达到的专业程度及其表现情况。中考的实验专题复习,也应该是在物理实验活动中去提升学生的物理实验素养。二次实验是一种物理学科实践,在中考总复习的过程中依然发挥着不可替代的作用。本文阐述了在紧张的中考总复习过程中,如何结合实验专题的复习,安排二次实验,让学生在精心设计的学科实践活动中,促进实验专题的深度学习,继续不断内化和提升自身的实验素养。
目的探讨游离龈移植用于口腔种植修复角化龈增宽的疗效及患者满意度评价。方法选择2015年1月至2020年12月至我院行口腔种植修复治疗且角化龈宽度不足的患者94例,根据种植二期手术时的治疗方案差异分组,对照组以常规方式完成种植二期手术,研究组在种植二期手术同期行游离龈移植增宽角化龈治疗。对比两组疗效、患者满意度及种植体周围的相关指标。结果研究组疗效优于对照组(P <0.05),患者满意度高于对照组(
藏族毛类手工编织是藏地牧区民俗生活文化的重要载体,在藏地牧区自古流传,造就了藏族民俗文化的特色性。在城市化进展迅速的当下,该文化正遭受侵害和破坏,日益徵末、淡出视野,在倡导保护传统民族文化的多元化时代,面临此种情形,文章作者前往西藏拉萨、那曲进行田野考察,对藏族毛类手工编织的应用、常见分类、传承现状、文化寓意作出梳理分析,并从可持续设计的角度挖掘其文化再生与创新在当地文化场域中的现实意义,对其传承