【摘 要】
:
随着计算机在人类生产、生活领域的不断普及,以及云计算、大数据等新兴计算模式的不断出现,软件开发与维护已成为一门重要的学科,然而在计算机软件的开发和维护过程中依旧会遇到许多的问题,软件开发的高成本与低质量的矛盾一直客观存在并亟待解决。在充满新技术以及软件系统开发的过程中,代码自动生成或搜索工具可以协助开发者较快的完成手头上要实现的编程任务,对于某个代码功能语句,开发人员往往会借助一些代码辅助工具编写
论文部分内容阅读
随着计算机在人类生产、生活领域的不断普及,以及云计算、大数据等新兴计算模式的不断出现,软件开发与维护已成为一门重要的学科,然而在计算机软件的开发和维护过程中依旧会遇到许多的问题,软件开发的高成本与低质量的矛盾一直客观存在并亟待解决。在充满新技术以及软件系统开发的过程中,代码自动生成或搜索工具可以协助开发者较快的完成手头上要实现的编程任务,对于某个代码功能语句,开发人员往往会借助一些代码辅助工具编写程序,重用现有的框架和库来提高编程的效率。而代码辅助工具中涉及到的自然语言处理技术逐渐成为一个重要研究方向,程序员往往会通过输入自然语言形式的查询寻找正确的代码片段,进而来实现某个或某些代码语句功能。在实际开发中,开发者输入的查询格式是多样自由的,如中文、英文或英文混合代码的查询等格式。因此,如何对多样自由格式的查询进行分别处理,同时自动生成满足查询请求且最优的结果是一个潜在的挑战性问题。为此,本文构建了响应自由格式查询的代码片段生成方法。其基本思想是针对上述三类格式查询进行专门处理并分别构建相应的代码生成工具,并通过优化排序算法实现多种格式查询满足同一请求时的最优结果推荐,从而生成基于用户查询满足用户需求的代码片段。本文所指自由格式是响应用户中文输入查询,英文输入查询,英文加代码三类格式的的查询,具体研究目标如下:1)针对查询具有多样自由格式的问题,提出了一种响应多种格式查询的方法,可对输入的自由格式查询请求进行响应。在不同格式输入方面,又对三种不同的输入进行了分门别类的优化处理,提升了方法的智能性和实用性;2)针对多种格式查询表达同一请求时的最优结果推荐问题,提出了基于Markov模型的代码片段排序方法,可对生成结果分类并依据概率模型进行评分,从而为开发人员提供可供选择的候选排名列表,快速定位最优结果。本文解决的主要关键问题如下:1)技术性关键问题:对于中文格式输入查询的处理,使用Word2vec和Encoder-Decoder;对于在英文加代码格式输入查询处理,使用含有注意力机制的Seq2Seq的模型。2)设计性关键问题:设计了一种响应自由格式查询的处理流程,能提供三类格式的输入查询生成代码片段的精度。3)模型性关键问题:提出了一种将语料库模型和词袋模型相结合的代码集库模型和Markov模型,能够提高了代码片段生成方法的可用性。
其他文献
经验模态分解(Empirical Mode Decomposition,简称EMD)算法是一种处理非线性非平稳信号的时频分析方法。该方法可以自适应地将输入信号分解成若干层本征模函数(Intrinsic Mode Function,简称IMF)和一个余项函数,通过对IMF的特定操作可以实现信号的滤波和去噪等功能。经典的EMD算法主要针对标量形式的函数信号,处理几何模型时需要首先定义几何模型上的信号函
穿越电影打破了传统电影中对于“时空”的限制,对电影时空进行重新解构,从而形成独特的时空类型。此类电影中的“时间”变的更加自由,故事情节也不再按照线性顺序的时间逻辑发展。所以,作为电影叙事的关键设置点,“时空”在穿越电影中起到了举足轻重的作用,并对电影叙事产生了极大的影响。本文将根据穿越电影中“时空”呈现方式的不同,将其分为线性时空、平行时空和循环时空三种类型。同时,由于每种时空类型对电影叙事会产生
自然中的能源在不停减少,而工业发展对能源的需求则不停增进的,这无疑要求人们去探索可循环重复利用且对在使用过程对环境不会产生危害的绿色能源。氢能具有可循环使用的优点,通过水电解的方法制备氢气是一种安全可行的方法,但这个方法制备氢气过程中存在一个致命的缺点,这个缺点是:电解水过程中的阴极上的析氢过电位太高,导致电解水所需消耗的电量巨大。为了克服这一缺点,很多工作都致力于开发性价比高的阴极电极材料,Ni
数据挖掘的一个基础研究方向就是频繁项集挖掘。频繁项集挖掘指从交易数据库中挖掘出频繁出现的项集,从而为下一步关联规则挖掘或序列挖掘提供支持。传统的频繁项集的挖掘的
《巴塞尔协议III》是资本质量的新标准。为此,我国银监会2012年6月发布《商业银行资本管理办法(试行)》,财政部2017年5月发布《企业会计准则第37号——金融工具列报》,缩小了我国与国际资本监管标准的差距。流动性和风险性使资本市场能够快速对金融工具价值变动做出反映,而风险建模有助于建立准确的资产定价模型,及时反映资产价值变动。研究风险建模对金融工具公允价值变动的市场感知的影响,对于完善风险度量
磁性材料在当代科技发展中起着举足轻重的作用,人们为了探索磁性材料在有限温度下的各种特征性质,提出了多种理论和方法。数值方法中的蒙特卡洛方法因为其自身的优点,在这一领域得到广泛有效的应用。本文正是采用蒙特卡洛方法中的Metropolis算法进行三维Ising模型、三维Heisenberg模型和磁性材料CrO_2的模拟计算,主要内容如下:第一章,介绍磁性科学的发展历程和磁性系统中常见的自旋相互作用。第
数据挖掘技术旨在从海量数据库中发掘出潜在的重要知识。数据挖掘技术与日俱兴的同时,在挖掘过程中,私人或敏感知识被泄露出来的风险也越来越高。然而商业合作中数据共享是必
教学资源是有效开展教学活动的前提条件,在职业教育快速发展的这几年里,各地职业院校纷纷加强专业教学改革,提升专业发展,在建设过程中积累了大量的课程资源,包括教材、案例
随着科学技术的不断发展,人类所接触的世界变得越来越复杂多样化,我们所研究的数据也会变得复杂。因为在不同情况下,样本数据性质不一,观测数据难以用单一参数分布来描述,因而人们想到利用有限混合分布模型来描述广泛的随机现象。另一方面,由于在观测过程中可能会受到外界因素干扰、仪器本身、人为对数据进行“截断”等相关因素的影响,导致数据的缺失;并且在许多情况下,即使获取了完整的数据,但是由于计算复杂度高,传统方
篦冷机是水泥生产过程中的关键设备,担负着冷却高温熟料、改善煅烧条件、回收热量的任务,但篦冷机换热系统工况复杂、参数多且相互耦合、内测控点少,难以建立准确的模型。而贝叶斯网络将概率论与图论相结合,具有强大的推理能力及方便的决策机制,处理不确定性问题有明显优势。因此,本文将贝叶斯网络应用于篦冷机熟料换热系统,对篦冷机关键参数篦下压力进行故障诊断和状态预测研究。具体研究工作如下:首先,简要介绍课题的研究