基于数据驱动的学生程序代码推荐

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zb280048797
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了代码推荐的方法,针对高校C语言课程的编程练习,在学生编写程序过程中提供不同粒度的代码推荐方案。学生练习编写程序过程中会由于编程经验不足、语法不熟悉等原因突然暂停住,又因为不能及时得到老师同学的帮助,不知道下一步的编程思路,给学生的编程学习造成很大困难。一些集成开发环境(IDE)都包含了代码推荐功能,但是IDE通常是基于编程语言的静态类型分析对属性、方法和参数列表的推荐,所提出的代码方案往往与当前的编程上下文环境无关,并且这些推荐的结果是按照字母顺序排列的,没有考虑推荐结果与当前环境上下文的相关性。本课题利用人工智能技术和在线编程课程提供的大量参考代码,研究代码推荐方法及其在学生编程指导中的应用。利用大量正确的学生程序,通过人工智能算法,从单词、句子、和代码块三个不同粒度学习程序的内在结构逻辑和编程模式,从而根据程序的当前上下文,对编程困难的学生提供编程帮助。针对上述问题,本文完成了如下工作:基于循环神经网络的token词推荐。此方法根据当前程序上下文的token序列推荐下一个token词。利用词法分析将程序token化,对token进行标准化以减少代码多样性的影响。利用循环神经网络的学习非线性序列的功能,在token粒度上捕捉token词之间的模式。基于sequence2sequence模型的代码语句推荐。此方法根据当前上下文代码推荐下一行代码语句。首先对源码标准化,减少代码多样性。模型分为编码和解码两个过程,编码阶段的输入是当前程序上下文token序列,编码会输出中间向量,利用注意力机制对中间向量进行处理后输入到解码网络,解码网络会输出一个预测的token序列,即模型根据程序上下文的toke序列推荐的下一个编程语句。集成相似度的代码片段推荐。此方法从代码仓库中选择与当前程序最相似的代码片段进行推荐。首先对程序进行函数分割以减小相似度计算的粒度,接着对token标准化减小变量名对代码相似度计算的影响,然后集成属性计数法和token序列法来综合衡量程序之间的相似性,从而给出相似度最高的代码片段。
其他文献
随着信息技术的发展,海量数据如潮水般涌入社会生产中,这些来自不同渠道的数据夹杂的不确定信息逐渐增多。例如在手写数字识别的图像采集和存储过程中,常因多种因素导致图像局部缺失或污损进而引入不确定性,实践中的处理方法多是通过人工标注完成不确定推理,而后基于确定数据集进行学习建模,这种处理方式效率低、成本高、稳定性差。如何高效处理不确定信息并基于不确定数据集完成分类器的学习与构建,成了手写数字识别研究面临
最近十余年来,多发多收(MIMO)雷达作为一种新的雷达体制得到了科研人员的广泛关注。通常认为,利用MIMO雷达发射波形的可分离特性,可以提供比单发多收(SIMO)雷达更多的系统自由度、更长的等效相位中心基线,有望在目标检测、分辨和参数估计中得到更好的效果。但传统的MIMO雷达需要给每一个发射阵元配备独立的波形发生器,所以导致成本较高。另外,正交的波形也会破坏杂波的回波相关性,使杂波抑制无法依靠发射
随着城镇化与农业现代化的发展,原先“两权分离”的农村土地制度,已经无法适应农业发展的需要。为了解决其带来的社会问题,我国进行了农地的“三权分置”改革,其中承包权是承上启下的重要权利,是农民利益的核心,具有重要的制度意义。但在立法过程中出现了明显的反复,最终未能对其性质、定义、权能等方面进行明确界定。本文首先通过法教义学视角,从现行法律与立法原意进行探析,对土地承包权兼具身份属性与财产属性进行了充分
合成孔径雷达(SAR)图像解译一直以来都受到研究人员的广泛关注,近年来,随着雷达技术的发展,SAR图像已经达到了超高分辨率,这给解译工作带来了机遇和挑战。在超高分辨率SAR图像(MiniSAR)中,目标面和线常常呈现出大小不一、强度不同且不连通的亮斑使目标不完整等现象,使得直接进行目标检测极其困难,从而导致检测率低的问题。针对上述问题,本文提出了基于信息交互和迁移学习的超高分辨率SAR图像飞机目标
恐惧记忆的难以消退和长期持续性,使它成为许多精神障碍和情绪障碍治疗的重难点,如恐怖症,焦虑症,尤其是创伤后应激障碍(posttraumatic stress disorder,PTSD),这种由于机体遭遇了危及生命的事故或灾难,导致应激症状长期存在的精神障碍,其严重影响着患者的生存质量。近年来的研究表明,非编码小RNA(MicroRNA,miRNA)能够通过对基因表达的调控作用,参与恐惧记忆的巩固
随着我国行政体制改革的持续推进,政府绩效问题日益受到社会各界关注。选择符合地方实际的、具有广泛性、兼容性的绩效管理工具,成为各级政府积极探索的主要内容。目标管理因其实践时间长、应用范围广、认知度高、统摄性强而颇受欢迎,逐渐成为管理人员推崇的典型工具。当前,许多政府系统都陆续运行目标管理体系,但是由于区域发展的协调性不同,各级政府对于目标管理的理解和运用能力存在较大差异。因此,如何更好的运用目标管理
目的:BET bromodomain抑制剂治疗卵巢癌表现了不错的效果,其通过下调关键的转录因子发挥作用。在本研究中,我们系统地分析了JQ1在卵巢癌中引起治疗耐受的分子机制,以及其他表
配电自动化系统属于工业控制系统的一种,目前其发展趋向信息化与智能化,将更多的IT技术应用到新一代的配电自动化系统之中。近些年来工控相关安全事件频繁发生,随着我国配电自动化系统的高速发展,其信息安全防护将成为电力行业领域的热点和难点。相关领域的学者对于工控信息安全相关的研究取得了一定的进展,但对于配电自动化系统安全的研究较少。配电自动化系统尚未提出可信的风险评估模型,评估方法以主观推断和套用传统评估
儿童文学在孩子的成长过程中扮演着重要的启蒙角色,儿童文学及其翻译在本质上都是为儿童而创作的文学作品,需要充分顺应儿童的认知思维特点,因此无论是创作理念、创作过程抑或是文本本身,都具有其特殊性,译者也应尽力在译文中把儿童文学的这种特殊性充分地呈现出来。本文旨在探讨儿童文学特殊性在翻译中的呈现策略。本文首先对儿童文学及其翻译领域内的国内外相关文献研究进行了梳理与总结,并提出了笔者的思考,制定了以情节、
为了满足激增的流量需求并实现业务覆盖面积的增大,各大运营商所部署的基站数也快速增长,但也造成了相邻小区之间是密集和重叠覆盖的,这使得各小区间干扰成为制约用户性能的主要因素,因此在此场景下可以通过邻近小区之间的协作传输来满足网络中的业务量需求。另外,由于物理层传输技术的演进对业务承载能力的提升是有限的,为此本文使用新型超蜂窝网络(Hyper Cellular Network,HCN)作为研究的网络架