基于过程挖掘的代码相似度检测方法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:zcm88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码相似性检测在计算机程序设计教学和软件知识产权保护等方面有重要的应用。在计算机程序设计类课程的教学中,为了规避代码相似度检测工具的抄袭检测,学生会对提交的作业代码使用不透明谓词、循环展开、函数生成和合并等较复杂的代码混淆手段降低代码之间的相似度。现有代码相似度检测方法仅考虑了代码自身的静态特征,只能抵抗较为简单的代码混淆手段,难以处理上述较复杂的代码混淆手段。针对该问题,面向计算机程序设计作业代码的相似度检测,本文考虑代码运行后的动态特征,提出了一种基于过程挖掘的代码相似度检测方法。具体来说,首先,为了获得代码的动态特征,通过代码插桩给代码插入部分输出语句。为此,定义了适用于代码相似度检测的代码插桩语句和插桩规则,通过代码的插桩和运行获得代码的运行日志;然后,通过过程挖掘技术挖掘代码的运行日志,获取体现代码动态特征的流程图;最后,将挖掘得到的流程图作为代码动态特征相似度计算的依据,通过图相似度算法计算流程图之间的相似度,将其作为代码之间的相似度。实验表明,与现有具有代表性的代码相似度检测方法Sim和GPLAG相比,本文方法不仅可以处理现有方法可以抵抗的常用代码混淆手段,还可以抵抗不透明谓词、循环展开以及函数生成和合并这三种现有方法无法检测的代码混淆手段,具有更强的抗混淆能力。
其他文献
低渗透油气藏具有储层致密、非均质性强、渗透率极低、渗流速度低等特点,常规的数值模拟方法无法有效的模拟出低渗透油藏流体的渗流特点,另一方面流线数值模拟方法作为新兴的
十多年来,对于Ni纳米点结弹道磁电阻的研究一直没有定论,由于Ni纳米点结的尺寸在纳米量级,在电场、磁场作用下有很多复杂的效应表现出来,使得实验结果的真相很难从众多复杂的
温敏材料集传感、驱动和材料结构于一体,具有感知、驱动和自动控制等功能,被广泛的应用于驱动、传动和控制元件等工程中。金属/聚合物温敏复合材料因其良好的膨胀性、导热性
直接碳燃料电池(DCFC)作为一种高效清洁的发电技术,对于缓解当前社会面临的能源危机,减少温室气体排放,提高发电效率具有重要意义。输出功率密度和燃料的利用率低是当前DCFC面临的主要问题,提高含碳燃料在阳极的电化学氧化活性是解决以上问题的关键。本工作以碳化的生物质为燃料,考察了杂质对生物质炭的结构乃至阳极反应速率的影响。本工作还对Ni O-Ce0.8Sm0.2O1.9(SDC)阳极材料进行改性,研
NiFe2O4是一种常用的软磁材料,具有高磁导率、低磁滞损耗而被广泛应用于磁头材料、矩磁材料、转换开关以及磁记录等方面,在电子工业上具有极广阔的应用前景。而NiFe2O4与不同
长期以来,上市公司财务困境的预测一直是学术界所关注的重要问题。公司发生财务困境可能会影响公司自身的运营以及造成利益相关公司的财务风险。有效的财务困境预测能促使决策者在发生财务风险之前采取相应措施,避免财务困境的发生,减少亏损。众所周知,同行业公司之间有风险传染的可能性。为了反映同行业公司之间财务困境风险的相互影响,本文构建了一个引入公司之间偏序影响关系的模型。以平稳分布经过状态转移后的概率分布与原
学位
我国从2014年在部分地区开始试点刑事速裁程序,2018年刑事诉讼法修正案中正式规定了速裁程序,速裁程序是为了缓解我国当前司法资源短缺、人少案多的矛盾。速裁程序是比简易程序更加简易的诉讼程序,是以效率作为基本价值追求。同时随着以审判为中心的诉讼制度改革的深入推进,对刑事速裁程序也提出了更高的要求。值得注意的是,如果速裁程序的关注点仅集中在追求诉讼效率的提高上,那将会忽视对被追诉人的权利保障,因此应
随着科学技术和全球工业化的飞速发展,能源危机愈发严重。热电材料在废热利用方面潜力巨大,方钴矿CoSb3基热电材料由于其优异的电学性能和机械性能而成为应用前景良好的热电材料体系,但由于其热导率较高阻碍其商业化推广。本文通过真空熔炼法与放电等离子烧结技术制备系列Ybx(CoSb2.875Te0.125)4样品。经过XRD测试后发现样品峰位随着Yb含量的增加而发生角度左移,但x=0.2样品与x=0.15
微生物是引起食品腐败变质最常见的因素,它给食品工业带来了巨大的经济损失。近年来,铜绿菌引起的食品腐败变质现象越来越受到重视,铜绿菌广泛存在于土壤、空气、水等环境中,常污染饮用水、肉制品、乳制品、新鲜蔬菜等。食品中多微生物引起的污染更为常见,其危害比单一微生物引起的污染更为严重。在食品加工过程中,各种环境因素影响着细菌的生长,如营养条件、pH环境、盐浓度等。因此,了解两种细菌之间的群体增殖特性及常见