SQL代码相似度检测算法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:xsxiaomo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展促进了网络教学模式的优化升级,但也使得抄袭的方式和手段更加多样便捷,特别是在高校开展的计算机类课程中,代码抄袭的现象层出不穷,严重影响学生成绩评价以及教师教学质量。目前普遍使用的代码抄袭检测方法和系统并未涉及SQL代码抄袭检测。为此,本文对SQL代码相似度检测算法研究,以检测高校的数据库课程在线学习网站中学生提交的SQL代码数据中是否存在抄袭行为。论文完成的主要工作有:1)提出了一种新的SQL代码相似度检测算法RGS,分析SimHash与RKR-GST代码相似度检测算法的原理和特点,引入属性计数法提取SQL代码的特征属性,通过加权的方式将三者进行融合,提高了检测的准确率。2)提出了一种基于编码习惯的SQL代码相似度检测算法。从学生的SQL代码编码习惯入手,观察待检测的SQL代码编码习惯和学生历史编写的SQL代码编码习惯是否一致。实验证明基于编码习惯的相似度检测算法能检测出RGS算法未检测到的抄袭现象。3)设计并实现了一个数据库课程在线学习的SQL代码相似度检测系统,包括系统需求分析、设计与实现,并将基于编码习惯的抄袭检测算法和RGS算法再次融合,抄袭检测准确率达到84.78%。
其他文献
空间众包(SC)是一种近几年新兴的代替性平台,不同于传统的解决问题的渠道,人们可以在上面发布时空相关的任务以寻求帮助,让平台的工作者去完成这些任务。总之,SC给不同的社会
硒是人和动物都必须的一种微量元素,在生物体内发挥着重要的生物学功能,其中最主要的是抗氧化功能。人体自身无法直接合成硒,只能通过摄食或饮水获得硒元素,而硒缺乏将会引发各种疾病。虽然人体每天所需的硒摄入量非常低,但由于硒元素的地理分布非常不均匀,导致很多缺硒地区的人群很难从每天的摄食与饮水中达到补硒的目的,服用补硒剂则是有效的补硒手段。无机硒的安全阈值窄,易引起动物毒性反应,有机硒相对于无机硒而言尽管
随着科技发展,电子技术以日新月异的速度快速发展,电子设备的柔性性能,引起了人们的关注。柔性电子设备必须要有足够的储能器件,来作为其能量保障,因为设备的正常运行普遍需要消耗电能。和传统的电容器比起来,超级电容器拥有更大的比容量,它的工作环境适应性强,使用寿命非常长;和蓄电池比起来,超级电容器具有更高的比功率,并且对环境更加友好。电极,是超级电容器中最重要的结构,要求其电化学性能优异、机械性能良好。柔
车载自组织网络(Vehicular Ad Hoc Networks,简称VANETs)是由配备了无线通信设备的车辆节点和路边单元构成的一种特殊的移动自组织网络,实现了智能交通系统(Intelligent Tran
由PM2.5造成的雾霾天气对人们的身体健康已造成了严重的威胁。NOx作为PM2.5的主要组成成分,对雾霾的形成有着不可推卸的责任。炼油企业作为我国天然气以及清洁油品生产的最大
高中思想政治课是培养学生人生观、世界观、价值观的一门重要课程,为学生的未来树立正确的政治方向,给学生以后的人生道路提供指引。在思想政治课堂中师生互动的重要性是显而易见的,师生互动是教学活动的基础。近几年来随着新课程标准的实行,有效教学获得了更高的关注度。教学活动离不开师生互动,师生互动是课堂的基础。本文以互动教学为前提,深入探索了师生互动在目前存在的不足以及解决策略,希望对实际教学中关于师生互动的
我国经济正在L型底部运行,短期内经济复苏的难度较大,商业银行不良资产率将在未来一段时间内持续攀升,国家正在新常态经济阶段深化供给侧改革,商业银行也正在为化解不良资产
随着虚拟现实技术的发展,3D影像技术被广泛应用于影视、动画、虚拟展示等众多领域。但是,3D图像往往存在着取景拍摄成本高、制作周期长的问题。为了提高3D图像的制作效率、降
随着企业经营环境的日益动态化和组织架构的日益扁平化,员工建言行为的重要性已经逐渐得到实践家和管理学家的广泛关注与重视。管理者越来越希望员工能够针对工作中的相关问
基于邻域的Top-N推荐算法利用隐式反馈数据建立排序模型,其算法性能严重依赖于相似度函数的表现,传统相似性度量函数在隐式反馈数据上会遇到数据过于稀疏和维数过高两个问题,