基于领域知识库的程序代码挖掘系统研究

被引量 : 1次 | 上传用户:xby520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着ACM/ICPC国际大学生程序设计竞赛(ACM InternationalCollegiate Programming Contest,简称ACM/ICPC)在国内高校中渐渐普及起来,很多大学都希望能派出更多的队伍,让更多的学生有机会参加这个赛事,而这就对教练提出了更高的要求。具体体现在以下三个方面:(1)如何选取知识较全面的队员去参加比赛。由于ACM/ICPC比赛的出题范围比较广,因此,要求参赛队员的知识面也比较广,只能这样才能更好地适应这项比赛。(2)如何对队员组队。ACM/ICPC比赛是三个人一组去参加比赛的,因此,如何组队以发挥出团队的最佳效果是十分重要的。(3)如何做针对性的训练。随着比赛队伍的增多,竞争必然加剧。因此,在平时训练中给队员一些关于赛区题目特征的指导意见以提升训练质量也是必要的。针对以上问题,本文提出了一种基于领域知识库的程序代码挖掘方法。该方法的基本思想是通过分析队员在比赛前训练留下的大量程序代码或者各赛区的历年解题参考代码,挖掘出其中蕴含的知识特征,为解决上述问题提供帮助。具体的工作有以下几个步骤。首先,建立领域知识库。领域知识库的主要功能是在程序代码转化和知识点多元统计分析的时候提供支持,它是整个研究的基础。本文是利用领域本体的建模方法来实现机器可以理解的程序设计领域知识库的。其次,程序代码的转化。具体来说就是把多组源代码集转化为知识点使用统计表,这是由于程序代码是非结构化数据,是无法对其直接统计分析的。本文是通过开发语言判断、词法分析和知识点判断及提取这几个模块来实现的。然后,知识点多元统计分析。这是我们完成对队员知识特征分析或者赛区出题特征分析的方法,具体使用的是主成分聚类分析。首先,进行主成分分析,把变量转化为几个综合变量,并实现对队员的综合评价;接着,进行聚类分析,实现队员或者赛区知识特征的分类描述。最后,利用一个实例详细讲解了该方法的实现过程,并对应用结果进行了分析。
其他文献
<正> 汉武帝于公元前138年和公元前119年曾两次派张骞出使西域。关于汉武帝第一次派张骞出使西域的原因,人民教育出版社1981年11月出版的初中课本《中国历史》第一册上说,是
本院近10年共收治外伤性肝破裂151例。根据术中所见及参考有关文献,将肝脏损伤分为四级。四级肝损伤病死率差异显著(P<0.005),Ⅲ、Ⅳ级肝损伤病死率明显高于Ⅰ、Ⅱ级。在Ⅰ、
在音乐文化发展的历程中,音乐表演空间的发展,直接推动音乐表演传播事业的发展。在音乐文化产业中,音乐表演空间的创意,经历了一个历史性的过程。音乐表演空间创意的灵感飞跃
宋徽宗赵佶于1104年在开封首创了国家最高美术教育机构即画学,这是世界上最早的美术学院。画学有系统、健全的美术教育制度,培养了大批优秀画家,孕育出众多绘画理论著作及作
随着互联网的快速发展以及现代社会信息化速度的加快,知识的传播以及产生均以几何级速度增长,虽然传统的课堂授课以及答疑还是占据主导地位,但已经不能满足人们的终身教育的
农业是国民经济的基础,农村科技资源的供给直接关系到农民自身利益的实现和农村经济的发展。在21世纪的今天,信息、生命科技已成为这个时代不可或缺的元素,这就要求科技与农
伴随着改革开放和中国城市化进程的推进,农民工问题逐渐凸现,由此带来的一系列在医疗卫生、住房、子女教育、社会保障等方面的问题逐渐受到政策的关注,其中农民工子女的教育
中职学校学生的特点要求教师必须提升课堂教学的趣味性,在此基础上才能提升课堂教学的有效性。本文从中职学校学生认知基础和兴趣爱好出发,在课堂趣味教学模式上进行了一些探
<正> 1858年6月,清政府钦差大臣接受英法侵略者提出的全部条款,签订了《天津条约》,断断续续打了二十个月的第二次鸦片战争似乎应该结束了。但是,事隔一年,大沽口又响起了隆