论文部分内容阅读
伴随着九年义务教育制度的实施,一些发达地区进一步将高中教育也纳入到义务教育范围之内,从而推行了十二年义务教育。高校扩招,使得有更多的学生有机会进入大学学习,因此高中教育已成为绝大部分学生的必经阶段,从而导致在教务管理系统中积累了大量的学生数据,占用了很大的存储空间。如果能充分利用教务管理系统中的数据,那么不仅可以更好地了解现状,而且还可以对未来做出部分预测和辅助决策。如教师除了能根据学生数据了解学生现状,同时还能根据分析结果进行因材施教,改善教学效果。作为数据挖掘的一个重要分支,教育数据挖掘(Education Data Mining,简称EDM)是关于怎样从大量的学生数据中挖掘出潜在的、有价值的信息,已经引起了相关学者的兴趣和关注。教育数据挖掘就是利用数学方法和计算机技术从浩繁的教育数据中挖掘出具有利用价值的信息,提高教学质量和教育管理水平。 本学位论文的主要工作是利用决策树技术分析多值决策表,并对所生成的决策树进行优化存储。根据教务管理系统中常见的多值决策表分析影响学生考试成绩的因素,以及通过生成的决策树对即将参加高考的学生进行成绩预测,有针对性地采取措施,提高学生的学习效率、教师的教学技巧。通过预测结果了解学生的情况,对于做好教育工作、提高教学效果、培养人才具有重要的意义。文中探讨了论文的研究背景和意义,引出教育数据挖掘和决策树技术在国内外的研究现状和发展,并列举说明教育数据挖掘在现实生活中的应用;给出教育数据挖掘的概念并描述几种常见的典型决策树算法(ID3算法、C4.5算法、CART算法、SLIQ算法)以及它们之间的联系与区别;然后详细讨论了多值决策表和决策树的概念,给出了多值决策表的决策树分析方法,这种方法很大程度上是以动态规划为核心思想,提出了使决策树规模最小化的算法,进而在多值决策表内提取出有价值的信息;考虑到所生成的决策树规模较大,因此给出了合并相同的子树和叶子结点形成决策图的递归算法,所得到的决策图无冗余节点,规模较小,从而减少了存储空间。在决策图中找出影响学生成绩的主要因素,从而为提高学校的升学率提供参考依据。