基于决策树技术的教育数据挖掘研究与应用

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:bsbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着九年义务教育制度的实施,一些发达地区进一步将高中教育也纳入到义务教育范围之内,从而推行了十二年义务教育。高校扩招,使得有更多的学生有机会进入大学学习,因此高中教育已成为绝大部分学生的必经阶段,从而导致在教务管理系统中积累了大量的学生数据,占用了很大的存储空间。如果能充分利用教务管理系统中的数据,那么不仅可以更好地了解现状,而且还可以对未来做出部分预测和辅助决策。如教师除了能根据学生数据了解学生现状,同时还能根据分析结果进行因材施教,改善教学效果。作为数据挖掘的一个重要分支,教育数据挖掘(Education Data Mining,简称EDM)是关于怎样从大量的学生数据中挖掘出潜在的、有价值的信息,已经引起了相关学者的兴趣和关注。教育数据挖掘就是利用数学方法和计算机技术从浩繁的教育数据中挖掘出具有利用价值的信息,提高教学质量和教育管理水平。  本学位论文的主要工作是利用决策树技术分析多值决策表,并对所生成的决策树进行优化存储。根据教务管理系统中常见的多值决策表分析影响学生考试成绩的因素,以及通过生成的决策树对即将参加高考的学生进行成绩预测,有针对性地采取措施,提高学生的学习效率、教师的教学技巧。通过预测结果了解学生的情况,对于做好教育工作、提高教学效果、培养人才具有重要的意义。文中探讨了论文的研究背景和意义,引出教育数据挖掘和决策树技术在国内外的研究现状和发展,并列举说明教育数据挖掘在现实生活中的应用;给出教育数据挖掘的概念并描述几种常见的典型决策树算法(ID3算法、C4.5算法、CART算法、SLIQ算法)以及它们之间的联系与区别;然后详细讨论了多值决策表和决策树的概念,给出了多值决策表的决策树分析方法,这种方法很大程度上是以动态规划为核心思想,提出了使决策树规模最小化的算法,进而在多值决策表内提取出有价值的信息;考虑到所生成的决策树规模较大,因此给出了合并相同的子树和叶子结点形成决策图的递归算法,所得到的决策图无冗余节点,规模较小,从而减少了存储空间。在决策图中找出影响学生成绩的主要因素,从而为提高学校的升学率提供参考依据。
其他文献
随着计算机网络和多媒体技术的发展,网络中的一切服务都被抽象封装成Web服务(Web Service), Web服务是一种自描述的、模块化的应用程序。它是一种与平台无关的技术,在异构平
Web服务自其出现以来,由于其具有互操作性、跨平台性和松散耦合性等特点,已经得到了学术界和工业界的广泛关注和深入研究。单个Web服务由于功能有限,很难满足用户日益增长的功能
Ad-hoc网络作为一种新型的移动网络,与传统的无线网络有很大不同,它不依赖于任何固定的基础设施和管理中心,而是通过传输范围有限的移动节点间的相互协作和自我组织来保持网
随着网络技术的飞速发展,信息大量膨胀和聚集,互联网已经形成了一个由数据构成的巨大数据仓库,XML(eXtensible Markup Language)作为一种常用的数据交换和传输标准,蕴含了丰
移动Ad Hoc网络(MANETs)和点对点(P2P)网络都有共同特征:分布性和自组织性,通常被称为自治网络。资源共享下载服务是自治网络中主要的应用领域之一,节点进入网络后,相互共享并
验证是集成电路设计过程中不可或缺的重要环节。它是在流片前发现设计缺陷和错误的最后机会,对于整个项目的成败至关重要。传统的验证方法验证时间长、效率低,已经无法满足现
在分布式环境下的数据发布模式中,发布服务器并非完全可信,用户从发布服务器得到的数据有可能被篡改、伪造或丢失。若没有有效的安全措施,用户得到了错误的查询结果,往往会给
在网格环境中,资源提供者和用户具有不同的目标、策略,使得网格资源分配成为一个难点。如何合理分配网格资源,优化系统的整体效用,已成为一个重要的研究课题。传统的资源分配
微粒群优化算法(Particle Swarm Optimization, PSO)源自对鸟群觅食行为的研究,是一种基于群体智能的随机搜索算法。PSO算法概念简单、参数设置少、计算速度快、鲁棒性好,短短十
复杂网络的社团发现致力于揭示出复杂网络中真实存在的网络簇结构。服务网络是互联网上大量开放服务交互所构成的网络集合,服务通过业务需求的驱动自发组合以满足用户需求,在