论文部分内容阅读
数据挖掘(Data Mining)是目前国内外数据库与信息决策领域最前沿的研究方向之一,它能够找到大量数据背后所隐藏的规律性,从而为决策者提供相应的支持信息。数据挖掘技术虽然已经被广泛地应用在许多领域,但是在教育领域的应用与研究尚处于初始阶段,因此对该技术进行深入的分析与研究,不仅有着十分重要的理论意义,而且有着非常重要的应用价值。
现阶段各网络学院对学生信息等数据的处理一般停留在简单的数据库管理和查询阶段,不能发挥其应有的作用。根据这些数据具有分类的预知性和离散性的特点,可以灵活运用决策树ID3算法,生成决策分类树。但是由于ID3算法有多值偏向属性的不足,如何对属性进行筛选以提高分类精确度,就成了问题的关键。为此,本文运用了一种基于灰色关联度的修正因子属性选择方法。该方法首先计算各特征属性与类别属性之间的灰色关联度,并将它们排序;其次对信息增益大但取值较多的属性通过灰色关联度来判断是否最优,从而确定是否降低它的信息增益;最后对信息增益大取值多但灰色关联度低的属性,在计算其信息增益时通过灰色关联度的正弦值来代替用户兴趣度值,其它属性计算信息增益时用户兴趣度设为0。仿真结果表明效果良好。
用上述方法对影响学生成绩相关属性集进行属性选择,把基于决策树理论的数据挖掘改进算法引入到学生成绩分析中,找出影响学生成绩的潜在因素,从而为教学部门提供决策支持信息,促使更好地开展教学工作,提高教学质量。此方法与传统的决策树数据分类方法相比,它可有效地选择出对于分类最重要的属性,提高规则的预测精度,并增强决策树的抗干扰能力。