论文部分内容阅读
校园数据库中包含了大量的与学生学习生活有关的数据,如何对校园数据进行挖掘与分析,发现隐藏在其中的有价值的知识是目前教育界以及学术界普遍关注的问题。目前,关联规则挖掘技术被广泛用于校园数据分析之中,但仍存在以下两个问题。首先,大部分的工作只限定于单一层面的研究,比如只研究学生的消费数据,或者是只研究学生的成绩数据,对于学生行为习惯与成绩的关联性之间的研究却不多,然而如何从校园数据中挖掘出有利于提高学生学习成绩的因素是相当重要的。其次,目前人们对于关联规则在校园数据分析中的应用只停留在正关联规则挖掘的基础上,忽略了负关联规则的重要性。负关联规则可以挖掘出数据库中项集之间的负相关关系,可以弥补正关联规则对知识表示的不足。
因此,针对第一个问题,本文收集了学校的一卡通消费数据、图书借阅数据、心理健康数据以及学习成绩数据,从学生的消费习惯对学习成绩的影响、图书借阅行为对成绩的影响以及心理健康程度对成绩的影响多层面进行了研究。
针对第二个问题,本文借助正负关联规则挖掘(Positive and Negative Association Rules,PNARC)算法对以上数据分别进行了挖掘与研究,实验结果表明该算法可以同时挖掘出各种行为与学习成绩之间的正关联规则和负关联规则,基于这些规则分析出学生日常的行为习惯与其学习成绩之间存在强相互关系,学生可以通过建立良好的日常的行为习惯来改善其学习成绩。
为了更加全面的分析影响大学生学习成绩的因素,本文对一卡通数据、图书借阅数据、心理健康数据与学生成绩数据进行了整合,并选取包含成绩、心理疾病因子等20个因素作为PNARC算法的输入数据,经分析发现即使在置信度很大的情况下,仍然有大量的规则被挖掘。为了解决此问题,本文采用了无冗余正负关联规则挖掘算法对以上数据进行了挖掘分析,实验结果表明该算法在保证不丢失准确信息的情况下极大地减少了规则的数量,提高了挖掘效率。
此外,为了发现心理疾病因子之间的相互关系,本文还将PNARC算法用于心理健康数据的分析中,实验表明PNARC算法可以有效地挖掘出心理疾病因子之间存在的正相关与负相关关系,可以为学校的心理健康建设工作提供基于数据的指导性建议。
因此,针对第一个问题,本文收集了学校的一卡通消费数据、图书借阅数据、心理健康数据以及学习成绩数据,从学生的消费习惯对学习成绩的影响、图书借阅行为对成绩的影响以及心理健康程度对成绩的影响多层面进行了研究。
针对第二个问题,本文借助正负关联规则挖掘(Positive and Negative Association Rules,PNARC)算法对以上数据分别进行了挖掘与研究,实验结果表明该算法可以同时挖掘出各种行为与学习成绩之间的正关联规则和负关联规则,基于这些规则分析出学生日常的行为习惯与其学习成绩之间存在强相互关系,学生可以通过建立良好的日常的行为习惯来改善其学习成绩。
为了更加全面的分析影响大学生学习成绩的因素,本文对一卡通数据、图书借阅数据、心理健康数据与学生成绩数据进行了整合,并选取包含成绩、心理疾病因子等20个因素作为PNARC算法的输入数据,经分析发现即使在置信度很大的情况下,仍然有大量的规则被挖掘。为了解决此问题,本文采用了无冗余正负关联规则挖掘算法对以上数据进行了挖掘分析,实验结果表明该算法在保证不丢失准确信息的情况下极大地减少了规则的数量,提高了挖掘效率。
此外,为了发现心理疾病因子之间的相互关系,本文还将PNARC算法用于心理健康数据的分析中,实验表明PNARC算法可以有效地挖掘出心理疾病因子之间存在的正相关与负相关关系,可以为学校的心理健康建设工作提供基于数据的指导性建议。