大数据环境下大学生上网行为分析与决策

来源 :科技风 | 被引量 : 0次 | 上传用户：f2062325

【摘要】

：

【作者】

：

金彩　孙新杰　余顺家　莫悠

【出处】

：

科技风

【发表日期】

：

2020年5期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：网络是把双刃剑，对学生来说有利也有弊。为了制定合理的管理措施，督促大学生及时规范自己的网络行为。该研究重点研究了数据挖掘算法的选择，最后选择决策树、关联规则、预测分析对学生上网行为中的重要数据进行挖掘，实现大数据网络行为属性与学生学习成绩之间相关属性分析。结果显示，在“流量数据”中，“上网时间长度长”无疑是导致在校学生正常学习水平差的罪魁祸首。研究结果：相当差的算法是逻辑关联回归，相对比逻辑回归好一点的是决策树挖掘算法，最优秀的数逻辑关联性和规则数据挖掘算法。
　　关键词：大数据;上网行为分析与决策;决策树;关联规则;预测分析
　　1 概述
　　大数据时代的到来，导致了大学生的网络行为分析数据中的比重也越来越大现。网络管理系统多年运行，积累了大量的运行数据、业务数据和日志数据。对这些网络数据进行采集，利用这些大数据，研究其规律。首先，问题是“学生长时间上网会影响学习质量”这个结论正确吗？两者之间是否存在其他的关联？所以我们最主要的是要在这些大数据中提取我们需要的利于我们研究的数据，我们来对数据进行挖掘。数据挖掘中所包含的数据内容、算法等都是由多种不同学科交叉应用构成的。大数据分析与信息挖掘技术是近年来的技术发展研究热点，大数据挖掘技术应用涉及到在校大学生日常上网时的行为数据分析，能够快速并准确的发掘出各种潜藏在学校数据集中的网络规律和异常，并以此为基础不断完善学校网络管理环境。能够真正做到让学校网络上的学习信息资源为广大学生所用。这正是本研究的意义所在。
　　2 数据挖掘的研究流程
　　流量数据是较为常见的数据元素，每一个网站都在关注它。我们收集到的学生上网数据存在有缺失值、重复值等，所以要进行数据预处理，数据预处理没有标准的流程，通常针对不同的任务和事件。还要对数据挖掘进行归类，才能选择到合适的方法对数据进行建模。在目标进一步明确的基础上，我们就可以按照问题的具体要求来重新审视已经采集的数据，所以要求有针对性，要组合或者新生成一些新的变量，以体现对状态的有效的描述。
　　3 构建数据模型
　　3.1 數据采集
　　本研究以六盘水师范学院的高校学生网上行为数据与其课程的期末考试成绩作为研究的数据对象。采集学院在籍学生数据人数9，025条记录，从教务管理系统中在抽取学生的期末考试成绩数据记录519，898条，从教务管理系统中提取学生2，402，311条上网数据记录。
　　3.2 教育数据的预处理
　　（1）采集的数据范围较广，数据预测的处理主要目的是为了去掉脏的，乱的，多余的，重复的这些数据，降低这些样本数据的冗余度。基础数据是学生的上网数据，需要对其除脏数据，将经过预处理后的每个学生当时上网行为关联数据和每个学生的平均绩点行为数据一并通过“学生id”字段进行数据样本关联，得到当时学生学习信息、上网及学习课程平均每个学分学生绩点行为数据三种关联数据的并集，也可以说是一个样本关联数据集，以“学生id号”作为主键，唯一标识每条数据元组（此时学生上网信息数据表的一行记录）。
　　（2）我校学生日常上网互动行为数据收集。可以利用基础的SQL语句，应用数据库里的数据进行分组查询，按年级话分，以学号为主键，进行汇总即可得到需要用来进行数据挖掘的学生学习信息数据的主要字段，有a、出入流量b、浏览时长c、总流量d、上网内容四个指标字段。这样的目的是为了得到冗余较小的学生上网数据。
　　（3）高校都有自己的一套评定学生的学习质量的考察指标，为了我校能够准确衡量学生的综合学习质量，我校学生的采用的评判标准是“学分绩点”，折算成绩点有两个重点：百分制和等级成绩，绩点是与期末考试成绩挂钩的，它们之间呈现的关系。如表1所示。
　　使用决策树分析完成平均绩点计算以后能够大大减少学生成绩记录，每个年级学生的平均成绩绩点数据记录至多1条。成绩点条数在采样数据之时是2140，228，经过多次计算平均的成绩点之后数据记录减少为8，025条，和学生之前采集的数据记录总数一样，这样就大大的缩减了成绩数据最大容量。
　　（4）等级归类。从采集的成绩数据出发，100分为起点，划分分值的区域：分数每下降10分就降低一个等级，最后将其归类为优、良、中和差四个级别。
　　3.3 数据转换
　　对预读处理后的海量数据，需要根据要求对其进行各种组合式的变换，这里的要求是挖掘数据的变量。对预测分析数据来说，转化结果是一个数值变量，进而直接参与预测数据挖掘以及预测分析具体的模型建立。
　　3.4 数据挖掘
　　依据SQL数据库的预处理分析结果，样本训练数据被归类为“优秀”和“普通”两个基础类型。采取合理有效的实例字段，比如“上网时长”等。通过对六盘水师范学院教务管理系统中采集数据挖掘分析，研究各个指标实例字段以及对用户样本上网成绩进行分为几类不同程度的影响。
　　
　　使用决策树模型分析如上图所示，最佳收支曲线分割的上网节点有：432.765、332.325、291.215。我们这里采取的是两个大等级，主要分为“普通”和“优秀”两类评分类别。我们用“白”及“黑”两种颜色来分别代替。从以上图中所有节点的图形比例分析可以明显看出，上网时长与学习成绩是一种相关关系。上网学习时长比例越短，优秀成绩部分学生的整体比例越长，成绩普通部分学生的整体比例越小，反之亦然。在这里我们的推断是①“上网时间长度”是直接影响学生的学习生活质量的最罪魁祸首。②限制上网期间时长与学生的学习生活质量之间呈现负相关性的关系，如果加强限制上网长的时长，对提高学生的学习成绩的非常有效的。③限制上网长有三个关键节点，分别是432.765、332.325、291.215，采取的措施就比较多了，建议是：给校园网设置时间限制，只要一到时间点，就限制网速，还有根据上网时间收取费用等等。　　3.5 關联规则
　　通过对学校教育管理数据集资源进行互相关联，然后再综合分析就可以初步发现班级教师的采用哪种课堂授课互动方式及哪种课堂上的互动教育形式对班级学生的综合学习能力具有良好的互动促进教育效果，淘汰不好的课堂授课互动方式，进而使班级学生在利用课堂学习时间就能够快速掌握基础知识，最终可以实现整个学校管理层次和班级学生学习能力的不断提高。
　　分析上面表2，影响大生学习质量的影响因素主要有“上网时间长度”“出流量”“总流量”“入流量”。学生的“网上浏览内容”也是一大影响因素，所以要对网络信息进行规范。如果是规则1中学生连续上网时间不低于255.84小时，该学生有84.1%的概率被归为“普通成绩”类别，但在规则5中学生总流量时长不高于1.01gb，“优秀成绩”的占比为63.21%。规则6，六盘水高校学生持续上网网络总流量时长不低于66.11gb，在“普通成绩”堆里也要占领了53.1%。再看第7条，这里的总流量就会大于48.34gb，其学习成绩最终在“普通成绩”类别里就到了61.9%的概率。所以“上网时间长度”也是高校学生的一大杀手。所以要特别注意的四个关键点和分割线节点是455.84、390.25、250.04、89.95。关联树乃至关联规则的数据挖掘的分析结果与决策树进行分析后的结果有细小差别。
　　3.6 预测分析逻辑回归
　　利用该方法，可得到学生综合成绩的对应关系。具体做法：首先结合目标数据的分析结果，其次再加上模型的对应等级，最后利用数据模型图作最终的分析比较，得出结论。
　　从表3当中的数据结构出发，结论是：“学生上网时间会影响学习”，该分析结果还提供了389.132、240.240、110.106数据分割判断点，这里的对比分析结果表明与前两者方法的研究结果差别比较小。此外，值得注意的是与前者不一致的地方就是“出流量”，它就不能作为该研究的一个侧重点。
　　4 结果分析与决策
　　结合数据挖掘中应用到的，选择围绕三大算法通过挖掘结果及其相关分析，得到了预期的相一致研究目标。综合三大不同算法的数据挖掘分析结果，六盘水高等师范学院为大学生统计上网使用时长的五个关键数据分割线节点分别为455.84、390.25、250.04、89.95。其中“上网时间长度”显示，学生的学习成绩是和其息息相关的，我们要侧重两个时间点，上网时长250.04小时与390.25小时，应据此研究的时间断点，制定合理的校园网络管理控制措施，还可以在六盘水高校学生学习方面，利用我们的研究结果决策分析，制定更加完美的教学方法。当然，我们还希望进一步深入研究我们的数据挖掘方法，这样就可以针对高校学生上网制定富有操作性和生命力的网络道德行为规范，筑坚强的护盾与心灵。
　　参考文献：
　　[1]胡祖辉，施佺.高校学生上网行为分析与数据挖掘研究.中国远程教育，2017-02-28.
　　[2]邓运，陈晓军.基于大数据分析高校学生行为季刊.福建电脑，2018-09-25.
　　[3]龙虎，李娜大数据技术下的机器学习平台构建研究.电脑知识与技术，2019-04-05.

其他文献

人工智能，法律应该怎样面对

摘要：任何事物和任何技术都是矛盾存在的，人工智能技术在改善司法环境，提高审判效率的同时，也必然会对法律产生一定的负面影响。在厘清人工智能与社会进步、法学发展的关系的基础上，从历史与现实相统一的分析角度发掘法律对人工智能规制的目的，从而有针对性地提出相应策略解决人工智能对未来法律发展所带来的负面影响。　　关键词：人工智能;法律风险;法律规制　　近年来，许多国家已经从国家层面认识到人工智能技术的

期刊

地方红色文化融入大学生思想政治教育的意义与途径

摘要：地方红色文化是在长期的革命斗争、建设和改革实践中逐步形成的具有地域特色的文化类型，将其融入大学生思想政治教育工作的意义在于：弘扬与传承地方红色文化、推动大学生思想政治教育工作的开展。将地方红色文化融入宜春幼专的路径有：推动地方红色文化进课堂、进教材、进校园，开展地方红色文化的社团活动、课题研究、基地建设，创建地方红色文化学习平台。　　关键词：地方红色文化;思想政治教育;意义与途径　　党

期刊

从“人—人”联接升为“物—物”联接

摘要：5G技术超越了人与人之间的联系，使得人与物、物与物之间的联系成为可能。5G技术具有高可靠、低时延、低功耗、大容量、大覆盖和大连接的特点，从而能够改变行业之间、人与人之间的对话方式，催生社会变化、改变商业模式、助力产业转型、和打造智慧城市，让数字经济迈上新台阶。5G技术通过引发智能控制促进社会变化，节省工作时间，破除在异域空间合作方面造成的障碍。　　关键词：5G通讯技术;社会变化;商业模式;产

期刊

素描的面貌应该是多样的

摘要：素描在高中美术特长生专业训练和专业高考中的地位是非常关键的，但近年来在专业训练中越来越呈现出千人一面的现象，学生的个性创造被不断抹杀。因此，教师在教学过程中要关注学生的个性特征，把学生思维方法，表现手段，审美趣味的发掘和培养放到首位，鼓励学生把自己独特的认识和感受用自己恰当的素描语言表现出来，使每一幅作品都有自己独特的面貌，都能记录自己真实的感受。　　关键词：基础;观念;审美;创造;个性;语

期刊

案例教学法在离散数学教学中的应用研究

摘要：案例教学法是一种以案例为基础的教学法，是由美国哈弗法学院前院长克里斯托弗.朗代尔于1870年首创，在医学、管理学等许多学科应用广泛。本文将案例教学法应用到离散数学命题逻辑部分，通过选择真实可信的、客观生动的、与教学内容相关度高的案例，使原本理论性强，枯燥乏味的内容，变得生机勃勃，从而提高学生学习的兴趣。　　关键词：案例教学法;离散数学;命题逻辑　　中图分类号：O158 文献标识码：A　　

期刊

专业课程开展课程思政的探索与实践

摘要：课程思政是落实把思想政治工作贯穿教育教学全过程、使各类课程与思想政治理论课同向同行，形成协同效应的重要体现。推进课程思政建设是高校育人的必然要求，是立德树人的重要途径。本文先阐述了课程思政的概念和内涵，再结合专业课的课程特点，给出了专业课开展课程思政的一些途径和方法。　　关键词：课程思政;育人;思政元素;教学设计;案例　　一、课程思政的提出和内涵　　高校思想政治工作是一项战略工程、固本工程、

期刊

思政教育在成人教育工作中的几点思考

摘要：教育是民族振兴、社会进步的重要基石，是功在当代、利在千秋的德政工程，对提高人民综合素质、促进人的全面发展、增强中华民族创新创造活力、实现中华民族伟大复兴具有决定性意义。本文基于习总书记的讲话引发关于成人教育中思政教育的思考，阐述了继续教育中的困难并提出了相应的解决对策，以求抛砖引玉。　　关键词：思政教育;成人教育;困难;对策　　教育是国之大计、党之大计。2018年9月10日，全国教育大会在北

期刊

基于动态评价理论的微观经济学大班课堂教学评价研究

摘要：微观经济学是地方本科院校经济管理类专业必修的学科基础课，以邵阳学院为例，存在着大班教学带来的学习任务重，学生学习效率差和评价虚等问题。基于动态评价理论性的干预和互动性，微观经济学的教学评价内容包括以下几部分：考勤、随堂测试、课堂论文、在线学习等，提高大班课堂教学评价的有效性。　　关键词：微观经济学;动态评价;大班教学　　Abstract：Microeconomics is a compuls

期刊

基于社会学视角下的高校微腐败问题探究

摘要：当前“微腐败”现象在高校不断蔓延，已逐渐成为影响校园和谐稳定的一个突出问题。许多高校在德育建设中对校园“微腐败”的认知和关注度不够，综合社会制度、社会文化、社会监督等体制不完善导致高校微腐败现象十分严重。高校微腐败的问题具有破坏党的形象、损害高校立德树人的形象、侵害师生员工切身利益等严重危害。研究通过分析社会越轨与高校微腐败的关系，探究了高校微腐败产生的社会根源及其影响，并基于社会学视角提出

期刊

初中生物实验教学的实践与思考

摘要：本文认为教师在教学中应充分重视实验教学的作用，将枯燥的、难于理解的、抽象的理论知识通过实验现象直观地展现在学生面前，有助于教学效果提升。　　关键词：实验教学;初中生物;种子结构　　本文以人教版初中生物七年级上册第三单元第一章第二节“种子植物”第一课时“观察种子的结构”为例，阐述实验教学的实践过程与反思。　　1 实验教学过程　　1.1 教学策略　　采用实验探索法贯穿整个教学过程，按照教材设计顺

期刊

大数据环境下大学生上网行为分析与决策

与本文相关的学术论文