【摘 要】
:
随着信息技术的发展,线上教学平台和传统课堂都产生了数以万计的数据。由于教育环境的特殊性,这些数据通常具有庞大、多维、异构的特点,不仅包括教育管理系统中的学生基本信息、课程参与、成绩统计、图书阅览等异构数据,还包括了学生使用学习平台所生成的大量点击流数据,如交互数据、学习行为数据等多模态数据信息。虽然这些教育数据中蕴含了大量学习行为信息、交互信息、学习效果评价信息,但是对于没有掌握数据挖掘和数据分析
论文部分内容阅读
随着信息技术的发展,线上教学平台和传统课堂都产生了数以万计的数据。由于教育环境的特殊性,这些数据通常具有庞大、多维、异构的特点,不仅包括教育管理系统中的学生基本信息、课程参与、成绩统计、图书阅览等异构数据,还包括了学生使用学习平台所生成的大量点击流数据,如交互数据、学习行为数据等多模态数据信息。虽然这些教育数据中蕴含了大量学习行为信息、交互信息、学习效果评价信息,但是对于没有掌握数据挖掘和数据分析技术的教育教学工作者和学生而言,通常很难处理和解释这些数据,更难以有效利用。困难主要集中在以下方面,一是在学习过程中教师很难及时地收集学生的有用信息,掌握其学习动态,从而导致指导困难;二是学生因不能全面了解自身情况,对于学习能力、学习兴趣进行的误判,从而导致学习效果不佳。如何发掘教育数据的内在价值,使其服务于师生,是当前急需解决的问题。为了解决以上问题本文以用户画像为枢纽,分别使用数据可视化技术、课程推荐算法来对教育数据进行深层挖掘。教育数据可视化是以图表的方式呈现教育数据中的隐含信息,包括学生学习规律和行为特征,能够帮助教师与学生从复杂数据中识别有意义的信息,从而挖掘教育数据平平无奇表面下暗含的教育认知信息,理解复杂的教育现象,同时也极大地发挥了人类视觉认知高通量的优势。教育数据可视化方法已经成为教育教学的策略制定、反馈干预、教学评价和个性化学习的重要支持手段。用户画像能够使用教育数据对学生的兴趣、能力、成绩等进行建模。构建学生画像,既可以用于评价学生的学习行为、学习效果、兴趣偏好,又可以基于学生画像进行成绩预测和学业预警,辅助教育工作者进行决策并制定个性化学习策略。课程推荐是解决教育数据信息过载的主要手段。当面对大量的课程时,学习者很难选择出与自己兴趣和能力相匹配的课程,而合理的选择课程可以提高学习效率与学习成绩。那么使用课程推荐算法就可以很好地为学生用户推荐合适的课程,极大地缓解教育数据领域的信息过载问题。本文根据上述内容主要进行了以下研究:(1)使用高校学生历史行为数据构建了教育数据可视化分析模型。首先,以用户画像为枢纽,针对树图与南丁格尔玫瑰图的各自特点构建了一种径向树图与南丁格尔玫瑰图融合的可视化分析模型(Tree-Nightingale rose diagram),简称TR图,该图在层次数据展示与可视空间利用方面有着独特优势;其次,结合LR算法与GBDT算法的各自优势,使用LR+GBDT融合模型对于学生能否以优异成绩毕业的概率进行了预测,并将预测结果使用可视化仪表盘进行了展示,充分利用了人类视觉高通量特点;然后,使用改进的K-prototypes聚类算法对于学生群体进行划分,并将群体特点标签化,方便制定个性化学习策略;最后,将以上内容融合,构建了基于用户画像的多图表融合模型,在解决多图表联动与图表融合问题以及制定个性化学习策略方面有独特优势。(2)针对教育领域的课程推荐中的冷启动与准确性问题给出了独特的解决方案。针对冷启动问题中因数据缺失无法计算相似度问题,使用漏斗图与矩形树图构建了学生兴趣画像,依据学生兴趣画像可以通过兴趣偏好权重数值计算用户相似度,从而解决冷启动问题;针对推荐准确性问题,依据教育数据的特殊性,提出了基于全局评分的相似度改进课程推荐算法,指出获得高分的课程项目具有更大的信息量,并且使用聚类算法与统计均值众数与之结合确定参数,实验结果也表明基于全局评分的相似度改进课程推荐算法具有更好的效果。(3)根据上述研究内容构建了一个教育数据可视化与课程推荐系统。教育数据可视化及课程推荐系统主要面向教育教学工作者与学生,以提高学生的学习效率、学习成绩、制定教学方案、改进教学计划、提升教师工作效率和探究教育规律为直接目的。
其他文献
在当今这个互联网平台迅速发展的时代,人们对于精神娱乐的需求更加迫切,音乐成为人们精神娱乐的一种重要方式,互联网音乐平台蓬勃兴起。但海量的音乐信息让人眼花缭乱,如何解决信息过载问题、给用户提供个性化的音乐推荐成分为网络音乐平台发展的关键。本文梳理了传统推荐算法的发展过程与研究现状,发现单一的推荐方法存在一些缺陷,如用户特征画像难、新用户冷启动、推荐精度低、数据稀疏等问题。后续学者逐步使用更加多样的方
随着世界城市化进程的不断推进,城市建筑需求量急剧增加,其相应的一系列建材和资源也产生了广阔的市场。识别建筑结构类型是衡量特定建筑所需建筑资源负担的先决条件,有助于建立建筑结构、材料和资源需求之间的联系以及建筑物抗震能力检测等等,从而有助于建立智慧城市形态、推进城市新陈代谢和生态规划等可持续城市研究。机器学习可有效助力建筑结构分类问题,其通常需要大量的有标注样本作为训练集构建机器学习模型。但在实际应
近年来,数字化开始成为了世界商业环境中关注的重点,众多金融企业都在积极地向数字化、智能化方向转变,而中国也在十九大中明确提出了要加速构建数字中国。而这一数字化浪潮,离不开以区块链为代表的新技术的支撑。传统金融的数字化是大势所趋。供应链金融是一种全新的金融业务,其核心功能是银行将核心企业与其上下游企业捆绑在一起,并提供如融资贷款等相关金融服务。该金融业务诞生的初衷是为了解决小微企业难以融资的问题,然
随着我国资本市场不断发展,上市公司数量不断增多,财务舞弊案件层出不穷,扰乱我国资本市场的同时也造成了投资者的经济损失。进行公司的舞弊识别成为对于上市公司监管的重要任务,有利于维护投资者利益和资本市场稳定。本文将研究目光放在年报文本上,将年报文本中的管理层讨论与分析文段作为研究对象,从多个角度对于年报文本中信息量含量较大的管理层讨论与分析文段进行文本特征提取,加入到舞弊模型中,查看文本特征对于舞弊识
信用风险是信贷业务的主要风险来源。近年来,随着社会经济的快速发展,信用消费的经济形式越来越普遍,违约风险也随之增多。我国目前的信用现状仍存在很多问题,严重的违约风险很大可能会影响社会经济的健康发展。如何准确和全面地对个人信用风险进行评估是银行等金融机构的重要任务和必然要求。传统的信用风险评估方法过于依赖个人征信,缺乏时效性和全面性。大数据时代的到来提供了丰富的数据,加上深度学习技术在多个领域内的成
从上世纪60年代诞生至今,电子游戏产业发生了翻天覆地的变化,特别是伴随着2021年以来元宇宙的异军突起,由于其自身特性与电子游戏的追求不谋而合,使得电子游戏再次受到了人们的广泛关注。诸如寻路及难度预测两大问题对于游戏的设计与开发至关重要。寻路系统是指通过一定算法在最短时间内,为角色找到一条从起点到终点、无碰撞的最短路径。因为寻路的效率影响游戏智能体决策的能力,因此寻路系统的优劣在很大程度上决定了最
随着互联网行业的发展,金融机构信息化转型的需求也越来越大,互联网金融业务应运而生。互联网金融业务改善了传统金融交易模式,促使金融业的发展和变革。然而,大量互联网金融业务的涌现也直接导致了风险问题的集中爆发。信用卡欺诈、贷款逾期、贷款坏账等不良金融事件时常发生。为了维护经济市场秩序,保障金融行业持续发展,我国政府高度重视互联网金融业务出现的问题,颁布相应法律法规等文件,针对风险问题开展专项整治工作。
在金融市场中,波动率作为衡量金融资产价格波动剧烈程度的指标,对于刻画金融市场中的风险有着重要指导作用。相比以日、月为单位的低频数据,以秒、分钟、小时为采集频率的日内高频金融数据,不再服从正态分布假设,整体上呈尖峰厚尾性质。较高的采样频率,使得高频金融数据能够对市场微观结构进行更准确的预测,因此,大量学者展开了对高频金融数据波动率的探索。在计量经济领域,学者们尝试采用参数估计方法,描述高频金融数据的
智能客服系统是任务型对话中的一个重要应用。智能客服系统相比人工客服而言,解决问题能力更加高效,而且成本更低,因此受到了工业界大量企业的亲睐。比如在电商领域,阿里小蜜、京东小咚等产品都是典型的智能客服系统。在政务客服领域,同样需要智能客服助力。目前,很多政府部门都提供了智能客服系统,比如北京政府的智能咨询机器人“京京”、上海政府的智能客服“小申”等。这些政务智能客服系统可以为公众提供权威的政策咨询服
海冰不仅是全球气候变暖的警示器,同时也是航海的大敌。近年来,利用遥感数据来观察海冰已成为海冰研究的主要方式。图像分割技术作为高分辨率可见光遥感海冰图像研究的基础,其分割效果的好坏将会直接影响到后续研究的结果。由于高分辨率可见光遥感海冰图像的分辨率较高,以像素为单位的分割算法通常分割成本过高,且分割效率低。另一方面,高分辨率可见光遥感海冰图像光谱信息相对不足,部分区域颜色较暗,采用传统的分割算法会将