【摘 要】
:
校园线下社交关系是学生校园生活的重要组成部分,其一般通过校园互动行为所驱动。良好的线下社交关系是学生德智体美劳全面发展的重要前提。然而,如何有效获取学生线下社交信息并应用在学生管理过程中仍是教育数据挖掘领域的一个难题。目前现实环境和国家政策均为教育数据挖掘领域发展提供了难得的机遇,且该领域在近几年获得了快速的发展。但由于教育领域的非盈利性与服务性,相比于其他大数据挖掘领域,教育数据挖掘的研究尚不深
论文部分内容阅读
校园线下社交关系是学生校园生活的重要组成部分,其一般通过校园互动行为所驱动。良好的线下社交关系是学生德智体美劳全面发展的重要前提。然而,如何有效获取学生线下社交信息并应用在学生管理过程中仍是教育数据挖掘领域的一个难题。目前现实环境和国家政策均为教育数据挖掘领域发展提供了难得的机遇,且该领域在近几年获得了快速的发展。但由于教育领域的非盈利性与服务性,相比于其他大数据挖掘领域,教育数据挖掘的研究尚不深入,有许多问题仍未被关注或被解决。现阶段该领域的研究主要具有以下特点:(1)大学生校园行为在数据层面的时空规律与深层逻辑尚未被关注。(2)基于校园时空数据大规模实时的大学生社交链接仍无法有效挖掘。(3)结合大学生社交相关信息的学生管理评估方法较少。基于以上问题,本文的主要研究工作和创新点如下:1.提出一种消除数据时空聚集性与学生同质性的方法。首先分析了数据集中存在的时空聚集性,并通过基于签到密度的聚类方法将数据集分为聚集事件集与非聚集事件集,针对聚集事件中存在的同质性问题,分析单个学生在聚集事件中与他人的共现次数分布挖掘共现模式,根据此模式计算各院系同质共现概率矩阵,以此消除聚集事件中因同质性产生的噪音共现。2.提出一种两阶段的学生线下社交链接挖掘方法。针对目前校园社交链接挖掘仅仅简单使用了学生间的共现信息,而忽略了学生生活习惯、刷卡时间地点的具体情况等特征的问题。本文在聚集与非聚集事件集上提出基于假设检验的社交链接挖掘方法。首先,在前人的基础上,提出了学生共现是由随机因素所导致的零假设,并设计了统计检验量进行假设检验的验证。针对在聚集与非聚集事件中多个假设检验的显著水平选取问题,本文结合学生的日常生活特征提出了基于集成学习方法的社交链接深度挖掘方法。首先在数据集上使用递归消除方法进行特征选择,最后构造基于LR、SVM、GBDT、XGBoost四种方法的异质集成模型并使用不同集成策略进行测试。3.提出一种融合学生线下社交链接的贫困生评估方法。针对目前高校贫困生评估流程繁琐且传统利用学生生活特征评估方法效果较差的问题,本文融合了学生线下社交链接信息与学生生活特征数据,提出了融合学生线下社交链接的高校贫困生评估方法。首先,使用Deep Walk、Node2Vec、LINE、SDNE、Stru2Vec等图嵌入方法,构造学生线下社交链接网络并将其转为网络节点的学生向量表示;其次提出图嵌入增强的贫困生评估方法。结果表明,该方法有效地融合了学生的线下社交与生活信息,有效地提升了贫困生评估的效果。
其他文献
在线知识社区是具有开放性和自组织性的线上虚拟组织,已成为知识建构和共享的主要平台。随着人工智能的发展,机器人在社区中得到广泛应用,通过与人协作的方式共同参与知识建构。在线上人机协作的背景下,如何寻找执行任务的替代流程以充分利用人机协同效应是组织面临的关键问题。然而,当前研究中缺乏从人机互补增强视角考虑如何优化现有的知识建构流程以提升协作绩效。因此,本文从流程视角出发,考虑人类和机器人的互补优势,研
风险社会背景下,食品安全关系到消费者的身体健康和社会整体的稳定和谐,受到全世界的重点关注。与此同时,伴随新兴技术的发展,社会系统之间的耦合程度提升,各类规模较大的突发事件往往不是独立爆发,呈现明显的级联特征,各级联事件之间的驱动因素、影响因素相互交织,导致负面影响不断累积放大。为响应我国防范化解重大风险的号召,基于级联风险视角对食品安全事件进行分析,并进一步构建应急决策模型,既有助于政府及应急管理
随着大数据时代的到来,银行在越来越多的客户信息中以传统电话营销的方式寻找有价值的客户无异于大海捞针,需要投入很多时间成本和人力资源。因此,如何对海量客户进行精准分类成为银行电话营销的关键。机器学习方法因其强大的数据挖掘能力被广泛应用,在分类问题上表现出显著的性能优势。鉴于此,本文采用改进后的机器学习方法对银行电话营销客户数据进行分类预测,以图提高银行电话营销的命中率。为进一步提高银行电话营销预测的
城市建筑火灾是一类极具破坏性的突发事件,对人类生命财产造成巨大损失。在火灾事故发生时,第一响应人员的派遣直接关乎事故整体救援效果,在初次派遣时刻如何准确评估救援需求、高效做好应急响应工作是消防部门关注的重点问题。历史火灾数据记录了各个火灾事故的应对方案,在火灾事故派遣问题上具有重要参考价值,但当前鲜有研究对其中救援人数规律进行挖掘。因此,本文引入机器学习方法对第一响应人数需求预测问题展开研究,主要
十九大报告强调,面对空气污染要全民共治、源头防治,但在污染物浓度水平不清、对室内成员作用结果不明的室内情境中,防护和治理都难以有效进行。与传统的污染成分分析不同,本文关注室内空气质量对个体感知与认知的作用过程,从以教研室和研究生群体为要素的实验出发,重点探索室内空气质量对研究生认知表现的影响机理。现有文献建立了室内环境与室内成员舒适度间的定量联系,讨论了室内空气污染物含量可能对工作绩效产生的影响,
移动应用程序(Mobile Apps)遍布生活的各个方面,市场前景广阔。但是由于产品趋于同质化,且用户转移成本低等原因,App研发项目失败率较高。作为App诞生的重要基石,App的设计在根本上决定了其能否找到创新突破口并迅速满足用户需求,从而更好服务用户,站稳市场。App设计团队的成员们拥有类别各异的专业知识和技能,通过充分的交流和互动完成既定任务。而互动动机是影响成员互动过程的重要因素。无论是以
近年来,我国建筑业得到了快速发展,但是随之而来的是频发的建筑安全事故,造成了不少的人员伤亡与经济损失,在一定程度上影响着社会的和谐稳定与经济发展。而其中高处坠落事故由于发生频率高、导致死亡人数多,被称为建筑业“五大伤害”之首。因此分析高处坠落事故原因之间的关系,从中找出最可能引发事故的关键因果链,并根据关键因果链制定具有针对性的预防措施及安全管理策略,对于降低高处坠落事故风险,提升建筑安全水平有着
当前,我国果蔬农产品“最先一公里”存在人工分级效率低、预冷服务不及时等问题,果蔬产地分散、中小规模的特点使得采后流程化处理难以实施。新兴的移动式分级、预冷设备应用于田间地头虽能解决上述问题,但分级和预冷环节存在断链,需要将移动式分级和预冷资源进行协同调度以减少服务间隔时间,进而保证果蔬质量,降低腐损率。基于此,本文结合果蔬是否具有强时效性特点构建了两种情景下的协同调度模型,一种是针对保质期较长的耐
自2008年我国提出通过“化工入园”来引导化工产业集聚化和规范化发展的战略后,我国化工行业迎来了高速发展,进而促使了一大批化工园区的形成。如今,化工园区的安全稳定发展对于我国经济平稳运行起到了重要支撑作用。然而化工行业本身属于高危险等级行业,园区内储存有大量危险化学品,这些危险化学品具备易燃、易爆、毒性、腐蚀性等特性,并且广泛存在于生产、加工、运输的各个环节。近些年来由危险品引发的火灾、爆炸、毒气
人们的生命健康始终被疾病所威胁,新型药物研发是攻克癌症、慢性病等医学难题的关键。作为药物研发的起点,药物筛选辅助技术利用计算机从海量化合物中快速筛选出特定靶标候选药物分子,可以有效缩短研发周期,降低研发成本。随着数据挖掘技术的兴起,利用机器学习技术提升药物筛选的效率与效果已经成为当前研究的重要问题。为此,本研究利用机器学习技术对药物筛选过程进行了优化,针对药物筛选过程中活性药物分子的发现和活性药物