【摘 要】
:
为了解决国内家庭经济困难学生的就学问题,政府非常重视对助学金的发放工作,通过国家政策、学校组织和学生监管贯彻落实对贫困生的精准补助。然而,由于体系不完整和监管力度不足的原因,使助学金的有效发放受到很多阻碍。科学技术发展使得学校可以通过大数据手段有效评估学生信息,从而有效辅助助学金的精准发放工作。在此背景下,本文对学生在校多源数据进行分析处理,基于深度森林算法构建了学生助学金发放预测模型。本文的主要
论文部分内容阅读
为了解决国内家庭经济困难学生的就学问题,政府非常重视对助学金的发放工作,通过国家政策、学校组织和学生监管贯彻落实对贫困生的精准补助。然而,由于体系不完整和监管力度不足的原因,使助学金的有效发放受到很多阻碍。科学技术发展使得学校可以通过大数据手段有效评估学生信息,从而有效辅助助学金的精准发放工作。在此背景下,本文对学生在校多源数据进行分析处理,基于深度森林算法构建了学生助学金发放预测模型。本文的主要工作如下:(1)根据获取到的学生在校多源信息数据进行分析,利用数据预处理、特征构建以及基于相关分析的特征选择来保证数据的科学有效性。利用多视图信息融合方式,将学生在校多维度的数据通过两种方式划分为两个不同的视图,使用典型相关分析(CCA)对两个视图进行融合,强化属性间的关系。(2)改进gcForest算法对于类不平衡数据的处理方式,使用了SMOTE算法、C_SMOTE算法和增加类别权重这三种方式对数据进行处理,提出了将处理类不平衡方法融合到gcForest算法框架之中,并为此搭建了SMOTE+gcForest、C_SMOTE+gcForest和weight+gcForest助学金发放预测模型。(3)改进gcForest算法对于特征向量的重组方式,以及级联森林中每个森林类向量的生成方式。提出了将向量的相似度计算和进行k折交叉验证时每次的模型性能计算添加到gcForest算法中的CW_gcForest算法,并基于该算法构建了C_SMOTE+CW_gcForest模型进行助学金发放的预测。最终对比实验结果表明,本文提出的算法模型在学生在校信息数据集上性能获得了一定的提高,验证了考虑属性间关系的必要性以及本文提出的CW_gcForest算法的有效性以及C_SMOTE+CW_gcForest模型对助学金发放预测的有效性。本文提出的算法模型可以为助学金的精准发放提供切实可行的依据。
其他文献
“两会”报道作为我国具有代表性的重大主题新闻报道,关乎着新时代条件下媒体对党的路线、方针和政策的宣传引导,也关系着媒体能否拉近同新闻用户之间的距离,实现与用户的良性互动。数据新闻的可视化便为“两会”重大主题新闻报道提供了一种新的发展思路。本文在扎实梳理文献的基础上从数据新闻可视化的基本理论入手,区分相关概念,解释数据新闻可视化的定义,厘清数据新闻可视化的类型,阐述重大主题数据新闻可视化的生产流程。
美是人类永恒的追求,随着社会经济发展,生活水平提高,人们更加注重精神享受,对艺术和美的需求也体现在生活的方方面面,生活美学应运而生,它强调审美平民化以及艺术生活化,其研究对象就是活生生的生活。对于生活美学的体现与传播,短视频作为新型的艺术载体,无疑发挥了重要作用。据中国互联网络信息中心(CNNIC)最新发布的第47次《中国互联网络发展状况统计报告》显示,截至2020年12月,我国短视频用户规模为8
人脸信息被用于各种验证场所,主要是因为相比于其他认证手段,人脸信息具有唯一性、实时性和难伪造性。跟机场、火车站等一些大型场所相比,住宅小区的住户容量较小,住户信息较稳定,可以更充分发挥人脸识别技术的优势。本文设计了一种基于卷积神经网络的人脸识别门禁系统,实现无接触、快速的门禁检测。本文主要对人脸检测、活体检测、人脸特征提取和对比等方面进行了学习与研究。采用核相关滤波算法(Kernel Correl
奶牛采食行为是奶牛活动的关键行为之一,反映奶牛的健康状态与饲喂情况等。传统人工的观测只针对个人牧场,而规模化牧场只依靠人工成本较高。近几年来,随着数字化技术与人工智能的不断发展,可穿戴设备运用在了各个领域中。畜牧业中运用该方法可降低人工与资金成本,增加效率,减小损失。基于此,本文提出了一种基于活动量数据与深度学习的方法对奶牛采食行为进行识别研究,通过采集活动量数据加以分析处理并运用深度学习等算法模
在信息爆炸的当下,挖掘有效信息成为巨大挑战,新闻媒体正是大众获取信息的重要渠道之一。而新闻文本分类、倾向性分析可适用于新闻线索收集、舆情监控、决策辅助、有害信息过滤、运营分析、专题分析及新闻推送等领域,能够有效帮助用户快速、准确地获取所需信息,帮助新闻媒体在茫茫数据中分析出规律和关联项,达到便捷快速处理新闻的目的。文本分类及情感倾向性分析目前在国内外研究较多,发展相对成熟,但是蒙古文相关研究的起步
随着社会媒体的发展,越来越多的用户通过微博来表达情感。因此,对微博中的情感进行挖掘有很大的应用价值。近年来,深度学习的技术在自然语言处理领域中取得了广泛的应用。所以本文将基于深度学习对蒙古文微博情感分析进行研究,具体工作内容总结如下:(1)由于蒙古文语料匮乏,本文构建了蒙古文微博情感分析语料库,选用NLPCC2014部分中文语料作为原始语料。由于原始语料包含大量噪音,需要对原始语料预处理。将清洗后
近年来,随着科技的发展,无人机技术的应用领域越来越广泛。无人机具有低成本、较强的移动性以及可以快速灵活地部署等众多特点。这些特点使得使用无人机辅助传感器网络完成环境监测数据收集任务成为了可能。使用无人机作为数据收集节点,可以拓宽节点的空间移动范围,更加适合复杂环境中的传感器网络数据收集任务。本文将传感器网络数据收集任务划分为单跳传输场景和多跳传输场景。在单跳传输场景中,初始状态下使用K-Means
场景文本的检测与识别是目前计算机视觉领域比较热门的研究内容,用于定位场景文本中的文本区域并识别其字符序列。场景文本中往往包含很多丰富的文本信息,这些信息可以帮助我们认知场景。场景文本的检测与识别可以被应用到很多领域,如无人驾驶、智能交通、即时翻译和视觉搜索等。虽然传统的印刷文本检测与识别技术已经较为成熟,但场景文本的检测与识别还存在很多难点,例如背景复杂、文本形式多变、文本图像透视曲率失真等。本文
随着近些年移动互联网技术的快速发展和智能手机用户群体数量的不断增长,出现了多种多样基于智能手机传感器的应用,这些应用已经融入到人们日常生活和工作的各个领域,给人们的生活带来了极大的便利。这些应用的实现离不开行为识别技术的研究,目前基于手机传感器的用户行为识别研究主要存在以下两个问题:一、大多数研究工作是基于单传感器即加速度传感器进行行为识别,没有充分利用智能手机内置的其他传感器进行融合识别;二、一
随着人文交流日益密切,双语或多种语言混合表示成为了一种常见的语言现象。在国际上,汉英、英德、英法等混合语言运用越来越普遍。在国内,维汉、藏汉、蒙汉等混合语言现象也越来越多。所以多种语言混合语音识别成为了语音识别研究领域中的一个热门课题。虽然汉语、蒙古语、英语等单语言语音识别系统已经达到了使用要求,并且汉英混合语音识别研究也较为成熟,但基于蒙汉混合语语音识别研究仍处于起步阶段。因此,本文结合蒙古语和