【摘 要】
:
随着信息技术的不断发展和基础设施的不断完善,大数据技术已广泛应用于各个行业,比如医疗、教育、餐饮、物流、汽车、金融和娱乐等行业,给人们的生活带来诸多便利。在大学,随着管理手段信息化的不断深入,产生了大量的数据,其中,大学生日常生活和学习行为所累积的数据引起了高校管理人员的高度重视,也成为广大研究者的研究对象。通过对这些数据进行处理和分析,则可以获得学生的行为特征和规律,为学生管理者更好地管理学生提
论文部分内容阅读
随着信息技术的不断发展和基础设施的不断完善,大数据技术已广泛应用于各个行业,比如医疗、教育、餐饮、物流、汽车、金融和娱乐等行业,给人们的生活带来诸多便利。在大学,随着管理手段信息化的不断深入,产生了大量的数据,其中,大学生日常生活和学习行为所累积的数据引起了高校管理人员的高度重视,也成为广大研究者的研究对象。通过对这些数据进行处理和分析,则可以获得学生的行为特征和规律,为学生管理者更好地管理学生提供参考。本文基于兰州理工大学的学生数据,其中包含学生的书籍借阅、校园卡消费、两学年的成绩和学生专业记录等数据,作为要调查的数据源。使用RapidMiner数据架构框架,可以预处理数据集并集成不同的数据源以获得一组数据以进行分析。进行的主要工作如下:(1)利用FP—growth算法来挖掘学生的学习成绩、借阅的书籍数量、不同专业与校园卡消费之间的相关关系,来预测学生行为。还使用Python Pandas软件包进行了统计分析,以确保数据平衡以及检测和处理任何异常值。(2)通过使用K-means算法对学生数据进行聚类,根据聚类结果挖掘不同学生的学业成绩、图书借阅数据与校园卡消费数据之间的关系,以及不同学生之间存在的行为差异。肘法用于确定K-means的最佳簇数。(3)为了预测下一年的学生表现,朴素贝叶斯(Naive Bayes,NB)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和神经网络(Neural Networks,NN)进行参数调优来提高算法性能。为了防止模型过度拟合,应用了十折交叉验证技术将数据集分为训练数据集和测试数据的数据集。此外,在这项研究中,通过结合支持向量机(SVM),随机森林(RF),朴素贝叶斯(NB)和神经网络(NN)的特征,提出了一个综合分类模型,以根据学生的行为来预测他们的表现。该模型的关键部分是具有类别交叉熵损失函数的SoftMax函数,该函数构成了神经网络第三层的一部分。而且,用于调整班级标签的班级权重。(4)最后,使用各种评估指标评估每个模型的性能。经实验证明,本文所提出的模型表现最佳,ROC曲线的微观平均值为92%,宏观平均值为86%。随机森林(RF)算法的准确率值为75%,支持向量机(SVM)为76%,朴素贝叶斯(NB)具有74%的准确率,神经网络(NN)的准确率为78%,而本文模型的准确率为85%,所提出的分类算法能够正确地对各专业的学生表现进行分类,优于传统算法。
其他文献
2012年起,无论是中央一号文件,还是国家重要文件都一再强调大力培育新型职业农民,不仅体现出国家和政府对新型职业农民培育的重视,也直接反映出新型职业农民对农业现代化的发展起着至关重要的作用。做好新型职业农民的培育保障工作,才能更好地促进农村的持续发展,缩小城镇差距,促进职业教育公平,推进农业现代化进程。吉林省作为农业大省,2012年被国家选作新型职业农民培育试点地,2014年全省正式开始实施新型职
从中外翻译理论引出理解与表达是思维和再加工过程的统一这一看法。然后从词、定语从句和长难句的翻译三个角度论述了理解与表达在商务英语翻译中的重要性。
随着博物馆数字化在全球范围内的发展,绘画作品的智能分析变得越来越重要,而对绘画作品作者的自动识别又是推进其数字化进程的关键环节。近年来,以卷积神经网络为代表的深度学习在图像处理领域取得了不错成绩,为该问题的解决提供了有效途径。在详细分析国内外相关研究的基础上,通过迁移学习、改进的密连接网络、多任务学习以及数据集的增强处理等技术,建立了一种多任务深浅层融合密连接神经网络模型并将它应用于解决绘画作品作
随着冻土区的资源开发、工程建设及核废料的储存等,过量重金属元素将通过物质循环与能量流动进入到冷生土壤圈中,进而通过物质迁移转化进入水圈、生物圈、大气圈等其他圈层,对脆弱而敏感的冻土生态环境产生深刻影响。土体冻融过程中,盐、有害的化学物质、重金属元素等在冻土或冰中的迁移是近年来研究的热点问题,而冻结温度和未冻水含量是研究冻土中溶质迁移的重要因素。由于未冻水含量改变了冻土的水力特性和热参数,进而影响重
目的:恶性黑色素瘤(Malignant Melanoma,MM)是一种高度恶性肿瘤,好发于皮肤,我国与东亚地区发生于口腔黏膜者也不少见。有转移率高、预后较差的特点,早期可经血液转移和淋巴转移,且发病率呈逐年上升的趋势。随着肿瘤分子免疫学的快速发展,人们逐渐认识到黑色素瘤的发生、发展与患者机体的免疫功能密切相关,黑色素瘤患者体内可形成复杂而异质性的肿瘤微环境,导致肿瘤细胞滋长。针对黑色素瘤的免疫逃逸
图像拼接技术作为计算机视觉图像处理技术的一种,近年来开始应用于海底探测领域。图像拼接就是将多张有重叠部分的图像重新合成并融合起来,整合成一张广角度,大范围的全景图像。本文主要面对水下图像进行图像拼接,水下图像偏色严重,噪声较多,对比度很低,所以水下图像预处理对后续图像配准的准确度有极大影响。根据水下环境特性和成像特点,本文提出了一种多尺度图像融合算法对水下图像进行预处理,同时提出了一种改进SIFT
自二程讲学伊洛之间,宋代道学的洛学一脉逐渐形成。到南宋时,洛学经程门弟子谢良佐的传播与胡安国、胡宏父子的接续而逐渐形成湖湘一脉。湖湘一脉以胡宏心性对言的已发未发说为宗旨,经过其弟子张栻的传承而在南宋乾道淳熙年间成为一时显学。朱熹在屡求未发之旨不得后向张栻求教湖湘学的已发未发说,二人因此结为毕生论学挚友。张栻在与朱熹论学的过程中对胡宏的学说或继承、或质疑,逐渐开启了自身理学体系建构的过程。本文聚焦于
长期以来.我们党始终高度重视反腐倡廉建设并采取了许多重大举措。特别是近年来,中央把廉洁文化建设纳入了全党工作重点,推动了反腐倡廉工作深入开展。作为一个企业,抓好反腐
由于现代科技的高速发展,能源和环境的问题日益突出,这就要求电池的性能有进一步提高。锂离子电池有着工作电压高、能量密度大、循环寿命长、自放电小、无记忆效应以及绿色环
智能手机已经成为重要的情报源,每天都产生、存储、传播大量的图像、音视频等信息。智能手机获取、存储、编辑、传播音视频文件的便利性不断提高,既满足了人们日常的需要,也使得犯罪分子得以利用手机进行不法音视频(包含恐怖主义、色情、虐待等)的拍摄、编辑和传播。公安机关在侦破案件时需要借助图像成像设备源鉴别技术,从而对图像来源予以确定,以厘清侦查思路,确定侦破方向。当前大部分图像成像设备源鉴别技术是基于光照响