论文部分内容阅读
新冠肺炎的大面积爆发使其迅速上升成为全球备受关注的公共卫生事件。伴随着病毒的蔓延,公众的负面情绪也随之加剧,大学生作为特殊的社会群体,更体现出较大的情绪波动。如何及时发现和量化评估疫情对大学生心理的影响程度,针对性地进行大学生情绪疏导,是当前疫情防控背景下高校学生心理健康管理工作的重点和难点之一。本文针对疫情防控背景下大学生心理健康问题,基于大数据驱动下的非结构化场景,利用疫情期间大学生疫情风险感知和心理测评系统收集到的数据,采用机器学习和粗糙集相结合的方法,对大学生焦虑情绪分类分析和识别方法进行探索研究。主要工作包括:(1)疫情影响下大学生负面情绪与疫情严重程度的动态关系分析。构建病死率与大学生三种负面情绪焦虑、烦躁、恐惧之间的双变量向量自回归模型(VAR),并通过ADF单位根检验、AR根检验、Granger因果关系分析、广义脉冲响应分析和方差分解分析,探究新冠肺炎疫情严重程度对大学生负面情绪状态的影响机制。结果表明:焦虑、烦躁、恐惧三种情绪虽受个体本身及其他因素的影响,但所构成的整个变量系统稳定。病死率是焦虑、烦躁以及恐惧的Granger原因,即疫情的严重程度直接影响大学生三种负面情绪。广义脉冲响应函数分析和方差分解分析得出,焦虑是当前疫情影响下的大学生主要负面情绪,在疫情爆发中期处于极大值且后期持续存在;烦躁在疫情爆发初期迅速增加,后期趋于平缓;疫情的加重对大学生烦躁情绪短期内有刺激作用。(2)基于双论域模糊粗糙集的大学生群体焦虑分类模型研究。针对大学生焦虑分类中的不确定性问题,采用双论域模糊粗糙集的方法,构建大学生群体焦虑分类模型,实现不同大学生群体的焦虑情绪分类。双论域的一个论域为疫情爆发时,按照所处区域划分的五个群体,分别为农村大学生、乡镇大学生、县城大学生、地级城市大学生、省会城市或直辖市大学生。双论域的另一个论域为,对影响大学生焦虑情绪的一般性指标进行相关性分析得到的七种主要影响指标。结果表明:随着置信度水平的增加,决策结果更加具体、准确。当决策精度为65%时,决策对象数为1,身处省会城市或直辖市大学生群体最焦虑。(3)基于三支决策和XGBoost的个体焦虑分类模型研究。为了实现大学生个体焦虑情绪分类,在XGBoost算法的基础上,引入三支决策的思想,提出TwdXGBoost个体焦虑情绪分类模型。该模型运用SMOTE算法解决正负样本不平衡问题,采用XGBoost算法输出二分类概率值,利用代价矩阵计算划分的阈值,通过阈值与概率值之间的大小关系,对大学生焦虑情绪进行三分类。结果表明,XGBoost单模型的准确度为80.45%,平均分类成本为3.7943,Twd-XGBoost的准确度为85.57%,相比单模型提高5.12%,平均分类成本为3.0366,相比单模型降低0.7537。(4)基于Stacking集成学习的个体焦虑分类融合模型研究。由于单分类算法存在一定缺陷,且精确度提升难度较高。因此,本章从集成学习“博采众长”的角度出发,构建基于Stacking集成学习的个体焦虑分类融合模型,进一步提升分类精确度。根据集成学习的思想,通过5个单分类算法的分类效果比对,选择RF、Ada Boost、GBDT和XGBoost作为基分类器,SVM作为元学习器,训练过程中采用5折交叉验证,二分类结果概率值输出之后,再将元学习器的二分类结果结合三支决策的成本矩阵,实现大学生个体焦虑的三分类。结果表明,融合模型的平均准确度为94.54%,较Twd-XGBoost提高了8.95%,平均分类成本降为2.8019。