论文部分内容阅读
心理疾病是快节奏的现代生活中不容忽视的问题。通过网络渠道倾诉心理问题,获取专业医护人员的意见,既方便又顾及用户隐私,因此互联网医疗服务平台积累了的大量社会心理学文本。挖掘文本中的情感语意信息,识别文本潜在的情绪类别或者对其进行情感空间中的维度值预测,能够获得精细的情感信息,将情感分析技术应用于社会心理学文本的研究意义重大。本文研究心理疾病领域文本的情感分析,探讨了这类文本的情感标签识别和情感强度预测的问题。具体包括三个部分:第一部分,提出使用深度学习模型预测多标签心理疾病文本情感标签。首先,使用问题转化法将多标签问题转化成多个单标签问题;其次,本文考虑了三种类别的修饰词否定词、程度副词和虚词,其中否定词用于扭转结构中情感词的语义极性、程度词则增强或者减弱情绪词的正或负程度、虚词减弱情绪强度。提出两种修饰结构:修饰结构1--单一修饰词或者修饰词的组合;修饰结构2--修饰结构1和情感词的组合。最后,针对修饰结构搭建多尺度CNN模型,通过不同尺度的卷积核提取修饰结构特征,分析其对多标签预测的影响。第二部分,提出使用深度学习模型预测文本的Valence-Arousal情绪强度值。首先,对忧郁症这一种心理疾病类别的文本,标记文本Valence-Arousal两个维度的情感值标签;接着,同样针对修饰结构的特点搭建多尺度CNN与LSTM的结合模型CNN-LSTM,前者通过不同尺度的卷积核提取修饰结构的特征,后者提取特征之间的顺序关系,以此研究修饰结构对文本情绪强度预测的影响。为了验证本文提出的文本多标签情感预测和Valence-Arousal情绪强度值的预测模型的有效性,本文进行了大量的实验。使用本文提出的模型,分别在含有修饰结构1的数据集、含有修饰结构2的数据集和原始数据集这样三份数据集上进行试验,与不考虑修饰结构的深度学习模型进行对比实验。实验证明:相比未考虑修饰结构的模型,使用本文提出的模型对在三份数据集的预测结果评估指标,都有提高;含有修饰结构1的数据集上提高幅度大于原数据集上的提高幅度;含有修饰结构2的数据集上提高幅度大于含有修饰结构1的数据集。第三部分,将本文提出的模型运用于构建“疾病问诊系统”,系统运用模型实现推送用户问诊问题描述的答案、用户文本情绪值的预测等功能。借助本系统,能够判断用户的情绪类别和情绪强度,为心理医生后续的诊疗提供帮助。