论文部分内容阅读
心理健康论坛是一个有着心理咨询专家维护的服务性质的在线社区,人们可以在那里匿名表达他们的心理健康问题并寻求心理咨询专家或者其他用户地帮助。在这样的论坛中经常存在正遭受着痛苦甚至随时会进行自我伤害的用户,心理咨询专家需要及时发现并回应这样的用户以防止他们进行自我伤害,但是论坛中每日发布的帖子数以千计,导致心理咨询专家难以及时找到这样的用户并及时回复,因此自动评估在线论坛用户的心理健康显得格外重要。本文针对CLPsych2017发布的在线论坛用户数据信息,从两个方面构建模型对论坛中帖子所反映的用户(心理健康状况)需要干预的紧急程度(crisis:非常紧急,red:紧急,amber:不紧急,green:不需要任何干预)进行自动评估:(1)基于多特征融合的在线论坛用户心理健康自动评估框架F3TMH。该框架采用贪婪法F3TMHG、投票法F3TMHV、后期融合法F3TMHL和降噪自编码器法F3TMHDA四种特征融合策略,融合帖子(或其作者)的行为与属性特征、语言或用词风格特征、内容特征(N-Grams特征、主题特征、词向量特征)、上下文特征来构建自动评估模型。实验发现,相较于其他特征,词向量特征在自动评估在线论坛用户心理健康危机程度的问题上表现更好;后期融合策略F3TMHL2更有利于识别心理健康危机程度较高的用户(crisis和red类帖子),自编码融合策略对于识别数据量相对较多的Flagged类(所有非green类的并集)帖子更有优势。(2)心理学知识指导下的心理健康自动评估CNN模型。提出基于心理学知识LIWC词典的卷积神经网络模型LIWC-CNN,挖掘LIWC词典在不同类别帖子中的词频的统计特征,并据此来指导卷积神经网络来提取更有利于识别需要干预的帖子(crisis和red)。实验结果显示,与其他方法相比,本文使用的方法在牺牲green类帖子(不需要干预)识别准确率的代价下,能够提高对于crisis和red类帖子(需要紧急干预)的识别效果,体现出心理学知识在深度学习特征提取过程中的指导作用。