基于多特征融合的在线论坛用户心理健康自动评估

来源 :计算机学报 | 被引量 : 0次 | 上传用户:liongliong423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
心理健康问题对社会和谐和家庭幸福造成严重破坏,提前发现有心理健康问题的潜在患者,有利于及时辅导和治疗。人们利用互联网或社交网络交流沟通、表达情感和观点,这为心理健康的观察提供了新的窗口。提出基于多特征融合的在线论坛用户心理健康自动评估框架F3TMH,该框架采用贪婪法F3TMH_G、投票法F3TMH_V、后期融合法F3TMH_L和降噪自编码器法F3TMH_DA四种特征融合策略,融合帖子(或其作者)的行为与属性特征、语言或用词风格特征、内容特征(N-Grams特征、主题特征、词向量特征)、上下文特征,对论坛中帖子所反映的用户(心理康健状况)需要干预的紧急程度(crisis:非常紧急,red:紧急,amber:不紧急,green:不需要任何干预)进行自动评估。在CLPsych2017 shared task评测任务所提供的数据集上,考察了各类特征、不同的特征融合策略对心理健康自动评估性能的影响。实验发现,相对于行为与属性特征和语言特征,内容特征表现更好,其中基于Word2Vec的词向量特征表现最佳,其Non-green(crisis、red、amber三类)的F1均值达到0.429。尽管单独使用行为与属性特征表现不佳,但该特征对crisis类帖子的识别影响很大,在融合所有特征的基础上去掉该特征后会导致crisis类帖子的F1值下降19.7%。实验还显示,多种类型特征的融合较单一类型的特征表现更优,特征融合后Non-green的F1值(0.479)较单一最优特征(0.429)提高11.6%。各种特征融合策略各有优势,例如,后期融合策略F3TMH_L2更有利于识别心理健康危机程度较高的用户(crisis和red类帖子),Urgent的F1值达到0.608,而F3TMH_L则更有利于识别crisis类的帖子,自编码融合策略F3TMH_DA对于识别数据量相对较多的Flagged类(所有非green类的并集)帖子更有优势,其F1值达到0.872。最后还探讨了上下文信息对用户心理危机程度识别的影响。此外,F3TMH_V参加了CLPsych2017 shared task评测,在官方对参赛系统排名的评价指标Non-green F1上得分0.467,排名第一,优于采用深度学习等其它模型和特征的参赛系统。
其他文献
研究悬链线效应下锚固钢筋与混凝土之间的黏结破坏情况,以及在RC框架结构连续倒塌过程中黏结失效和钢筋拉断的先后顺序,分析锚固长度、钢筋布置方式对黏结锚固性能的影响,这
自2015年11月10日习近平总书记在主持召开的中央财经领导小组第十一次会议上提出"着力加强供给侧结构性改革"以来,经过一年多的实践,供给侧结构性改革在现实中取得了积极成效。
目的评价甲泼尼龙联合阿奇霉素治疗儿童支原体肺炎的效果。方法选取我院2018年1-9月收治的儿童支原体肺炎患儿106例作为研究对象。依据随机数表分组方式,将其分为对照组、考
随着社会主义经济的发展,生态文明建设也如火如荼地进行着。社会主义生态文明建设需要加强大学生生态文明教育,大学生思想政治教育的发展也需要生态文明教育的持续跟进。由于
近年来,随着新型传染病的不断增多,人类的健康受到了极大的挑战,据世界卫生组织统计,2013年中国因H7 N9禽流感死亡至少34人,我国目前急需高素质的预防医学应用型人才。随着新型传
现代化进程中的教育价值观变迁呈现了从以神为取向的教育到以人为取向的教育、从以人文为取向的教育到以科学为取向的教育、从以政治伦理为取向的教育到以经济为取向的教育、
基于大数据时代的背景下,网络技术得以广泛普及与应用,计算机网络安全防范受到人们的广泛关注。本文简述大数据概念,分析基于大数据时代的网络安全问题,重点探析基于大数据时
酸枣,又名棘子、野枣、山枣、葛针,主要分布在中国北方,尤其是西北、东北等地区。酸枣具有抗寒、耐旱、耐瘠薄、耐盐碱(pH 5.5~5.8)等特性,在山地、丘陵、平原、半沙化土地均
期刊
目前,随着信息时代的快速发展,大数据时代的到来,对社会经济、科技的发展,产生了极大的影响。大数据、云计算等新兴技术的出现和应用,驱动着整个大数据时代高速的发展着。大
目前,虽然社会犯罪率的不断下降,但盗窃类案件却时而发生.尤其是室内盗窃案的发生,往往出现在居民住宅或无人值守的办公室.为了有效地防止室内盗窃案件的发生,故设计了一款电