论文部分内容阅读
在信息高速发展的今天,社交媒体变得越来越重要,其中博客已经成为众所周知的载体,而进两年兴起的微博更是在社交媒体中占有主流的地位。相应的,有关博客与微博客的研究也日益增多,研究者们研究他们的分类状况,在微博上研究主题分析,热点事件发现等等。情感计算是近些年兴起的新的研究领域,随着研究的发展,研究者们已经从最初的计算词级,句子级,篇章级的情感,逐渐演变到了利用情感计算来辅助其他的工作,例如分类,预测大选,抽取属性等等。本文主要利用词的情感标签来辅助进行社交文本的分析,在博客和微博平台,利用情感标签,提出了三种模型以用来解决分类及主题分析问题。1)本文利用情感标签的特点,采用LDA模型,将博客中的情感词,表示为特定的情感主题。利用男性和女性作者在情感主题上的不同,对情感主题进行筛选,并利用筛选过的主题来帮助对博客写手进行性别的分类,取得了理想的效果。2)本文收集了日本地震期间的微博。将微博中的情感词变化为对应的情感标签,利用情感标签与之对应的名词简历二部图。在二部图上采用H1TS算法,同时考虑名词对应的词频信息,得到关于日本地震期间7天的主题词,并对每个主题词下的微博进行情感的分类,得到民众在该主题词下的情感。3)本文采用情感特征预测新浪微博上话题的持续时间。本文在已有的倾向性研究的基础上,提出了对抗性情感及一般性情感建模的方法,旨在描述情感的影响性。实验结果表明,在加入情感特征时,模型能更准确的预测话题的持续时间,而一般性情感建模的方法比对抗性的方法更能准确的描述情感的影响,同时对于话题的持续时间,负向情感的作用要远远大于正向情感的作用。综上所述,情感标签可以在分类,主题分析,预测中提供积极有效的帮助,情感特征可以作为一种补充的特征应用在更多的领域中。