论文部分内容阅读
微博作为Web2.0众多的应用之一,其用户基数巨大,自身信息生态系统比较成熟,微博用户每天能够创作数以亿计的微博信息,因此在意见挖掘和舆情分析领域能够提供丰富的数据来源。微博中包含微博文本、表情符号、图片以及链接等元素,在以往的微博情感分析中大多以微博文本的情感倾向作为微博整体的情感倾向,忽略了微博中的其他元素。表情符号作为在微博中与微博文本同样重要的情感元素,在微博用户创作微博时被广泛使用,以协助因字数限制规则而无法尽意表达的微博文本,因此应当重视其情感倾向,以及当表情符号与微博文本并列时,表情符号对微博文本的情感倾向产生的影响。本研究首先对以往的相关研究进行文献综述,分别明确微博文本情感分析与表情符号情感表达,以及表情符号对微博文本情感分析影响的研究现状;然后说明表情符号对微博文本情感倾向产生的影响类型,包括强化与弱化影响;接着针对表情符号不存在客观情感值的现状,通过对并列表情符号的微博文本进行文本情感分析计算出其情感值,借助数学模型以文本共现的思想计算出表情符号的情感值,再将表情符号及其情感值组成表情符号情感值集合;最后将表情符号的情感值同并列表情符号的微博文本情感值进行比较,判定产生的影响,并对其进行分析评价。结果证明表情符号的确对微博文本情感倾向产生了影响,在未来的微博情感分析中需要考虑这些影响,以提升微博情感分析的准确率。