论文部分内容阅读
随着大数据和各大社交网络应用的飞速发展,人们越来越乐于在Facebook、Twitter等社交媒体上分享自己的心情或发表对某件事物的看法,同时也会在各大电商平台上表达自己对某产品或服务的使用感受。高效准确的对此类带有情感倾向性的文本进行处理分析可以为商家和政府提供决策支持,因此,迫切需要针对这类文本开展情感分析研究。本文针对英文Twitter文本开展情感分析的研究,对于给定的Twitter文本判断其蕴含的情感极性是积极肯定的还是消极否定的或是持中立态度。本文设计并实现了一个多粒度情感增强词向量表示模型MEWE,该模型从单词粒度和句子粒度两个层级上嵌入语义情感信息,充分利用了远监督有标注的情感语料库和情感词典资源,最终学习得到既包含上下文语义关系又蕴含丰富情感信息的词向量表示。此外,为了将单词的情感语义扩展到句子中,本文引入了深度学习思想,提出了基于卷积神经网络和多特征融合的情感分类框架,将MEWE模型得到的情感增强词向量输入至本文构建的卷积神经网络模型中,通过深度的自适应学习以获取更深层次的文本隐含特征。在特征融合方面,考虑到手工特征对于情感极性判别有着很大的帮助,并且短文本容易受到其字数的限制且缺乏上下文语义环境,单纯使用词向量表示可能造成分类效果欠佳。因此,我们将CNNs模型生成的深度情感文本向量特征与本文设计的手工特征进行特征融合拼接,最终作为情感分类的特征。本文的情感分类器并没有直接采用CNNs模型中的Softmax回归,而是采用了 SVM分类模型。特别针对三分类问题而言,设计了 One-Versus-One SVM对积极、中性、消极三类文本进行一对一的模型训练和分类判别。为了验证本文方法的科学性,我们设计了多个情感分类实验:首先设计实验来验证本文提出的MEWE模型的有效性,通过近义词检测任务分析单词的语义相似性以及进行单词情感极性分类实验计算其分类的准确率从两个角度综合评价模型的表现效果。然后我们设计进行了句子级别的情感分类实验来验证本文提出基于卷积神经网络和多特征融合的情感分类方法的有效性,在SemEval评测的Twitter语料上进行了情感三分类以及情感二分类实验,并与已有的情感分类方法进行对比分析,证实本文方法的有效性。实验结果表明,本文提出的情感词向量以及基于卷积神经网络与多特征融合的情感分类方法能够有效的解决Twitter文本情感分类任务。