论文部分内容阅读
互联网的快速发展,使得互联网成为了人们生活的重要方面。人们在网络上开展各种活动和生活娱乐,发表了大量的评论、留言等。这些评论和留言能够代表评论者的看法和观点、态度,通过对这些有价值的网络评论的研究,人们可以得到有关客户态度的相关信息,从而帮助一些对此信息感兴趣的群体,如企业者会对消费者对产品的态度感兴趣。于是人们对网络评论的情感分析工作产生了浓厚的兴趣。目前,在英文的情感分析方面,已经做了很多研究,并取得了很大的成果。反观中文情感挖掘方面,做的相关的研究少而且还比较零散。本文的贡献主要是一方面提出了更加适应中文环境的基于语义的PMI-IR模型B,并对情感挖掘误差进行了分析,找出了电影评论查准率较低的原因;另一方面是在模型B的基础上探讨建立了一个完整的对于网络电影评论进行情感倾向挖掘的模型。本文首先讲述的是论文研究背景和目前的英文和中文的情感挖掘分析的研究现状,然后通过对目前的英文的情感分析方法和中文情感分析方法的探讨,进而提出了新的PMI-IR模型B。通过对电影评论情感挖掘分析的实验,验证了模型B的可行性和先进性。然后在模型B和对网络电影评论特点进行分析的基础上,本文探讨建立了一个完整的对于网络电影评论情感挖掘模型,并应用优酷网的网络电影评论验证了模型的可行性。