论文部分内容阅读
Web 2.0的出现促进了电子商务和微博的迅速发展。微博作为热门的web2.0应用,允许用户发表观点、获取信息和表达情感,越来越多的人通过微博发表对产品的看法,使微博产生了海量的包含情感的产品文本信息。微博平台上的产品评论是消费者对产品的好坏的一种情感表达,对这些信息进行情感分类研究,不仅有利于消费者根据评论做出好的购买决策,同时也能够使生产商及时获得用户对产品的购后评价,根据评价进行产品质量改善和营销策略调整,从而提高产品的受欢迎度。微博产品评论作为产品评论在互联网存在的一种新模式,融合了微博文本多主题、表达口语化和语言碎片化的特点,相对于传统文本,针对微博产品评论的情感分析将面临更多的挑战和困难。目前关于产品评论的情感分析的研究对象大部分集中在传统电商或产品论坛的评论文本上,针对微博产品评论的情感分析尚处于起步阶段,因此对微博产品评论进行情感分析,具有较高的理论价值和应用价值。论文以新浪微博产品评论为研究对象,使用情感词典和语义规则相结合的方法对微博产品评论进行情感分类,并在此基础上进行用户观点分析,实现理论研究和应用的结合,开展了以下的研究。一、根据微博的特点,构建了一种微博产品评论的情感分类方法。该方法分为四个部分:首先,根据微博文本口语化的特点,进行基于NLPIR汉语分词系统(ICTCLAS2013)的新词发现,并根据分词结果提取出评价新词集和评价对象新词集;其次,构建基于知网(Hownet)的基础情感词典,并融合评价新词集,以提高对情感词的识别率;再次,根据评价对象的词性特点,构建基于词性的评价搭配识别规则。该规则以情感词为中心,以评价对象的词性重要程度为顺序,以词语间的距离为衡量准则,来寻找识别评价搭配;最后,文本情感值。综合考虑程度副词和否定副词对文本修辞关系的影响,提出六种情感组合,并根据情感组合计算评论文本的情感值。实验结果表明该方法能有效提取评价搭配及进行微博情感分类。二、通过上述微博产品评论情感分类方法,对用户观点进行量化,并综合考虑了微博的转发数和评论数,构建用户观点分析指标,对用户的观点进行两个方面的分析:一是进行基于产品属性认可度的分析,通过图表展示用户对产品属性的评价情况,分析产品属性的优劣势;二是进行基于层次分析法的产品评价分析。利用层次分析法将影响产品评价的因素进行重要性的排序,计算出相关因素的权重,结合产品属性认可度,衡量产品的总体口碑情况。