论文部分内容阅读
随着目前互联网行业的日益快速发展,越来越多的人们热衷于在网上发表评论,通过这种方式来对某个事物或事件表达自身的看法和观点。比如,在电子商务领域中的产品交易中就蕴含了大量这样的观点评论,从消费者的角度来讲,消费者可以通过发表对某个产品的评论来表达自身的喜好程度,同时又可以利用某个产品以往的评论信息作为决策参考;从生产者和商家的角度来讲,他们可以通过这些评论反馈来及时改进产品生产和改善销售决策,以满足消费者的需求。当前针对评论的情感分析研究是文本挖掘、自然语言处理等相关领域的研究热点,具有很强的应用价值。然而,目前针对产品领域的情感分析研究出现了诸多亟待解决的问题,一方面,传统的产品评论情感分析基本上都是基于篇章或句子级的粗粒度研究,很少涉及到更细粒度的,以词语或短语为单位的情感分析研究;另一方面,随着各类新增产品的出现,在评论情感分析研究中领域性问题越发突出,往往在一个领域中训练出来的分类模型不能直接用于其他领域,以至于每个领域都需要大量人工标注训练数据集,耗费巨大的人力、物力和时间。针对以上出现的两个问题,本文主要进行了以下几个方面的研究。(1)研究了一种面向产品评论的细粒度情感倾向性分析方法。通过将条件随机场理论同评价对象属性与其评价词之间的类别关系相结合,构建了一套序列化共同识别抽取模型,另外特别针对语义角色特征识别抽取工作进行了详细分析和算法设计,最终提出了一种对产品评价对象属性及其评价词共同识别抽取的方法。(2)研究设计了一套面向产品评论的细粒度情感分析系统。为了将细粒度情感分析研究技术切实应用到到实际环境当中,本文利用在(1)中所提出的方法构建了一套针对净化器产品评论的细粒度情感分析系统。(3)对面向产品评论的跨领域情感分析技术进行了初步探索和相关研究。针对当前评论情感分析研究中突显的领域性问题,本文主要对在跨领域情感分析中不同产品领域间存在的差异性和关联性进行了验证以及研究了特征的选取对跨领域情感分类效果的影响。