论文部分内容阅读
随着电子商务的不断发展,从在线评论中分析出用户对产品和产品属性的情感,对生产者和消费者都有重要的意义。面对大量的评论数据,有必要自动地从评论中提取关注的信息。基于特征的情感分析可以识别出实体不同特征所对应的情感,因此常常被用于挖掘在线评论中的特征和情感信息。为了有效的获取评论中产品的特征以及针对特征的情感,通常需要提取相关特征;识别相应的特征词和情感词;划分情感倾向。为了获得细粒度的情感分析结果,还需要区分特征词和情感词的粒度。近年来,相关研究者提出了许多基于特征的情感分析方法来处理上述的某些任务,但当前的研究工作并未兼顾这四个任务,无法利用每一个任务中获得的信息改进其它任务的结果,进行细粒度的情感分析。本论文围绕产品评论的细粒度情感分析,研究了基于特征的细粒度情感分析方法,主要贡献如下:(1)总结了基于特征的细粒度情感分析需要处理的关键任务,提出了区分单词粒度并识别特征词和情感词的方法,该方法可以用于获得细粒度的情感分析结果。(2)提出了一个基于特征的情感分析方法JABST(Joint Aspect-Based Sentiment Topic)模型。通过扩展主题模型,JABST模型可以同时处理细粒度情感分析的任务。JABST模型不仅可以提取特征,识别特征词和情感词,进行情感分析,还能提取出细粒度的特征词以及情感词。(3)利用最大熵分类器,提出了JABST模型的扩展MaxEnt-JABST模型。MaxEnt-JABST模型是一个半监督的细粒度情感分析模型,可以更好地区分特征词和情感词。本论文分别使用关于电子产品和餐厅的在线评论的数据集,定性地和定量地评估了JABST和MaxEnt-JABST两个模型的分析结果。实验表明,JABST模型和MaxEnt-JABST模型不仅改进了现有方法的情感分析结果,还能够识别出更细粒度的特征与情感。