论文部分内容阅读
随着互联网电子商务的迅速发展,越来越多的用户选择通过电子商务网站购买自己想要的产品。绝大多数用户通过浏览其他消费者的网络评论来了解产品和服务的口碑,与此同时,生产者和销售者也能通过网络用户的反馈来改善和提高自己产品的竞争力。因此无论是对消费者,还是对商品厂商和销售者来说,产品评论都是极具价值的信息,评论挖掘成为了近年来研究的热点。该文的研究课题是基于方面的评论挖掘。基于方面的评论挖掘是评论挖掘的延伸,主要关注的方面有实体方面抽取和实体方面情感分析。该文对这两个方面的一些关键问题进行分析和探索。首先,该文使用了外部知识库实现产品特征词的聚类。在评论中往往会使用不同的特征词表达产品相同的方面,所以很有必要将这些不同的特征词进行聚类。人工标注的方法过于耗时而且无法实现领域迁移,全自动的方法噪声过多,该文提出了一种基于显式语义分析的半自动方法来克服这些问题。之后,该文提出了一种基于模糊集合的情感分析方法。基于字典的情感分析方法适用于通用的观点词,但是对于领域相关的观点词的分析存在问题。该文的方法是领域无关的,并且能够量化出表达情感的强度。最后,该文将情感强度分析方法应用于方面评分预测问题,比较了多种情感分析方法的优劣。