论文部分内容阅读
随着互联网电商平台的不断发展,网络购物逐渐成为越来越多网民的购物方式。与此同时,网络上针对产品的大量评论也随之涌现,这些评论既成为了网民购物时的参考,也为厂商了解用户反馈提供了便利的条件。不过,大规模的评论无法全部进行人工审阅,导致用户和厂商无法全面了解一款产品的大众评价。受益于计算机处理能力的增长和大数据时代的来临,自然语言处理技术作为人工智能重要的研究与应用领域,已经在诸多领域发挥了不可替代的作用。计算机拥有处理大规模数据的能力,同时成本低、效率高,如果计算机能够自动帮助用户和厂商分析产品评论中用户所表达的态度,将节省大量的人力物力。文本情感分析是自然语言领域中非常重要的研究方向之一。文本情感分析算法能够自动从篇章或句子中分析出用户的态度,比如支持、反对、或是中性;甚至能够分析出用户的情绪,比如喜悦、悲伤、惊奇等。但是,篇章级别与句子级别的情感分析通常无法找到用户所表达的态度的对象。在对产品评论的分析中,我们不仅对用户的态度感兴趣,更想了解用户对产品的哪一方面表达出了肯定或不满的态度。细粒度情感分析则能够很好地解决这个问题,找出用户评论中的评价对象与评价词、并确定它们之间的搭配关系是细粒度情感分析最重要的步骤。本文首先探究了基于循环神经网络的序列标注方法。这一方法将评价对象和评价词的提取工作看作是序列标注任务,通过对句子中每一个词语打标签的方式,确定哪些词语是评价对象,哪些词语是评价词。此外,还需要确定评价对象与评价词之间的搭配关系。本文使用了两种关系分类的方法,分别为基于句法与语义信息核函数的分类方法和基于融合句法关系的神经网络的分类方法。这两种方法均与句法关系相结合,充分利用词与词之间的句法关系,确定出两个词之间是否为正确的搭配关系,进而对评价对象和评价词进行抽取。实验结果表明,三种算法在各自的任务上均非常有效。在词语抽取的任务上,基于循环神经网络的序列标注方法要优于基于规则的词语抽取算法。在搭配关系抽取的任务上,融合了句法结构信息的模型的性能得到了明显的提高,说明了句法结构在关系分类任务上的有效性。同时,基于卷积神经网络与递归神经网络的混合模型能够更好地对句子的语义信息进行建模,性能更加突出。