论文部分内容阅读
随着时代的发展,对海量信息的有效和高效处理成为了现代社会必须解决的首要问题。在此种环境下所催生出的自然语言处理(NLP)技术就是面向文本信息的一个解决手段。情感分类、评价对象判别是NLP领域研究的热点。本文致力于实现更高效的能适用于情感分类和评价对象判别任务的深度学习模型,通过对传统的神经网络模型进行相应的改进,使得在相应的NLP问题上能够有更好的效果。本文主要包含两个研究内容:结合decoder结构的LSTM-CNN神经网络的情感分类模型:作为自然语言处理的一大研究方向的情感分类就是分析和评判一个语句它所包含的情感色彩。常用的这个情感倾向可以是简单的只有正向情感和负向情感,也可以是具体的多种情感,比如,难过,崩溃、喜悦、惊恐等。情感分类对于社会舆情反应以及产品的用户回馈都具有重大的意义。常见的长短期记忆神经网络(LSTM)模型用于情感分类时,往往需要更长时间的训练,而多层卷积神经网络(CNN)运用于情感分类时,很难学习到文本的上下文信息。本文所提出的模型充分利用多层LSTM-CNN网络,其中LSTM可以“记住”序列上下文信息,CNN通过卷积核的作用可以很好地学习文本的局部信息。该模型中的Encoder-Decoder框架由多层LSTM-CNN网络作为编码器,相应的反卷积层作为译码器,Encoder-Decoder的结构将使得整体的学习更加高效。最终实验结果表明此模型在情感分类的任务中具有优异的性能。基于注意力机制的评价对象判别(ABAE)弱监督模型:伴随着日益提高的分析需求以及日益多样化和复杂化的语言环境,更细粒度的情感分析成为了研究重点。ABAE模型是一种无监督的,有效运用于类别提取的模型,它将通常在同一上下文中的单词映射到向量空间中的邻近点。然后,使用注意机制在一个句子中过滤单词向量,并使用过滤后的单词构造类别向量。无监督的ABAE模型的问题在于需要人工判别主题分类的结果,这使得很难迅速有效的达到最优的结果。针对此问题,本文通过对少量的标注数据进行卡方检测运用,得到各个词与类别的相关性,从而避免了人为评判的步骤,极大地提高了该模型的有效性。在实际数据集上的实验结果表明,该方法可以达到和原来一样的最优效果,却不需要多次的人工判别试错,该方法使得该模型更具有实践性。