论文部分内容阅读
文本情感分析(Sentiment Anaysis),也称为观点挖掘(Opinion Mining),是指使用自然语言处理、文本挖掘以及计算机语言学等方法对带有情感色彩的主观性文本进行信息的分析、处理、归纳和推理的过程。常见的进行文本情感分析的方法有基于情感词典的方法、基于机器学习的方法和基于深度学习模型的方法;情感词典的构建需要耗费许多设计和先验知识,机器学习也依赖高质量的特征构造和选取,深度学习方法的优势就在于强大的抽象特征提取能力,然而,复杂的模型结构随之而来的是繁复的参数调节,针对深度学习尤其是神经网络中参数大小难以调节的问题,本文研究一种基于粒子群算法(Particle Swarm Optimization)的神经网络中文文本情感分类方法,主要的研究内容如下:1)由于不同语言间的特征差异,中文文本相对于英文文本在自然语言处理任务中更加复杂和困难,本文提出了一种基于粒子群优化的神经网络中文情感分类模型(PSO-Attention-LSTM),模型使用循环神经网络中的长短期记忆网络(Long Short Term Memory Network)叠加注意力机制(Attention Mechanism)对中文数据信息进行提取,判断句子的情感极性;针对LSTM单元的隐藏层神经元数量和神经网络的批处理数量等参数难以确定的问题,使用粒子群算法(PSO)的全局寻优能力对参数进行优化,最后,将提出的模型与其他基准模型进行了对比,实验结果证明,本文提出的PSO-Attention-LSTM模型在F1-score,AUC等评价指标上都有相对较好的表现,验证了该算法的准确率和有效性。2)基于PSO-Attention-LSTM模型的爱课程评论文本分析应用。为了解决对中国大学慕课爱课程网站的评论分析问题,使教学者和学习者获得教学反馈信息从而优化智能教学环境,使用PSO-Attention-LSTM模型对爱课程网站不同科目课程的评论信息进行了情感分类,通过实验验证了该算法对于中国大学慕课爱课程网站评论文本情感分类的有效性,在此基础上,给出了不同类别课程评论情感分析的可视化结果图,为师生提供了更为直观的课程评论信息,说明了PSO-Attention-LSTM模型在为爱课程在线教育平台的使用者提供教学反馈方面具有实际意义。