论文部分内容阅读
随着当前互联网技术的不断发展以及互联网在行业的全面覆盖,各类商业平台、媒体平台等积累的大量的文本数据。这些数据的收集与利用能够帮助人们更好地进行决策或商业发展。基于深度学习的情感分类方法与传统的情感分类算法不同,它能够从海量的数据中主动学习文本中的语义信息并获得文本的特征与情感分类,达到精准提取文本数据与情感的目的。目前,研究界对于文本情感分类研究已经成为自然语言处理领域中的重点课题。本文选取当前学界较少涉及的餐饮网络平台在线评论文本数据情感分类进行研究,以我国最具代表性的餐饮平台饿了么为例,运用深度学习相关理论与技术,采用文献研究法、实验分析法、对比分析法等,构建基于注意力机制的双向长短期记忆网络模型——ATT-Bi LSTM模型,并进行模型的对比研究。(1)通过对以往研究文献及深度学习相关理论与技术的介绍,对文本数据的处理技术进行了详细分析,包括文本预处理中的分词技术、词性标注、主流文本表示模型、文本特征权重表示等,引入词向量技术,介绍了Word2Vec词向量模型。(2)为使模型更多的关注文本中的关键信息,对注意力机制进行了说明,同时构建了基于注意力机制的LSTM模型进行文本情感分类任务,并应用于对饿了么在线评论文本的情感分类实验,对比LSTM、Bi-LSTM、ATT-Bi LSTM、SVM、KNN、Logistic六种模型的性能优劣。实验得出,ATT-Bi LSTM模型使得文本情感极性分类任务的准确率得到进一步的提升。(3)对比分析基于LDA主题分析与聚类分析对在线评论文本情感分类的作用。通过评论文本的聚类研究,对于餐饮用户评论主题特征和关键词有了清楚的认识。聚类的结果采取了比较形象化的可视化图像,清晰直观地表现了文本聚类的分布情况。对获取的饿了么平台在线评论文本数据分别进行基于LDA主题分析和K-Means聚类分析,验证了算法的有效性。