基于饿了么在线评论文本的情感分类挖掘研究

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:fuyaomama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当前互联网技术的不断发展以及互联网在行业的全面覆盖,各类商业平台、媒体平台等积累的大量的文本数据。这些数据的收集与利用能够帮助人们更好地进行决策或商业发展。基于深度学习的情感分类方法与传统的情感分类算法不同,它能够从海量的数据中主动学习文本中的语义信息并获得文本的特征与情感分类,达到精准提取文本数据与情感的目的。目前,研究界对于文本情感分类研究已经成为自然语言处理领域中的重点课题。本文选取当前学界较少涉及的餐饮网络平台在线评论文本数据情感分类进行研究,以我国最具代表性的餐饮平台饿了么为例,运用深度学习相关理论与技术,采用文献研究法、实验分析法、对比分析法等,构建基于注意力机制的双向长短期记忆网络模型——ATT-Bi LSTM模型,并进行模型的对比研究。(1)通过对以往研究文献及深度学习相关理论与技术的介绍,对文本数据的处理技术进行了详细分析,包括文本预处理中的分词技术、词性标注、主流文本表示模型、文本特征权重表示等,引入词向量技术,介绍了Word2Vec词向量模型。(2)为使模型更多的关注文本中的关键信息,对注意力机制进行了说明,同时构建了基于注意力机制的LSTM模型进行文本情感分类任务,并应用于对饿了么在线评论文本的情感分类实验,对比LSTM、Bi-LSTM、ATT-Bi LSTM、SVM、KNN、Logistic六种模型的性能优劣。实验得出,ATT-Bi LSTM模型使得文本情感极性分类任务的准确率得到进一步的提升。(3)对比分析基于LDA主题分析与聚类分析对在线评论文本情感分类的作用。通过评论文本的聚类研究,对于餐饮用户评论主题特征和关键词有了清楚的认识。聚类的结果采取了比较形象化的可视化图像,清晰直观地表现了文本聚类的分布情况。对获取的饿了么平台在线评论文本数据分别进行基于LDA主题分析和K-Means聚类分析,验证了算法的有效性。
其他文献
目的探讨银杏达莫注射液联合血液透析对慢性肾衰竭(CRF)患者肾功能及血清炎症因子水平的影响。方法选取2016年5月至2019年5月驻马店市中心医院收治的200例CRF患者,按随机数表
阅读教学和写作教学是语文课程教学中的两项重要任务,是新课改以来一直强调的两部分。两者之间的密切联系,使得专家学者越来越重视以读促写、读写结合的教学。随着部编版教材在小学高年级的推广,以读促写得到进一步强化,但是在实际的教学中以读促写存在着各种各样的问题,并没有发挥其应有的价值。因此,深入研究小学高年段以读促写的教学现状显得尤为重要。本研究主要采用了文献法、调查法和观察法。笔者先是通过查阅文献资料了
目的探讨淋巴组织病变性质判断中组织形态学的价值。方法分析北京友谊医院病理科232例会诊病例:首先进行形态学观察并对病变性质作出初步诊断,结果分为恶性、交界性及良性;其
2020年12月4日至5日,由南京水利科学研究院与雅砻江流域水电开发有限公司联合组织的“禹龙号”大坝深水检测载人潜水器现场试验应用和专家咨询会在雅砻江锦屏一级水电站召开
社会进步在推动城市建设的同时,也促进了城市基础设施建设的进程。污水处理是城市重要的排泄系统,对于整个城市沿着健康、可持续方向建设,具有重要的推动价值。社会建设进程
[目的]该研究旨在为不伴低氧血症的吸烟的慢性阻塞性肺疾病患者进行认知功能、焦虑、抑郁评估和相应的脑功能分析,为COPD的全面管理和患者身心治疗提供客观依据,并为减轻疾病