餐饮评论的文本情感分析研究及应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:caressliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网的高速发展,人们的生活逐渐变得智能化,用餐习惯也从线下转到了线上。在日常消费之后,用户习惯去线上平台留下评论以表达本次消费的感受。日积月累之下,这便形成了庞大的消费评论数据集。利用大数据手段,合理地对这些情感数据进行分析与挖掘,除了能够有效快速地了解商家的优缺点,同时也能够把握用户的喜好和消费需求,并以此来对产品进行改善。传统的情感分析主要基于机器学习模型和规则匹配的方法。基于规则的方法是指在某个领域针对每一类情感,都需要构建该情感的情感词典,最终预测的效果很大程度上取决于每一类情感所包含的情感词是否完善与准确。并且对于不同领域构建一个通用型的情感词典比较困难。另一方面,基于传统的机器学习方法需要提取文本浅层的语法和语义特征,比如词性信息和实体信息,由于不能提取文本上下文的语义信息,因此模型的效果一般。基于此,本文主要是利用深度学习算法,将文本表征为词向量,考虑到文本的上下文信息和语义、语法等信息,运用深度学习算法来进行情感分析。本文的主要工作内容如下:(1)本文提出了一个基于Seq2Seq情感分类模型,首先在输入上预训练了一个可用于餐饮评论的ELMo的语言模型,能够生成包含上下文语义、语法的词向量,有效的对文本评论进行表征,提高模型的精度。Seq2Seq模型主要利用了本文的输入是一个序列,输出也是序列,输出的20个不同粒度的情感粒度之间有着复杂的联系,通过Seq2Seq模型能够将这种联系学习到,本文改进了其中的注意力机制,共享参数的特点,在不同方向上分配不同的权重,通过GE解码用于序列生成模型,由此可以捕捉label之间相关性,且预测不同label的时候能聚焦输入不同部分。最终本文改进的Seq2Seq模型在美团点评数据集上的Accuracy值为89.32%,平均F1值为0.7190,通过与其他基线模型对比研究发现,本文提出的模型在评价指标上都是最优的。(2)本文提出了第二个基于自注意力机制的细粒度情感分类深度学习模型,该模型使用两个基于自注意力机制的模型来进行文本编码,逐步获取20个特定方面的信息,最终模型输出20个方面的情感标签。该模型在美团点评数据集上取得了良好的效果,平均Accuracy值为88.64%,平均F1值为0.7079。(3)为了加速细粒度情感分析方法在实际生产环境中的应用,本文开发了餐饮评论细粒度情感分析文本应用,应用集成了数据爬取、数据预处理、模型计算、统计信息展示等模块,并提供了对餐饮评论数据进行细粒度情感分析的功能,验证了本文提出模型得使用性和有效性。
其他文献
农技推广是农业科技成果转化为现实生产力的桥梁和纽带,没有有效的推广,先进的农业技术就无法真正进入生产领域并转化为现实生产力。发展现代农业,必须以现代科技为支撑,关键
收集电极是二维空气电离室剂量探测器的重要组成部分,影响剂量测量的准确度。为了研究收集电极对剂量测量的影响规律,采用蒙特卡罗程序EGSnrc,分别在不同射线能量下对不同材
采用模糊PID控制算法,根据HI-13串列加速器头部电压控制的实际需要设计了PID控制参数模糊化计算方法,实时获得了头部电压PID控制参数,并根据控制参数计算得出实际的头部电压
为了方便管理和有效使用各类教育资源,让计算机理解各门学科中概念的语义,本文采用了建立学科语义模型的方法,研究了化学学科的语义模型及其形式化描述.该模型可为实现化学类
通过取代反应合成了磺酰化β‐环糊精(6‐OTs‐β‐CD),并采用红外光谱与核磁共振对合成材料进行表征,验证了材料合成的可靠性;通过6‐OTs‐β‐CD与N ,N′‐二苯硫脲以2∶1的摩尔
随着世界经济全球化的不断深入,中国与国际间的交流日益频繁。中国与俄罗斯有着历史悠久的革命友谊,在政治经济发展中交流越来越频繁。中国一直以来都有进行俄语教学,最早可
汉字是迄今为止各大古文明留下来的唯一表意文字,它作为中华文化的重要载体具有很强的生命力。汉字的每个部件甚至每个笔画的起源都有着它背后强大的文化脉络,我们在学习和教
目的探讨联合检测血清脂联素(ADPN)、人血管生成素样蛋白4(ANGPTL4)、视黄醇结合蛋白(RBP)水平在糖尿病肾病(DKD)患者早期诊断及预后评估中的意义。方法选择2016年1月至2019