目标依赖的细粒度文本情感分析研究及应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lixiangzone119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统文本情感分析,通常从文本(可以是文档、段落或句子)整体出发,判断其情感极性或情感强度,是一种粗粒度的情感分析,忽视了由不同目标(情感附着物)所造成的情感极性偏差。因此,本文研究目标依赖的细粒度文本情感分析,旨在分析文本中特定目标的情感。例如,在产品评论中,该目标可以是笔记本电脑(产品)的各个属性,如“价格”、“电池”或“性能”等。本文第一部分工作采用传统机器学习方法,针对不同领域中不同类型的目标进行细粒度的情感分析。具体地,本文的第一个工作是对笔记本电脑和餐厅的产品评论文本,以产品的实体属性为目标,采用自然语言处理和机器学习方法,构建实体属性依赖的细粒度情感分类模型。该工作应用于2016年国际标准语义评测SemEval基于属性的情感分析子任务中,获得了第三名的成绩,相关论文发表在2016年的SemEval会议。本文的第二个工作是对金融领域的推特和新闻数据,以公司股票为目标,采用精心设计的特征结合机器学习方法,构建股票依赖的细粒度情感强度预测模型。该模型在2017年SemEval的金融领域细粒度情感分析子任务中,取得了第一名的成绩,相关论文发表在2017年SemEval会议。采用传统自然语言处理和机器学习方法具有很强的领域依赖性,需要专家领域知识精心设计抽取特征,系统迁移性差。因此,本文第二部分工作提出一个新的基于门和关注机制的双向长短期记忆神经网络模型,解决多领域目标依赖的细粒度文本情感分析问题,该模型应用于产品评论和金融领域,在两个领域的性能均优于传统机器学习方法。这一工作发表在2017年的KSEM(CCF-C类)会议。本文针对多个领域(笔记本电脑、餐厅、金融股票)不同来源(产品评论、推特、新闻)的评论数据集,从不同的粒度(粗粒度情感极性、细粒度情感强度)采用多种方法(机器学习、深度学习)进行大量的实验。实验结果表明,本文提出的机器学习和深度学习模型,能有效解决目标依赖的细粒度文本情感分析问题。
其他文献
微RNA(miRNA)是一类由内源性基因编码、长约22 nt的非编码单链RNA分子。近年研究表明,miRNA不仅涉及细胞增殖、分化、凋亡、发育等诸多生理过程,而且对许多疾病发生发展,甚至
增材制造对传统制造业有着革命性的意义。基于国际国内增材制造产业发展现状,需要提高认识,明确方向,政府主导,社会联动,快速构建增材制造产业发展机制,抢占国内3D打印技术的
教学"平方差公式"时,应高度重视方案设计,引导学生正确认识公式,并掌握公式.同时,应在教学中渗透数学思想方法,提升学生的思维能力.本文从活动设计、探究过程、公式符号和思
现金流量的质量是企业的现金流量能够按照企业的预期目标进行运转的质量。企业现金流量的状态体现了企业发展战略的要求,在稳定发展阶段,企业经营活动的现金流量应当与企业经
维持适宜人口容量是实现区域可持续发展的重要途径。运用可能—满意度方法,选取6对12个指标,构建人口容量测度指标体系,预测湖南省适宜人口规模。以2015年为目标时间,通过对
<正>有幸观摩了28节合肥市包河区初中青年数学教师课堂教学评比课,其中的一个课题是沪科版九年级上册第23章第1节"锐角的三角函数"第1课时,内容是"正切"的概念.随着课程改革
21世纪以来,随着信息技术飞速发展,教育信息化、高等教育大众化的普及,基于互联网的在线远程教育蓬勃发展,形成目前以网上交互式在线学习为主要特点的现代远程与继续教育格局
目前,我国人口老龄化日益严重,老年人的养老服务问题正面临着越来越严峻的困境与压力。在老人选择一种养老方式后,如何护理成为重要一环。我国现有的各种养老模式都面临着专
搭配是我们日常生活中经常出现的两个或多个单词的组合。它们不仅使语言使用更丰富,并且在不同的语种和文化之间有所区别。母语者自然而然地使用它们,而非母语者需要更努力学