基于实体关系联合抽取方法的情感倾向性分析研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:lanxuexiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下电子商务高速发展,对线上评论数据进行细粒度的情感分析成为近期的热点技术。目前,细粒度的情感倾向性分析通常采用多标签分类技术作为解决方案,但是此方案无法获取实例中的情感实体与情感属性,从而对情感倾向性分析任务的性能产生影响。所以,受情感知识图谱构建方法的启发,本文尝试将实体关系抽取任务应用于情感倾向性分析场景中,以提高情感倾向性分析任务的识别效果。但是,在实体关系抽取任务中,串联式实体关系抽取具有一定的错误传播性,且忽略了实体识别与关系抽取任务之间的联系;此外,在真实数据中客观存在的关系重叠问题上也缺乏有效解决对策。综上所述,为了解决上述实体关系抽取存在的问题,本文提出了一种实体关系联合抽取的方法,该方法融合了条件随机场与卷积神经网络,同时,引入自注意力机制及词语位置信息,实现了实体关系的准确抽取。本文主要研究的内容及成果如下:(1)针对在中文实体关系抽取上采用多任务串联式抽取方式时出现的错误传播问题、多任务间缺乏联系的问题以及关系重叠问题,本文提出了融合条件随机场与卷积神经网络的实体关系联合抽取算法。本算法采用条件随机场模型来识别文本中的实体,抽取主体位置信息,结合双向长短时记忆网络、自注意力机制与词位置信息获得文本特征,通过卷积神经网络对与主体存在关系的客体与关系同时抽取。本算法在实体关系抽取任务上F1指标可达79.79%,在相同的中文数据集下的表现要优于经典的Multi-head Selection以及DGCNN模型。(2)目前在对文本进行细粒度情感分析的任务中,缺乏将情感实体及属性的抽取与情感极性的分类作为联合任务进行情感分析的方法,针对此问题,本文提出一种基于实体关系联合抽取的多标签分类算法。该算法利用融合条件随机场与卷积神经网络的实体关系联合抽取算法抽取出商品的情感实体及情感属性,引入情感实体与情感属性的位置特征,通过双向门控循环单元,对文本进行细粒度情感多标签分类。本算法在准确率的性能上可达72.83%,该结果优于经典的双向门控循环单元、双向长短时记忆网络等多标签分类方法在细粒度情感倾向性分析任务上的表现。因此验证了本文所提出融合条件随机场与卷积神经网络的实体关系联合抽取算法应用于情感倾向性分析任务这一场景中的有效性。
其他文献
随着我国经济社会建设的迅猛发展和新媒体技术的急速跃迁,微慈善在我国慈善事业中占据越来越重要的地位。微慈善的出现与发展不仅能够帮助弱势群体摆脱困境,重拾对生活的信心
随着各种接入方式和网络类型的发展与进步,多种网络异构互联的一体化融合网络逐渐成为用户现如今接入网络的主要方式。然而,由于当前互联网的体系结构对报文的源地址不做验证
对主动毫米波人体图像进行隐匿物自动检测具有重要意义,它不仅可以避免人工判读图像而侵犯被检人员隐私,也能较好地预防人为因素所造成的误检与漏检。目前基于多视角主动毫米波图像的隐匿物检测算法利用了主动毫米波图像的时序性,所以取得了较好的结果,但是对如何利用时序性的研究不够充分。由于主动毫米波人体安检数据集难以获取,所以数据集一般较小,如何充分利用较小的数据集与样本的时序性成为多视角主动毫米波图像隐匿物检
现代信息科技的高速发展正深刻地改变着人们的思维和生活方式,如今,人机交互(human–computer interaction,HCI)在人们生活中扮演着不可或缺的角色。近年来,可穿戴设备、虚拟
RGB-D相机是一类重要的传感器,相较于传统彩色相机,它同时提供了可见光彩色图像和稠密的深度图像,为许多高级视觉算法提供了丰富的数据源,因而在智能感知领域备受关注。在过
伴随着大数据时代的到来,推荐系统在互联网的很多领域都得到了应用,并且在逐渐改变着人们的生活。推荐系统本质上是通过一定方式将用户和项目联系起来,而这个方式可以有很多
目的:研究H型高血压痰证与部分客观指标相关性,为建立H型高血压病的中医现代化辨证体系,最终达到辨证的客观化、规范化和标准化提供一定依据。探索H型高血压患者临床检验指标间的相关性,总结其临床特点,为H型高血压的治疗提供一定依据。方法:检索2015年1月-2018年12月期间于广东省中医院大学城医院心血管一科住院的H型高血压患者,根据纳入标准和排除标准共纳入240例患者。记录患者姓名、性别、年龄、身高
随着人类社会活动对地球环境影响的增大,地球环境变化愈加剧烈。地球环境变化的表象之一就是地表覆盖类型变化。人类社会与地表覆盖类型相互影响,因此进行地表覆盖分类研究显得尤为重要。关于地表覆盖分类的研究有很多,但是使用星载激光测高数据来进行地表覆盖分类和变化发现/监测的研究较少。本文对星载激光测高数据及其特点进行梳理和总结后认为,全波形星载激光测高数据在地表覆盖分类应用中的优势在于,不仅能得到地表的高程
杂环化合物由于其自身结构的特殊性,大多都具有丰富的生物活性。而氮元素是组成生命大分子的基本元素之一,在生物界中分布广泛,参与各种生命活动,与生命有着非常深刻的联系。现在,临床所使用的药物大多数也都是由含氮有机化合物参与合成的。五元含氮杂环化合物是一类特殊类型的具有潜在优势的架构,近些年来在药物的合成领域越发受到广大研发人员的关注。而绕丹宁作为噻唑烷酮类的五元含氮杂环,不仅在药物化学方面具有非常重要
目的:通过病例前瞻性研究,调查岭南地区冠心病伴焦虑状态的中医证候分布规律,为更好防治岭南地区冠心病伴焦虑状态提供指导依据。方法:在广东省中医院心脏病门诊、心血管科住院病房中筛选冠心病伴焦虑状态患者共300例,通过问卷调查方式收集年龄、性别、文化程度、体重指数、吸烟史、合并疾病等基本资料,并收集患者基本中医症候,依据改编证型标准(详见附录)辨明中医证型,通过聚类分析归纳出冠心病伴焦虑状态的中医证候特