基于深度学习的情感信息抽取与分类研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wsttkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动互联网的用户数量和使用场景发展迅速,用户在线上完成消费后往往会在服务提供平台上发表一些针对商品或服务的评价,这类评价往往会包含用户对目标多个方面上的观点,针对不同方面的细粒度情感分析成为越来越广泛的需求。基于方面的情感分析(Aspect Based Sentiment Analysis,ABSA)是细粒度情感分析的主要方向之一,相关的工作大多分为两种,一种是基于方面(Aspect)类别的,这种任务是检测评论所属的方面类别与情感倾向,需要事先指定一个方面类别集合,在实际应用中的扩展性与灵活性较差。另一种是对方面词(Aspect term)进行抽取,然后判断与方面词相关的情感倾向。本文通过对一般细粒度情感分析任务对评价词利用不足的问题进行分析,提出了一种新的ABSA任务及其解决方案,与以往的工作相比可以获取更加完整的情感信息,具体工作如下:(1)针对现有工作在ABSA任务中往往忽略评价词信息的问题,提出了基于深度学习模型实现的情感信息二元组抽取方法。通过深度学习序列标注模型对方面词和评价词进行抽取并通过分类模型判断不同词之间的对应关系。针对传统方法在词向量表示方面存在的不足,提出了基于BERT的方面词与评价词抽取模型,并通过实验对多种下游模型在该任务中的表现进行了研究。(2)提出了一种完整提取评论文本中的方面词和评价词及其对应情感倾向的任务,并针对该任务设计和实现了基于深度学习模型的流水线方法解决方案,同时研究了不同标注策略对结果的影响。针对在流水线方法中发现的错误传播以及上下文信息缺失等问题,本文提出了基于BERT-BiLSTM底层参数共享的联合模型,在一定程度上缓解了错误传播问题,同时通过共享参数使不同任务之间产生协同交互作用。最后通过实验证明本文提出的模型在实际效果上与流水线模型相比有明显的提升。(3)围绕本文提出的模型设计并实现了基于方面的评价挖掘系统,将本文提出的方法应用到实际的酒店评论数据中,通过对情感信息三元组的抽取来达到方面级情感分析的效果。
其他文献
为了实现档案的自动盘点和定位,提高档案查阅工作、盘库的效率,本文对档案机器人的一些关键技术展开研究,设计并实现了在全库范围内智能盘点档案,提高了档案实体管理的准确性和系统性。首先,为定位档案盒以及盘点盒内档案文件,提出将条码识别和RFID技术相结合并设计盘点仪器。利用条码识别器识读以实现盒定位,并设计可盘点高密集标签的RFID识别系统。针对高密集标签识别困难、漏读标签等问题,分析ISO 18000
开发区、产业园和工业园等园区的开发都必然会伴随着周边的土地征用、原住民的拆迁安置,随之就会产生一系列的社会影响。对园区开发产生的社会影响不应该仅仅关注开发初期的影响,更应该考察在较长的时间内对作为社会影响载体的社区及其居民产生的累积性社会影响。目前,人们对累积性社会影响的研究尚少,对其社会影响累积过程及其复杂的因果机制尚缺乏认知。本文以大型园区开发所形成的安置社区作为研究对象,从时间维度探讨园区开
从国务院2017年发布的《关于加快发展冷链物流保障食品安全促进消费升级意见》中可知,为了统筹规划好冷链物流的基础设施建设,建立好覆盖全国各地的基础设施网络、促进行业科学发展、保障人民群众的食品安全,补齐“最后一公里”短板是行业健康发展不得不面对的一个问题。在这样的背景下,论文首先从“最后一公里”出发,大量梳理文献后发现,前人的研究大多集中在确定性因素上,对不确定因素,尤其是时间窗的研究还非常不足,
配送中心是我国物流业重要的一环,对于我国物流整体效益的提升有着重要意义。近年来,各级政府、行业陆续出台了许多发展配送中心的相关政策,使得配送中心的发展日益蓬勃,为我国物流效益的提升助力。然而在快速发展的进程中,由于建前缺少科学理论指导和整体合理规划,大多配送中心在建成后出现业务流程衔接不顺畅、作业效率低、物流动线交叉、设备设施配备不合理等问题。因此,研究配送中心布局规划对于提高配送中心整体能力具有
改革开放以来,城市居民生活水平不断提升,人们越来越重视健康的饮食,使得城市居民对生鲜产品的需求不断增加。在此契机下,生鲜产品的同城配送行业随之迅猛发展起来,越来越多的企业意识到了其巨大的市场潜力,开始投资布局此行业。而随着我国城市化进程的推进,尤其是在我国土地与住房制度改革之后,城市居民的生鲜需求空间分异现象随着城市居民社会分层以及居住空间分异的情况而加深,呈现出了以社区为单位的空间分异新现象。城
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术被认为是未来无线通信系统极具发展潜力的技术之一,在不增加带宽的情况下极大地提升了系统的吞吐量,因而受到了研究人员的广泛关注。然而在大规模MIMO系统中,传统通信技术理论在大数据处理和超高速通信等方面表现出一些固有的局限性,亟需研究人员寻找更高效的解决方法。近年来深度学习方法作为人工智能(Artifici
工程造价咨询企业在建设项目造价的合理确定、有效控制和管理中,维护建设各方的合法权益等方面发挥着重要作用。由于目前造价咨询市场的行业信息壁垒重、恶性低价竞争、咨询服务质量参差不齐等现象频发,委托人选择工程造价咨询企业时成本高、效率低。另一方面公共资源交易项目涉及国家财政资金、关乎公共工程安全,对工程造价咨询企业的能力、服务质量要求更高。因此,基于公共资源交易平台的工程造价咨询企业选择应加以重视。本文
随着网络媒体及其技术的蓬勃发展,网络新闻已成为互联网内容大数据的重要组成部分。与此同时,由于新闻报道的时效性、片面性等特点,网络新闻的碎片化问题不断凸显,人们难以从纷繁复杂的新闻信息流中掌握事件发展的来龙去脉。利用事件演化分析技术挖掘新闻事件间演化关系并跟踪新闻事件的演化过程,有助于解决新闻碎片化问题。然而,现有事件演化分析方法还存在以下不足:第一,现有事件特征建模技术忽视了对事件元素间关系的建模
无人驾驶汽车是未来交通工具发展的必然趋势,实现车辆智能化是提高道路安全、提高运输效率的有效途径,但是要实现无人驾驶汽车的商用化还有众多技术难题需要解决,其中保证无人驾驶汽车在复杂环境下的可靠性至关重要。路径跟踪算法是无人驾驶系统核心算法之一。目前对于中低速下路径跟踪算法的研究已接近成熟,而要真正实现全速域全工况下的无人驾驶,则需要建立一种面向高速极限工况的路径跟踪算法。本文围绕车辆在极限工况下的路
With most accidents being due to human mistakes,autonomous vehicles appear to be the future of personal vehicles.Now that most recent vehicles are instrumented enough because of driving assistances,on
学位