基于在线社交媒体的讽刺检测方案研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:carefreebeet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们在日常生活中经常使用社交媒体发布自己的状态表达自己的情感,其中不乏具有讽刺倾向的评论,该评论表面的情感往往与真实情感相悖,因此正确识别评论的讽刺特征成为讽刺检测的重要任务。讽刺检测旨在判别目标文本中是否含有讽刺倾向,由于判别该文本需要深度语义信息,因此讽刺检测是情感分析乃至自然语言处理中一项具有挑战的工作。从研究角度来看,讽刺检测可以分为基于目标文本和联合上下文信息两个角度展开研究。从研究方法来看,近几年的研究偏向深度学习方法,但以往的研究中也会采用规则的方法、统计的方法等。学者们在上述研究角度中经常采用的方法如卷积神经网络、循环神经网络等,这些方法的数据结构规则,便于处理。但在现实中,数据的结构往往是无规则的,如社交网络、化学分子等。本文基于图卷积神经网络进行讽刺检测,图卷积神经网络的数据结构可以是网状的、无规则的,便于提取目标的全局特征,在讽刺检测中取得了较好的效果。本文主要内容包括以下两个方面:1.目前基于目标文本的讽刺检测研究角度中,采用卷积神经网络虽能够提取文本的局部特征但无法提取全局特征,采用循环神经网络会存在忽略文本的非连续和长距离语义特征问题,选用以上模型会造成检测准确率不高。我们给出了围绕文本图卷积神经网络展开的两种检测模型:TGbL模型和TGsabL模型。TGbL模型中加入了双向长短时记忆神经网络来提取目标文本的时序信息;TGsabL模型在TGbL模型基础上增加了自注意力机制来提取凸显情感对比的权重分配信息。实验结果表明TGbL模型和TGsabL模型均好于基准模型。2.上下文信息有助于提高讽刺检测的准确率。我们关注的上下文信息为目标文本的作者特征,提出了两种构建作者特征方法的模型:图卷积神经网络构造作者特征模型和朴素二维向量法构造作者特征模型。图卷积神经网络构造作者特征模型能够学习得到每个作者的全局特征,朴素二维向量法构造作者特征模型能够构建二维向量来表示作者的讽刺倾向特征。上述两个模型的实验结果均好于基准模型,并且发挥了各自的优势。
其他文献
近年来,随着物联网技术的不断发展,面向海量设备接入的低功耗广域网(Low-Power Wide-Area Network,LPWAN)受到广泛关注,特别是基于LoRa(LongRange)技术的LPWAN。但是,随着接入节点数量的增加以及数据的频繁发送,LoRa网络会出现下行数据冲突、数据到达超时和信道争用等问题,导致网络性能的恶化。为了解决上述问题并提升网络性能,本文设计和实现了面向多节点LoR
基于PatchMatch的多视图立体算法在三维重建上的精确度和完整度方面已经取得了显著的进步,但是其中深度估计环节仍然存在对于图像弱纹理区域匹配二义性的问题,导致了重建点云在场景弱纹理表面的空缺。本文对多视图PatchMatch深度估计算法进行了深入研究,提出了一种基于置信传播的多视图深度估计算法来解决这一问题。本文主要完成了以下工作:(1)在多视图立体匹配中定义了匹配置信度的概念。本文基于图像块
10月1日国庆节就要到了.每到这个日子都会引起我对往日的回忆.今年是中华人民共和国成立72周年.我已从一个稚气少年变成了耄耋老人.但是岁月的流逝带不走我童年的记忆.解放前后鼓舞我们积极向上的歌曲,虽已久绝于耳,却又在脑海里复活了.rn我曾经经历过日寇占领时期的苦难生活.1945年好不容易盼来抗战的胜利,国民党发动的内战又把人们带入水深火热之中.那时,我生活在镇江.1949年年初,临近解放,大多数人家过着赤贫的生活.街上不时会发现倒毙的饿殍.一度传闻宝盖山发现了“观音土”.饥饿的人们纷纷前往采挖,后来报纸报
期刊
新时代反映道德风尚的小说文本和影视作品比比皆是,宣扬社会正能量和传统主义道德美德成为当下现实主义题材的叙事主题之一.在镇江本土电影《寻人启示录》中,大胆注入了戏剧荒诞性元素,打破电影本体叙事方式,显得新颖有趣,通过三重隐喻,折射人性的多面性和复杂性,具有重塑新时代道德风尚的现实意义.
期刊
期刊
期刊
期刊
期刊
期刊
唇读是一种仅靠唇部运动传递的视觉信息识别说话人言语信息的技术,其也被称为视觉语音识别。唇读技术不受声音信号信噪比高低的影响,能够克服语音识别在复杂场景下的不足,因此开展对唇读技术的研究能够拓宽人机交互的应用场景,具有重要的研究意义和使用价值。唇读涉及计算机视觉、自然语言处理等领域相关技术,是一种综合性较强具有一定的挑战性的学科。随着人工智能技术的快速发展,基于数据驱动的深度学习为唇读技术提供了新的