【摘 要】
:
随着互联网行业的发展,电商评论和社交平台的推广,积累了大量的文本数据。通过提取这些文本信息中蕴含的观点和情感,能够帮助人们做一些决策和推广。文本情感分析已经成为自然语言处理领域中国内外研究的热点方向。传统的文本情感分析模型需要在人工标注的特征工程基础上,并结合语法规则才能取得不错的效果。随着深度学习模型在处理文本序列上的发展,在没有人工标注的特征工程前提下,引入注意力机制,关注文本信息中关键部分,
论文部分内容阅读
随着互联网行业的发展,电商评论和社交平台的推广,积累了大量的文本数据。通过提取这些文本信息中蕴含的观点和情感,能够帮助人们做一些决策和推广。文本情感分析已经成为自然语言处理领域中国内外研究的热点方向。传统的文本情感分析模型需要在人工标注的特征工程基础上,并结合语法规则才能取得不错的效果。随着深度学习模型在处理文本序列上的发展,在没有人工标注的特征工程前提下,引入注意力机制,关注文本信息中关键部分,在文本情感分析任务中有着优异的表现。本文主要是以文本情感极性分类和不同主题文本情感分类为研究出发点,构建了正反向序列AT-LSTM模型和融合主题特征的深层注意力的LSTM模型(deeper attention LSTM with aspect embedding,AE-DATT-LSTM)来处理文本情感分析任务。针对文本情感极性分类研究,首先在LSTM网络的模型基础上,为了关注文本中的关键信息,引入注意力机制,构建AT-LSTM模型,采用预训练好的Glove词向量,同时将文本的正反向序列采用注意力机制进行分析,然后进行特征融合和分类处理,构建了正反向序列的AT-LSTM模型。在SemEval-2017 Task4数据集上的实验结果表明,该方法在文本情感极性分类任务中,正反向序列模型提高了文本情感极性分类的准确率。针对不同主题文本情感极性分类研究,构建了融合主题特征的深层注意力的LSTM模型,将主题词向量和文本词向量通过双向LSTM进行训练,对于得到的主题特征和文本特征进行特征融合处理,将得到的特征向量经过深层注意力机制的处理,由分类器得到相应主题的情感分类结果。在SemEval-2014 Task4和SemEval-2017Task4数据集上的实验结果表明,该方法在特定主题情感分析任务中,较之前基于注意力的情感分析模型在准确率和稳定性上有了进一步的提高。对于特定主题情感极性分类任务,通过引入主题特征和深层注意力机制能够使得情感分析模型学习到更多有价值的信息,为舆情分析、文本推理等领域提供了方法的支持。
其他文献
生活垃圾渗沥液含有大量重金属成分,重金属污染具有典型的积累性、滞后性、隐蔽性,会给环境及人体造成很大危害,因此生活垃圾渗沥液中重金属污染及其治理引起普遍关注。重点
本文研究了内电解—SBR组合工艺处理印染废水时,内电解预处理对后续SBR生化工艺的强化和影响。首先,从内电解反应的基本原理出发,以脱色率和反应中所释放的铁离子含量作为监测指
对4-氨基安提比林直接分光光度法测定废水中挥发酚方法提出改进,用过硫酸钾取代铁氰化钾作为氧化剂使反应进行完全,显色反应的稳定性、重现性和准确性均较好。方法的最低检出
《赠书记》为明毛晋《六十种曲》之一。全剧共三十二出,叙述谈麈与魏轻烟、贾巫云之间的爱情故事,署“无名氏”作。后世学者均沿用此说,认为该剧作者不可考。然笔者经过考证,
目前苏州河道的水环境污染问题尤为突出,不仅危及苏州城市的水乡形象,而且还严重影响苏州人民的生活居住环境和经济发展。文章不仅介绍了苏州水环境,而且认为造成苏州河道受
电力维护工作本身具有一定的危险性,安全对于变电检修行业来说非常重要,在作业实施过程中必须保证工作人员的人身安全。然而在变电检修作业实施进程中存在很多不安全因素,这
摘 要:现今教育,学校学科设置中,语、数、自然、外语、历史、地理均为偏重理性的课程,而这些又被叫做“主课”。可想而知,理性在学校中占据着主导地位,学生身上的规范越来越多,个性、创造性、感性的发展受到很大限制,从而阻碍了理性的发展,导致许多学生感情麻木,感觉迟钝。在这种情形下,音乐、美术等艺术课程应担当重任,去发展学生的感性特征,使学生成为有血、有肉、有感情的人。 关键词:音乐;新功能;发展;学生
目的了解成都市第五人民医院糖尿病患者住院费用情况,探讨影响住院费用的相关因素,为有效控制医疗费用提供参考。方法采用横断面调查设计,从成都市第五人民医院HIS系统中收集
【正】 历来评说唐太宗李世民其人其事,多要述及“轻徭薄赋”,却又往往数语带过,未予详论。这或许是由于从字面上看,唐太宗所说的“轻徭薄赋”、“薄赋轻徭”不过是承袭儒家
无线充电器作为一种运用新型的能量传输技术的产品悄然出现在我们身边,该产品使需要供电的设备摆脱了线路的限制,使充电器和设备完全分离,在安全性和灵活性方面表现的更加出