【摘 要】
:
随着电子商务,评论网站,社交网站等的发展,用户在网络上创造了大量的文本。这些文本数据存在着巨大的商业价值,通过对这些文本进行方面级情感分析,可以更加细粒度地了解用户对产品,实事等的看法,从而为商家等提供更好的决策依据。完整的方面级情感分析包含两个子任务,即方面提取和文档级多方面情感分类。前者从文本中提取出用户评价的对象,即方面,后者分析用户对于这些方面的情感。本文提出两种以注意力机制为基础的深度神
论文部分内容阅读
随着电子商务,评论网站,社交网站等的发展,用户在网络上创造了大量的文本。这些文本数据存在着巨大的商业价值,通过对这些文本进行方面级情感分析,可以更加细粒度地了解用户对产品,实事等的看法,从而为商家等提供更好的决策依据。完整的方面级情感分析包含两个子任务,即方面提取和文档级多方面情感分类。前者从文本中提取出用户评价的对象,即方面,后者分析用户对于这些方面的情感。本文提出两种以注意力机制为基础的深度神经网络分别实现无监督的方面提取和弱监督的文档级多方面情感分类。针对方面提取,本文提出了一种基于语言学注意力机制的模型(Linguistic Attention-Based Model,LABM),以充分利用方面指示词的语言学知识。LABM首先找到文本中的方面指示词,然后利用语言学注意力机制确定每个指示词的权重并加权得到方面的向量表示。本文还提出了一种无监督训练方法——分布式方面学习(Distributed Aspect Learning,DAL),避免了对人工标注语料的依赖。DAL的核心思想是与方面指示词相关性最高的名词的词向量应该和方面的向量表示比较相似。在六个用户评论数据集上的实验结果表明,基于DAL训练得到的LABM不仅超过了基线模型,而且具有较强的可解释性。针对文档级多方面情感分类,本文提出了一种多样化的多实例学习网络(Diversified Multiple Instance Learning Network,D-MILN)。该网络仅依赖于文档级的情感标注去学习方面级的情感分类器,因此大大减少了人工标注语料所需的花费。在D-MILN中,文档级的情感分布由该文档中方面级的情感分布通过注意力机制加权组合得到。通过文档级监督信号的反向传播来学习方面级的情感分类器。但是,方面级情感分类器在这种间接监督的指导下会对文档级信号过度拟合。为解决此问题,本文进一步提出了两种多样化正则,其中文本多样化正则鼓励分类器选择与给定方面相关的文本片段,而情感多样化正则允许方面级的情感与文档级情感有所不同。实验结果表明,D-MILN能够充分利用文档级的监督信号并避免对其过拟合。基于方面提取和文档级多方面情感分类的研究成果,本文设计并实现了方面级情感分析原型系统。针对用户输入的一段文本,该系统从文本中提取出不同的方面,并判断用户对这些方面的情感。同时该系统实现了注意力机制的可视化,增强了模型的可解释性。
其他文献
随着当代工业技术的飞速发展和工业革命的逐步深入,工业制造也逐渐朝着自动化、智能化、小型化、嵌入式的方向迈进。在工业制造过程中,越来越多的产品不仅需要自动化生产,还需要自动化测试系统来保证产品的基本运行能力、产品的质量和性能。采用自动化测试系统可以很大程度上代替传统的手工测试,对提升产品的生产和测试效率意义重大。本文针对一种光缆探测仪,特别是其信号源设备“量身”设计了自动化测试系统,该系统包含PC上
作为计算机视觉中一项基础而又重要的研究内容,立体匹配的实质是基于一对矫正后的图像计算出目标图片中每个像素点的视差值,在三维测距、机器人导航、自动驾驶等领域有着广泛的应用。随着深度学习的不断发展,基于深度学习的立体匹配算法在准确度上远远超过了传统的立体匹配算法,然而,当前的方法在纹理缺失、反射面以及遮挡等复杂区域仍然存在着匹配精度低的问题,而有效利用目标的多尺度和上下文信息可以解决上述问题,因此本文
在整个电力系统中,自动化监护已得到了极大的普及,技术发展也越来越成熟。变电站作为电网的枢纽,在整个电力系统中发挥着至关重要的作用,但是通常情况下,为了节省土地资源,变电站的选址都较为偏远,尤其是对于我国西部一些地方而言,这给变电站的维护带来了极大的难度。在当前比较流行的变电站监护系统中,变电站值班的工作人员要时刻识别和监护稳定运行的各种电网参数,增加了变电站值班人员的工作任务。近几年随着视频监护的
城市湿地是指处于城市中且在生态学属性、景观格局和功能服务等方面已明显不同于自然湿地的人工、半人工或城市建设中残留的自然湿地。本文以长沙市城市湿地为研究对象,在GIS
爬行类野生动物隶属于爬行纲(Reptilia),包括鳄形目(Crocodylia)、龟鳖目(Testudines)、有鳞目(Squamata),以爬行类野生动物及其产品为原料的贸易活动广泛存在于医药、食品、宠物等各行各业,尽管这些贸易活动均在政府监管下合法交易,但受利益驱动,仍存在大量不可估计的非法交易,从而对生物多样性造成严重影响。目前,有对我国涉及非法利用爬行类野生动物资源活动的个案及某区域内
自1989年Tim Berners Lee提出万维网后,人类便真正进入了信息爆炸式增长的时代。1.0时期的万维网由网页互相链接而成,但万维网中的网页内容都是通过文档呈现的。在万维网1.0时期,计算机将网页信息呈现给用户,但信息本身所包含的语义无法转化为计算机可理解的计算机语言,方便计算机进行理解、处理。为解决万维网1.0中的存在的以上问题,万维网之父Tim Berners Lee在2001年提出语
随着社会经济发展,社会对多元化、复合型人才的要求日益增涨。近年来各高校不断创新人才培养模式,大类培养被国内高校广泛采用,并取得了良好效果。课程改革是高校人才培养模式变革的重要一环,研究本科课程设置,构建与之相适应的课程体系对提升本科人才培养质量有重大推动作用。选取地处武汉市内W、Z、H三所高校公共管理大类为研究对象,采用问卷调查法和访谈法,自编课程设置现状调查问题,从课程结构、课程目标、课程内容、
因钽元素的惰性,且用于合成的可溶性前驱体K8[Ta6O19]·17H2O极易水解,稳定存在的溶液碱性强、pH值范围窄,导致多钽氧酸盐的合成条件苛刻,难度大,相对于多钨(钼、钒、铌等)氧酸盐的研究,该领域的发展十分缓慢,相关报道很少。本文以K8[Ta6O19]·17H2O、过渡金属盐等化合物作为原料,通过优化反应时间、温度、pH等条件,获得了四种不同结构类型的新型多钽氧酸盐,采用X-射线粉末衍射、元
随着我国经济步入高质量发展阶段,生产性服务业在国民经济中发挥着日益重要的作用,其发展可以促进经济结构的转型和升级。要促进生产性服务业的发展,可发挥税收政策的调节作用。政府可以通过建立有利于生产性服务业发展的税收政策体系,营造宽松的成长环境,以此提升我国生产性服务业的发展水平和质量。因此研究如何优化和完善促进生产性服务业发展的税收政策以促进生产性服务业快速有序发展、实现国家经济增长和产业结构转型升级
本文采用混合液滴外延法在Ga As(001)衬底上生长(In)Al As量子环点结构,主要研究In组分以及As压对(In)Al As量子环点结构的影响。实验前期为了找到In、Al液滴共同沉积温度,本文直接通过低沉积量的Al液滴沉积实验的研究,找到Al液滴均匀性最好条件下的沉积温度并将其作为In、Al液滴的共同沉积温度。进而在该温度下采用混合液滴外延法生长并研究In组分以及As压对(In)Al As