面向产品评论的细粒度情感分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hzm_jjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网电商平台的不断发展,网络购物逐渐成为越来越多网民的购物方式。与此同时,网络上针对产品的大量评论也随之涌现,这些评论既成为了网民购物时的参考,也为厂商了解用户反馈提供了便利的条件。不过,大规模的评论无法全部进行人工审阅,导致用户和厂商无法全面了解一款产品的大众评价。受益于计算机处理能力的增长和大数据时代的来临,自然语言处理技术作为人工智能重要的研究与应用领域,已经在诸多领域发挥了不可替代的作用。计算机拥有处理大规模数据的能力,同时成本低、效率高,如果计算机能够自动帮助用户和厂商分析产品评论中用户所表达的态度,将节省大量的人力物力。文本情感分析是自然语言领域中非常重要的研究方向之一。文本情感分析算法能够自动从篇章或句子中分析出用户的态度,比如支持、反对、或是中性;甚至能够分析出用户的情绪,比如喜悦、悲伤、惊奇等。但是,篇章级别与句子级别的情感分析通常无法找到用户所表达的态度的对象。在对产品评论的分析中,我们不仅对用户的态度感兴趣,更想了解用户对产品的哪一方面表达出了肯定或不满的态度。细粒度情感分析则能够很好地解决这个问题,找出用户评论中的评价对象与评价词、并确定它们之间的搭配关系是细粒度情感分析最重要的步骤。本文首先探究了基于循环神经网络的序列标注方法。这一方法将评价对象和评价词的提取工作看作是序列标注任务,通过对句子中每一个词语打标签的方式,确定哪些词语是评价对象,哪些词语是评价词。此外,还需要确定评价对象与评价词之间的搭配关系。本文使用了两种关系分类的方法,分别为基于句法与语义信息核函数的分类方法和基于融合句法关系的神经网络的分类方法。这两种方法均与句法关系相结合,充分利用词与词之间的句法关系,确定出两个词之间是否为正确的搭配关系,进而对评价对象和评价词进行抽取。实验结果表明,三种算法在各自的任务上均非常有效。在词语抽取的任务上,基于循环神经网络的序列标注方法要优于基于规则的词语抽取算法。在搭配关系抽取的任务上,融合了句法结构信息的模型的性能得到了明显的提高,说明了句法结构在关系分类任务上的有效性。同时,基于卷积神经网络与递归神经网络的混合模型能够更好地对句子的语义信息进行建模,性能更加突出。
其他文献
孟浩然、陶渊明田园诗的审美视角有同有异。就其审美视角的相同点而言,二人都是从适性视角来描写田园生活以抒发乐享田园生活之美。就其审美视角的不同点而言,主要有两点不同
在我国资本市场的迅猛发展和全球化经济的大背景下,我国资本结构的改变直接影响着我国各企业的财务管理制度模式,同时对其提出了新的挑战和要求。企业财务的管理模式正确与否
乡土音乐是我国民间音乐的重要组成部分,但其生存空间与文化生态环境日益萎缩,失去传承基础;传承人呈现"断层"与保护者的"肌无力",使乡土音乐失去传承动力。在乡土音乐保护与
从细粒度语义角度给出情感计算框架。针对目前观点分析方法局限于传统的文本分析技术,只能将舆论观点句分为肯定和否定两极或确定每一极的程度(粗粒度),不能进一步给出舆论观
绿色建筑技术超越于传统建筑技术,注重节能、低耗、高效、经济、环保、集成与优化,是人与自然、现在与未来之间的利益共享,是可持续的建设手段。我国绿色建筑发展起步较晚,但
一场成功的商务谈判是以谈判双方实现共赢为前提条件的,在具体的商务英语谈判交流和沟通时,谈判双方应当熟练地掌握商务英语的翻译原则和灵活地运用多种口译技巧和策略,才能
随着人类社会的进步,及对能源需求的不断提高,环保、高效、清洁的新能源已成为新世纪能源发展的主要议题。而称之为第四代绿色照明的LED光源,由于其自身的高效率、工作寿命长
随着网络评论文本的爆炸式增长,评论中承载了大量的用户情感信息,分析评论的整体倾向性已经不能满足当前用户的需求,迫切需要更细粒度属性层面的情感分析,并且由于用户表达随
思维可视化是指运用多种图示技术把本来不可视的、抽象的思维直观的呈现出来,使其清晰可见的过程。被可视化的"思维"更有利于知识的理解和记忆,因此可以有效提高信息加工及信
本文在Simunic审计收费模型研究的基础上,选取2005~2008年深市966家公司的审计数据,实证分析了我国特有监管制度下的盈余管理行为对审计费用的影响。结果发现,审计费用在一定