网络评论文本的细粒度情感分析研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:suzhouxyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络评论文本的爆炸式增长,评论中承载了大量的用户情感信息,分析评论的整体倾向性已经不能满足当前用户的需求,迫切需要更细粒度属性层面的情感分析,并且由于用户表达随意性造成的分词准确率过低,情感要素抽取准确率低和隐式情感信息丢失等问题也急需解决。本文首先对垃圾评论过滤和中文分词两种文本预处理任务进行了分析;其次基于CRFs模型对情感要素进行抽取,补充隐式情感对象后聚合处理;然后提出一种对聚合后特征类的对立观点进行情感强度分析的算法。本文研究内容有以下四个部分:(1)针对文本预处理问题,基于构建的评论特征分类来识别垃圾评论,并构建用户词典改善中文分词本文首先基于构建的评论特征进行文本分类,包括主客观文本分类,过滤掉垃圾观点信息评论数据,保留真实有价值的评论文本信息进行情感分析任务,并进行意群划分,便于后续语义情感聚合处理;中文分词采用NLPIR分词系统,基于新词、网络词汇和领域术语类关键词等未登录词构建用户词典,既可以纠正分词错误,提高情感对象抽取的准确率,又可以作为情感词典的补充,减少用户情感信息的丢失。(2)基于CRFs模型抽取情感要素,将情感对象、情感词及情感修饰词的联合识别任务转化为结构化序列标注任务采用条件随机场模型联合识别情感要素,首先选取特征构建特征模板和标注集,然后基于CRFs联合识别情感要素,利用显式情感对象-情感词对和评论语料中标签集组成的产品特征观点对构建训练文档,采用朴素贝叶斯分类器识别隐式情感对象,最后通过词义代码实现情感对象聚合,改进特征稀疏性问题。(3)提出了基于语境情感消岐的对立观点情感强度分析算法本文首先依据情感词的动态极性定义了情感歧义词,利用关联规则挖掘情感歧义词语搭配集,PMI剪枝过滤后构建出情感歧义词搭配词典,然后介绍了构建的网络词典及情感修饰词典等,提出了对立观点情感强度计算的方法,最后依据情感强度生成对立观点情感摘要完成细粒度情感分析,实验表明了本文词典构建及情感强度计算方法的有效性。(4)设计并实现了评论文本细粒度情感分析系统本文实现了细粒度情感分析系统,该系统各功能模可以完成评论采集、垃圾评论过滤、中文分词、情感要素抽取和细粒度情感分析全过程,并最终提供给用户直观的包含对立观点强度信息的细粒度分析结果。
其他文献
酵子作为中国面食用传统发酵剂,除了含有酵母菌外,还含有霉菌、乳酸菌、醋酸菌等多种微生物,在发酵的过程中各种微生物间相互协同作用,改善馒头品质。但是,市售酵子的生产工
思维可视化教学是指运用各种图示技术将抽象的思维方法和思考过程形象的呈现出来,并运用到实际教学当中。如何建立中医思维模式和提高临床的应用能力是方剂教学改革中应关注
研究评论倾向性分析中情感词的动态极性变化问题.用Apriori算法在语境基础上挖掘情感歧义词语搭配,构建出(情感对象,情感词,情感倾向性)三元组形式的情感歧义词搭配词典,利用
孟浩然、陶渊明田园诗的审美视角有同有异。就其审美视角的相同点而言,二人都是从适性视角来描写田园生活以抒发乐享田园生活之美。就其审美视角的不同点而言,主要有两点不同
在我国资本市场的迅猛发展和全球化经济的大背景下,我国资本结构的改变直接影响着我国各企业的财务管理制度模式,同时对其提出了新的挑战和要求。企业财务的管理模式正确与否
乡土音乐是我国民间音乐的重要组成部分,但其生存空间与文化生态环境日益萎缩,失去传承基础;传承人呈现"断层"与保护者的"肌无力",使乡土音乐失去传承动力。在乡土音乐保护与
从细粒度语义角度给出情感计算框架。针对目前观点分析方法局限于传统的文本分析技术,只能将舆论观点句分为肯定和否定两极或确定每一极的程度(粗粒度),不能进一步给出舆论观
绿色建筑技术超越于传统建筑技术,注重节能、低耗、高效、经济、环保、集成与优化,是人与自然、现在与未来之间的利益共享,是可持续的建设手段。我国绿色建筑发展起步较晚,但
一场成功的商务谈判是以谈判双方实现共赢为前提条件的,在具体的商务英语谈判交流和沟通时,谈判双方应当熟练地掌握商务英语的翻译原则和灵活地运用多种口译技巧和策略,才能
随着人类社会的进步,及对能源需求的不断提高,环保、高效、清洁的新能源已成为新世纪能源发展的主要议题。而称之为第四代绿色照明的LED光源,由于其自身的高效率、工作寿命长