基于条件随机场的中文微博情感分析研究

来源 :广东工业大学 | 被引量 : 8次 | 上传用户:Tiger7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web2.0时代的到来,互联网在模式上由单纯的“读”向“写”以及“共同建设”发展,用户由被动地接收互联网信息向主动创造互联网信息发展。Web2.0模式下的互联网为用户提供了大量开放的信息交流平台,通过BBS、博客、微博等平台用户能够可以不受时间和地域的限制分享各种观点,既可以得到自己需要的信息也可以发布自己的观点。其中微博作为最新的信息交流平台,自诞生以来就迅速为人们所接收和认可。由于微博的轻便、快捷等特点,大量的用户在微博上发表自己对于某些热点话题或者产品的观点意见,而这些观点意见往往带有鲜明的情感色彩。对这些海量情感信息进行挖掘具有重大的意义,因此对于微博信息的情感分析工作尤为迫切和重要。本文首先对前人的情感分析研究工作进行分析和总结,并根据NLP&CC会议提供的开源新浪微博数据,对中文微博信息的结构特点进行了观察分析,在此基础上,提出目前已有工作研究思路的缺陷和不足。针对已有工作普遍将情感分析看作主客观分类及情感倾向性分类两个独立任务的做法,本文在句子级别情感分析过程中引入了情感极性上下文信息和两个任务间的依赖信息,构建了具有Two-Level结构的动态条件随机场(DCRF)模型。实验结果表明,通过引入这两类信息,本文提出的方法较现有最好方法的精度提高了4%左右。最后本文进一步对两种信息的贡献度进行了对比分析,并发现精度的提高主要来源于两个任务间的依赖信息的引入。
其他文献
本文分类了所有内交换子群同阶的亚循环p群,分类了所有非正规内交换子群的正规闭包是极大子群的亚循环p群。
本文研究耦合的Stokes流和Darcy-Forchheimer流问题的一致稳定的混合元方法,根据同一元的思想使用P1的非协调Crouzeix-Raviart混合元函数近似流体的速度,使用分片常数函数近似
本文介绍最大度为4的图的列表强边染色问题的相关结果。  设G是一个图,E(G)与V(G)分别表示它的边集与顶点集。设v∈V(G),则点v在G中的度数表示为dG(v),图G的最大度和最小度
对于线性回归模型的参数估计问题,由于最小二乘估计所具有的许多优良性质,使它一直是最具影响力、应用最广泛的参数估计方法,处于回归参数估计的核心地位。但是随着电子计算机的
实时定量监测工厂、焚烧场、战场等的气体所含污染物,为预测、处置污染源提供依据是一项非常重要的工作(武汉地区新近建立了垃圾焚烧场,对焚烧场的管理,防止二次污染问题变得
可分组设计(GDD)在组合设计理论中有着极其重要的作用,它们被广泛地用来构造各类设计。例如,在组合设计理论奠基人Wilson和Hanani证明成对平衡设计存在的充分必要条件时,可分组
本文分类了非交换子群均特征的有限p群,非循环子群均特征的有限p群以及非循环交换子群均特征的有限p群。
压缩感知是近来国际上热门的介于数学与信息学的一个新的研究领域,并在雷达探测,医学成像,图像处理等方面有了广泛的应用。人们经常需要对信号进行观测,以期通过观测信息对原始信
PID控制器作为一种经典的控制方法,其具有算法简单、鲁棒性强、可靠性高、易{操作等优点,因而它被广泛的应用于工业过程控制中,比如,冶金化工、电力、轻工、机械等方面。但是
本文证明了Berkovich和Janko在他们的p群专著“Groups of Prime Pow- er Order I, II, III, IV”中提到的问题56,736,1484与2487⑴是等价的.在此基础上.利用循环扩张的方法分