网络评论的情感分类方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:franky_816
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,为了快速有效的提取出海量网络评论文本中的情感信息,文本情感分析技术受到国内外学者的广泛关注。文本情感分类作为文本情感分析研究中的重要组成部分,是一个极富挑战性的研究课题。该领域虽然取得一系列的进展,但仍存在许多问题。例如,在单语情感分类研究中,传统的有监督特征权重方案存在一些不足,不能准确的衡量特征项在文本中的权重值;在跨语言情感分类研究中,常用的单一文本表示方案存在不能全面表达文本内容的问题。因此,本文在研究如何提高文本情感分类性能时,针对以上提出的两个问题展开以下研究:单语情感分类研究中,传统的有监督特征权重计算方案往往只考虑特征项在文档中的局部分布和全局分布两个因子,而忽略特征项在不同类别间的分布对判定特征项的类别倾向的重要作用。因此,本文提出一种基于类别贡献度的权重计算方案。该方案通过使用后验概率量化特征项在不同类别间的分布规律,然后将该规律与特征项在单文档中的局部分布、以及特征项在文档集中的全局分布相结合,丰富权重值的信息量,克服传统权重计算方案的不足,提高文本情感分类的效果。实验结果表明,本文所提出的方案具有良好的性能表现,与一系列特征权重方案相比,本文所提出的方案能够显著提升分类性能。跨语言情感分类研究中,常用的文本表示方法是采用词袋(BOW)模型。在该模型中,词与词之间被认为是相对独立的,这将会忽略词语的次序和语法知识。这使得文本内容在转换为文档向量的过程中丢失部分语义信息;在使用Doc2Vec模型进行文本表示时,该模型以文本内容为维度,综合考虑文本的上下文信息得出文本的向量表示形式。因此,本文在进行文本表示时,采用BOW和Doc2Vec两种文本表示模型,弥补单一方法的不足,全面多角度的表示文本,使文本的语义信息得到最大限度的保留。在模型训练阶段,本文采用协同训练算法进行分类器训练,多文本表示的方案能够获得更多的语言视图,更好的发挥协同训练算法的优势。与其他几种跨语言方案的对比实验表明,本文所提出的方案能够明显提高分类性能。
其他文献
基于单片机SPCE06lA控制电路,研制了一种电动车用智能充电器。详细叙述了硬件电路的工作原理、SMBus通信线路以及软件实现。实验结果表明:该充电器能正确监控和测量蓄电池状
在新一轮对外开放和"一带一路"建设中,广西担负着"有机衔接的重要门户"和"西南、中南新的战略支点"的重要功能。本文以对广西口岸办、凭祥铁路口岸、钦州港口岸的实地调研为
控制冠心病相关危险因素是治疗冠心病和控制病情发展非常重要的途径之一。随着中医药对本病的深入研究,近年来大量的关于中医药干预治疗冠心病的文献见诸于报道,兹从冠心病危
目的探讨鞘氨醇激酶-1(sphingosine kinase 1,SphK1)与1-磷酸鞘氨醇(sphingosine-1-phosphate,S1P)在子宫内膜癌的表达和意义。方法收集正常子宫内膜和子宫内膜癌患者血浆,行
论文是有关土壤淋洗技术的综述性论文。土壤淋洗的作用机制在于利用淋洗液或化学助剂与土壤中的污染物结合,并通过淋洗液的解吸、螯合、溶解或固定等作用,达到修复污染土壤的
以文冠果新品系"森淼"休眠枝水培嫩枝为外植体,研究了消毒时间对启动培养、植物生长调节剂对增殖培养与生根培养的影响,以建立一种启动培养污染率低、增殖系数与生根率相对较高
本文从分析《跨大西洋贸易投资伙伴谈判协议》(TTIP)入手,简要介绍TTIP谈判的背景及基本内容,借此了解TTIP谈判至今的开展情况,以及美欧双方开展TTIP投资贸易谈判的战略目的,
目的:探讨早期机械通气及亚低温联合治疗对急性重度颅脑损伤的疗效。方法:本次实验以本院2010年1月-2011年1月所收治的50例急性重度颅脑损伤患者为实验对象,将患者随机分为实
近年来,国际工程市场中设计——施工及设计——采购——施工总承包项目所占比例越来越高。在设计——施工总承包项目中,安全、经济、技术优良的设计成果以及完善的后续设计服
目的:观察电针不同刺激参数对单纯性肥胖患者相关指标及胰岛素抵抗的影响,以此探讨针刺减肥的最佳刺激参数,为临床治疗肥胖症提供科学有效的参考。方法:将80例单纯性肥胖症患