面向中文文本的情感分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiaoyaozhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展催生了各种网络社交平台。用户在网络社交平台上发表个人观点、评价产品等行为逐渐成为了日常生活的一部分。利用自然语言处理和机器学习技术对海量的用户文本数据进行分析,挖掘用户对特定事件、人物或产品的态度和评价,成为网络舆情监控和产品售后信息反馈的重要途径。因此,面向文本的情感分析方法研究具有很高的实用意义和商业价值。本文分别对中文文本情感分析研究中的文本情感特征提取和表示以及迁移学习这两个方面进行了研究。首先,现有的文本情感分析技术在文本的情感特征提取及表示方面,缺乏对深度学习模型和情感计算资源进行有效整合的方法。针对这个问题,本文研究了结合卷积神经网络和词语情感序列特征的中文情感分析方法。该方法以词语为研究单位,结合卷积神经网络和已有的情感计算资源,实现文本数据到文本情感特征向量的映射过程。在COAE2014微博情感倾向性判别的数据集上的实验结果显示,该方法相比于基线系统在正面情感倾向性判别和负面情感倾向性判别的F-Score上分别获得了0.97%和1.58%的提升。这一工作为融合深度学习模型和情感计算资源提供了一种可行的思路,有望成为文本情感分类研究的新方向。文本情感分析数据大量存在领域相关性和样本选择偏置的问题,影响了最优分类模型的构建。为此,本文从构建符合测试数据分布的训练数据集的角度出发,分别研究了基于k近邻的实例迁移学习方法、基于分类器迭代选择的实例迁移学习方法和基于高斯过程的知识迁移学习方法。在COAE2014微博情感倾向性判别的数据集上的实验结果显示,这三种迁移学习方法相比于基线系统,在文本的情感倾向性判别的整体性能上均获得了提升。其中,基于高斯过程的知识迁移学习方法取得最好效果,在正面情感倾向性判别和负面情感倾向性判别上的F-Score分别获得了5.01%和2.94%的提升。这一工作有效地降低了文本情感分析数据的领域相关性和样本选择偏置问题给分类模型带来的负面影响。
其他文献
<正>门德斯忽然有了创意:自己乔装成爱尔兰电影制片人凯文·科斯塔·哈金斯,带领着他的前期制作团队进入伊朗勘景。电影必须是好莱坞大制作,因为在人们的印象中,只有好莱坞那
介绍浙江中控有限责任公司生产的ECS-100控制系统在我厂410t/h燃煤锅炉扩建工程中的应用及该系统的软硬件结构特点,详细阐述控制系统各站功能分配及逻辑运算实现。
目的 :观察益气活血复方对记忆障碍小鼠学习记忆能力的影响。方法 :采用东莨菪碱、乙醇致小鼠记忆障碍模型。结果 :益气活血复方 ( 6 2 5 g生药 /kg、12 5 g生药 /kg、2 5
党中央、国务院三令五申,要求精简会议和文件。地方政府也纷纷出台文件,明确要求切实精简会议,少开会,开短会,推广视频会议,严格控制视频会议时间和参会对象等、自从“节俭新风”吹
<正>一直以来,B级车都以大空间和丰富的功能配置而成为公商务用车的首选。纵观国内近年来上市的多款车型,一汽-大众迈腾正是凭借卓越的商务特性定义了B级车的新标准,彻底改变
叶燮“理、事、情”说三者的客观性似已成为定说,但笔者认为其中“情”的虚位性正是破解三者非客观性的关键。本文从叶燮对“情”规定性的重新解释,以“情”的虚位以待性,“
随着现代科学技术的进步,带给人们更多选择空间和可能。建筑领域在主流风格的作用下,衍生出大量新型装修装饰的材料。而装修材料的主要功能是体现设计风格,特别是在营造室内
<正>2018年3月31日,《中国大百科全书》(第三版)语言文字卷学科编委会第二次扩大会议在北京平安府宾馆召开。出席本次会议的代表有:《中国大百科全书》(第三版)语言文字卷主
20世纪后20年学界是袁枚研究史上的丰收期,有关袁枚研究的种种课题均获得了全面的探讨和深入的开拓。生平研究上,《袁枚年谱》考释详明而持说公允,超迈前贤。随园诗学诗作研