中文短文本情感倾向性分析研究

被引量 : 0次 | 上传用户:DragonJiang2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,以网上论坛、微博等形式为主的带有个人情感色彩的言论信息迅速膨胀,这些言论信息多数是人们对网购商品、影视作品、公众人物、热点事件等发表的评论,蕴含着巨大的商业价值和社会价值,分析这些信息具有很大的现实意义。文本情感分析是指通过分析和挖掘文本中的表达情感、观点和立场的主观性信息并判断其情感倾向。它涉及计算机语言学、机器学习、信息检索等众多领域,具有广泛的应用价值。目前针对中文的情感分析仍处于起步阶段,各项技术尚未成熟,情感分析系统由实验走向实用,还有很长的路要走。本文以微博消息为研究对象,针对句子级中文短文本的情感倾向分析进行研究,主要内容涉及以下三个方面。首先,构建了多分类情感词典。通过对情感词的极性分析,提出将情感词分为静态情感词、动态情感词、网络热点词和情感短语四类,并对动态情感词的极性判别方式进行研究。其次,提出了基于规则过滤和机器学习的观点句识别方法。根据微博语言特点,制定观点句和非观点句的过滤规则,并设计了基于上下文滑动窗口的观点句规则匹配算法。然后针对机器学习分类方法中观点句的特征提取方式进行了研究,对观点句的特征选取方式进行了创新,不但抽取了传统信息处理方法中的普通文本特征,还针对微博的自身特点提取了相应的特征。最后,提出了多策略观点句极性判别方法。根据不同的观点句类型,分别采用基于情感词典、基于机器学习和基于依存句法分析三种方法对观点句的情感极性进行判别。其中研究了基于机器学习情感分类方法中褒义句和贬义句的特征选取,提出了基于依存句法分析的情感依存关系对抽取方法和句子情感极性判别方法。实验以提出的情感分析方法为基础,借助中科院分词工具、哈工大依存句法分析工具以及LibSVM工具包,共同构建了文本情感分析处理系统,并以NLP&CC2012评测语料作为测试数据进行了句子级短文本的情感分析。实验结果表明,本文提出的短文本情感分析方法在准确率和召回率方面均比改进前有较大提高。
其他文献
这篇博士论文旨在建立一个评级系统,通过采用神经网络模型来评估银行信用风险。我们通过对评估结果的分析来发现银行在信用方面存在的弱点的原因并采取相应措施来控制风险。
林(果)粮间作是现代农林复合生态系统的重要形式,以其高产、高效和稳定的生态经济效益被广泛应用于生产实践。但是,由于化感效应引起的种间关系不协调将导致林(果)粮间作中作物生长
古诗文作为中国古代书面语言,是中国古代文化的重要载体。它有着悠久的历史文化内涵,是中华民族文化的“国粹”;它还有着极高的文学价值和审美价值,是中国传统文化中最璀璨的明珠
目的构建BALB/c小鼠Graves病(Graves Disease, GD)模型,制备具有生物活性的抗细胞间黏附分子1(intracellular adhesion molecule-1, ICAM-1)的单克隆抗体,研究131I及抗ICAM-1
论文论述了汽车保险销售的渠道,汽车保险销售的方案与流程,汽车保险销售的技巧与话术,以及汽车保险销售的险种介绍,着重是对电话销售保险的技巧与话术进行探讨。人们将汽车保
当今社会,信息已成为与物质、能源同等重要甚至更为重要的资源。当信息数量呈指数次方飞速增长、各式各样的信息扑面而来,使我们应接不暇之时,基于对海量、碎片化信息进行分
劳务派遣用工是市场经济中一种特殊的用工方式,这种用工方式与传统的用工方式之间存在的不同之处在于“雇佣”和“使用”的分离。由于劳务派遣用工的特殊性,《劳动合同法》和
软式排球是新兴的体育运动项目,呈现出强大的生命力,受到群众的喜爱。山西省软式排球运动的发展需要得到政府的支持,逐步培养师资队伍,组织不同层次的比赛,寻求企业参与赞助,
本研究是高中生模糊容忍性高低与英语短文填词答题表现的相关性研究。研究中以费斯汀格的认知失调理论、心理学上的认知需要闭合理论以及基于动态建构主义取向的文化框架转换
随着我国高等教育事业的发展,高校教师群体逐步壮大;与此同时,高校教师的各项权利并未受到法律的有效保障。因此,必须从宪法的高度来明确高校教师应当享有的基本权利,以此为基础来