基于知识元和集成学习的中文微博情感分析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:fengliguo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博是目前最流行的社交网络平台之一,是可以自由发表观点的地方,这些观点涉及商品评论、舆情事件、娱乐评论等,同时,微博数据的易获取性也为其情感分析的研究提供了便利性,使得微博的情感分析成为国内外学者们研究的热点。本文提出了借助知识元理论构建的微博情感知识集的方法,并使用提取的情感知识辅助微博特征提取和扩充以及情感对象的识别,最后使用多个不同分类器集成的方法完成对微博的情感分析任务。论文提出了构建微博情感知识集的方法,采用知识元理论作为微博情感知识集的表示方式。该方法首先通过查阅资料和在其他新闻网站上搜集资料,构建初始的微博情感先验知识集,然后通过基于条件随机场的方法借助构建的初始微博情感先验知识,自动抽取出微博语料中的情感对象知识元,进而通过去重等程序获取最终的微博领域情感知识元集,最后利用XML格式文档将获取的微博情感知识存储起来以便使用。通过使用不同领域的微博语料进行实验,证明该方法的可行性和有效性,为后续微博情感分析提供支持。论文还提出了基于异态集成学习的微博情感分析方法,该方法针对微博数据来源广泛,涉及领域较多的特点,选用微博情感分析中常用的四类分类器进行集成,集成方法在原来简单投票法的基础上进行了改进,引入了贝叶斯决策的方法进行投票,利用各个分类器训练后的混淆矩阵作为先验知识进行决策分类。微博特征稀疏的特点给微博情感分析带来困难,基于这个原因,我们利用微博情感知识集对其特征进行了扩充,充分利用微博社交化的特点,增加了微博结构特征,提高了情感评价对象识别的准确性。为了研究多个组合特征和不同分类器集成对微博情感分析的影响,论文采用“控制变量法”的思想进行了交叉实验,实验结果表明了本文提出的微博扩充特征和集成方法对微博情感分析是有效的和可行的。
其他文献
“我认为中华文化是世界上最了不起的文化,许多宝贵的经验都值得借鉴。我个人特别喜欢老子的‘有生于无’与‘合抱之木,始于毫末’。我觉得老子是倡导‘纳米管理’思想的第一
2012年9月,嫩江县科洛镇双泉村党员孙国君伙同他人,违反国家相关政策规定,擅自将配置给合作社带有国家农机补贴的农机具私分,归个人所有,自己从中套取补贴款27100元.案发后,
急性肾损伤(Acute kidney injury,AKI)是由不同原因引起肾脏滤过功能短期内急性减退或丧失导致的临床综合征,院内病死率高,医疗资源消耗大。近年来,AKI的发病率持续升高。我
城市建设为地下空间开发提供了广阔的前景和强大动力,同时也给岩土工程学科提出了严峻的挑战.地下空间开发不可避免地涉及基坑开挖支护、桩土相互作用、深基础抗浮以及埋深基
唐人婚恋题材小说中的某些作品,弘扬了一种超越现实各种束缚的主观追求精神,这不仅给人以思想的启迪和感情的陶冶,而且还给人以人格的提升和审美的享受。其中两种模式——"心
介绍中信重工机械股份有限公司重型热处理工部井式炉箱形梁的制作过程,以及大截面、大跨度、高强度厚钢板和单根重量大的箱梁制作难点,并且对焊接技术要求等方面进行阐述。
在新时代,中国经济已由高速增长阶段转向高质量发展阶段。在这个转变发展方式、转变增长动力的攻关期,市场要走向新均衡,企业要走上新治理、实现新增长。该如何走上新治理、实现
文章首先对正念训练进行了概述,然后指出正念训练在高校心理健康教育中的优势,最后论述了正念训练在高校心理健康教育中的实践:运用正念训练提升大学生的注意力;运用正念训练