面向话题的微博情感分析研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:venly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动终端技术的发展以及2014年政务微博平台的建设,微博的发展越来越迅速。作为一种社会媒体与社交平台,微博拥有庞大的用户群体,其上的一个热点话题,往往会有上万条的主观评论,而这些评论一般都带有用户对该热点的情感倾向,通过对这些短文本大数据的研究,分析大众情感倾向,对舆情分析,营销预测都有所帮助。本文针对话题型的微博展开了研究,对其挖掘方法进行了比较,并对SVM算法进行了研究改进。本文研究主要包括了:微博主客观判定,基于词典的无监督分类,基于机器学习的有监督分类比较,SVM多分类情感分析研究以及SVM分类器的改进。面向微博情感有高兴,喜好,愤怒,悲伤,恐惧,厌恶,惊讶以及无情感分类。首先对微博进行主客观判定,对主客观文本分别用词性特征与文本特征两类特征向量表示,词性特征包括情感词、特殊符号、程度副词、人称代词以及词性2-POS对,文本特征分别用词频、TF-IDF、相对熵的来提取,并通过实验比较了提取效果,最终组成文本向量。分别用朴素贝叶斯和SVM的方式对主客观分类做比较。实验表明SVM具有较好的效果。其次对主观微博进行情感分类比较,其中有无监督的基于词典分类方法,词典采用了大连理工大学信息检索研究室中文情感词汇本体库,对情感词库进行了扩充,扩充包括表情扩充,网络词扩充,同义词词林扩充。然后对不同的情感加权方法展开了讨论。有监督的机器学习方法,采用SVM分类器,并比较了各种SVM多分类器的性能,包括一对一分类器,一对多分类器,以及二叉树分类器,提出了一种新的二叉树多分类构造方式,并通过实验证明其效果。最后对支持向量机原理展开研究,比较了不同核函数对微博多分类的影响,对径向基核函数(RBF)以及参数变量做最优寻参,采用了新的网格算法,新的算法提升了寻参效率,并且寻找到的参数对分类优化起到了一定作用。
其他文献
本文基于SunJXTA技术,提出了一个P2P的分布式计算平台Alata并在相应环境中对其性能加以验证。Alata在吸收P2P的动态性、容错性、异构性等特性的同时,针对分布式计算特点做了一
数字媒体技术与互联网技术的发展与融合,为数字内容产业的发展提供了机遇,但也带来了新的挑战与技术需求。数字媒体中与视觉相关的可视媒体是数字内容创作中最重要的素材,其高效
近年来,迅速发展起来的计算机辅助设计CAD和计算机辅助制造CAM业为实现纹织工艺自动化和印花前处理开辟了新纪元。在用CAD/CAM系统进行纹制工艺自动化和印花前处理,需要首先
  随着数字化技术的发展和多媒体数据的普及,基于内容的图像检索的理论和方法成为目前信息领域的研究重点。相关反馈技术已经被证实是一项强大的技术应用于可交互式的基于内
  随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术、站点动态重构技
国家“十五”攻关重大项目“网络教育关键技术及示范工程”从信息技术角度抽象出开展网络教育所必需的七大关键技术。“网络教育系统总体设计与集成”是该项目的一个子项目,
在线拍卖系统需要快速竞价传输、较大的带宽、及时的响应。没有网络的支持,现在绝大多数的在线拍卖系统都在拍卖服务器上进行所有的操作。因此导致了大量的竞价冲突,降低了在