网络舆情文本倾向性监测研究

来源 :南华大学 | 被引量 : 0次 | 上传用户:demon3214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,越来越多的人通过网络平台发表自己对身边的各种现象或政府出台的各项政策的看法,互联网已不仅是人们浏览查阅信息的来源途径,更成为人们交流看法、发表观点的地方,对于网络用户来说,互联网的兴起不仅方便了他们的工作,同时也走进了他们的生活。通常,人们对某种现象进行评论或者发表自己观点时,他们的情感倾向常常会伴随着文字表达出来,对与这种大众化的观点倾向的提取,无论是在商业领域还是管理领域都是具有巨大的实用价值的。分析文本的倾向性,是自然语言处理领域中比较热的一个研究点,主要的目的是判定一篇文章中针对评价对象所表达的情感倾向是正面还是反面。本文在研究现有的文本倾向分析相关技术的基础上首先构建了用于文本分析的语用资源,并以此为基础通过Stanford Parser(斯坦福大学句法分析器)来正确评估极性词上下文倾向性,然后使用支持向量机作为分类方法构建文本倾向性的分类器,并通过实验来验证算法的实际效果,以此算法为技术支持,构建了石鼓舆情监控系统的文本倾向性分析模块。主要的工作概括如下:  (l)对目前舆情监控和文本倾向性分析的进展做了相关的分析,并就相关的技术做了详细的介绍。  (2)针对语义资源缺乏的现状并考虑到在对文本进行倾向性分析极性词所扮演的重要角色,实际构建了一部领域极性词库。  (3)针对目前极性词上下文关系倾向丢失的现象,提出一种计算极性词上下文情感倾向的算法,通过此算法得到极性情感词上下文的实际倾向,在此基础上,运用LIBSVM构建文本倾向性的分类器。  (4)在研究理论的基础上,在网络舆情监控系统--石鼓网络舆情监控系统中实际的构建了文本倾向性分析模块,为用户了解舆情的走势提供参考。  本文的创新点主要是提出了一种以机器学习和句法分析相结合的文本倾向性识别算法,首先在大连理工大学的情感词汇本体的基础上扩展相关的特征词汇构建极性词库作为算法的语义资源,通过极性词库和句法分析获取特征项来构建相应的句子向量,最后通过支持向量机算法训练用于文本倾向性识别的分类器,并通过实验验证了算法的有效性。
其他文献
随着智能型移动设备的蓬勃发展,攻击者的兴趣逐渐从传统平台转移到了以Android为主的移动平台上。Android使用沙箱模型来实现应用程序之间的权限分离,在系统底层,仍然是Linux自
本文对软件开发方法和过程进行了探索性的研究工作,结合软件基础技术平台和业务基础软件平台的作用,提出了基于业务基础软件平台的软件自动生成技术研究课题。 本课题研
近年来,电信网的通信能力迅速增强,业务需求趋于多样化。为在日益激烈的市场竞争中取得优势,获得更高的收益,运营商必须提供更丰富的业务来吸引住用户,并努力提高网络利用率。为此
二维张量场图像处理算法是当今图像处理研究领域的热点之一,该算法在常规的图像处理中有非常突出的表现,然而本算法在国内图像处理领域尚未有系统的理论研究及其算法实现。
下一代网络是一种开放的网络体系架构。在这种体系结构中,用户的接入、信息/数据的传送、呼叫控制以及业务等以分层的形式实现了分离,从而使下一代网络中新的增值业务能够使用更
CMIN02系统是东信北邮信息技术有限公司推出的符合ETSI GSM CAMEL标准和中国移动通信集团公司CAMEL规范的移动智能网系统,目前已经在我国取得了大规模商用。CMIN02-SCP(Servic
生物信息学是一门综合数学、计算机科学和生物学等学科的交叉学科,是当今科学的研究热点之一。生物序列比对是生物信息学中的一个基本的、重要的研究问题,是生物信息学的基础,它
在以网络为计算中心的时代,迅速发展的无线数字通讯网络和便携式计算设备引入了一种全新的移动计算范型。然而,移动性约束使得移动客户总是断连或者拥有一个较窄的向上传输带
世界各国在发展网络教育时深刻认识到,用于课件制作的各类资源的可共享性和复用性对于网络教育的实用性和经济性具有决定性的作用,同时也是高质量、高效率课件制作的关键,而
随着无线网络和多媒体组播应用在近几年的快速发展,网络的异构性、动态性等问题也更为突出,分层组播技术的提出为这些问题的解决提供了新的契机,它是目前公认的在组播环境中