基于文本数据挖掘的微博情感分析与监控系统

被引量 : 0次 | 上传用户:xiaochushang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网深入发展,移动终端技术逐渐成熟,社交网络已融入人们日常生活,越来越多的网民在社交网络上抒发个人情感、点评社会热点等,社交网络舆情分析有着至关重要的作用,受到学术界和产业界的普遍关注。微博作为一种新型社交网络,为用户提供了一种随时随地分享和获取信息的新型网络交流平台,微博用户数量逐年攀升,对微博数据进行情感分析,能够挖掘出微博用户对社会事件的观点想法,追踪事件的发展态势,进而更有利于舆情监控、谣言控制等工作的开展。为了更好实现微博数据情感分析和舆情分析目标,本文对微博进行细粒度情感分析,将情感类别划分为高兴、喜好、悲伤、愤怒、厌恶、恐惧、惊讶这七种类别。通过分析微博情感研究现状,并结合微博自身特性,本文提出了融合微博显性和隐性特征的情感聚类方法,开发了微博情感分析与监控系统,主要研究内容包括以下几个方面:1)分析微博短文本特性,提出了微博显性情感特征,主要包括微博自带表情符号、情感词,设计构建了表情符号词典与情感词典,并扩展了网络词语情感词典,充分考虑微博显性情感特征,将这些显性情感特性进行频繁挖掘,获取的情感特征项可以更好地保留原始微博的情感特征。2)提出了基于频繁项集语义隐性情感特征的聚类方法,充分考虑微博中语义这个隐性情感特征,首先基于显性情感特征定义微博频繁特征词集,利用最大频繁项集获得初始情感簇;针对初始簇间存在文本重叠情况,提出基于短文本扩展语义隶属度的簇间重叠消减算法,获得完全分离的初始簇;根据簇语义相似度矩阵,给出凝聚式情感聚类方法。最后,通过NLP&CC2013评测提供的训练语料数据验证文本方法的有效性。3)开发了微博情感分析与监控系统,并在“马航”事件真实微博数据集进行分析,验证了本文方法的微博情感分析与监控能力,同时还将情感分析结果进行了可视化展示。
其他文献
出版社是我国出版行业的一个重要组成部分,对繁荣我国的出版事业,促进社会主义精神文明和物质文明建设做出了巨大贡献。近年来,随着社会主义市场经济体制的确立,侵犯出版社专
采用阳极型气体离子源结合非平衡磁控溅射的方法,在单晶硅及Ti6Al4V钛合金基体上制备掺钨类金刚石多层膜(DLC/WC),利用俄歇电子谱(AES)、透射电镜(TEM)、X射线光电子能谱(XPS)及X射线
唐宋元是闽商形成与发展的早期、也是形成"亚洲海洋"的重要时期。唐中叶以来、在国际与国内形势的共同作用下,中国的经济文化开始向东南沿海区域转移。中国开始打破陆地经济
随着农业机械大量地使用,每年因磨损而淘汰下来的废旧轮胎有许多。江苏农垦淮海农场多名农机手们,把废旧轮胎切割后安装在粮食翻场机上,由于轮胎弹性好、韧度高和不易磨损等
卫星导航系统能够保障国家安全、促进社会发展,并为人民的生产生活带来极大的便利。随着北斗卫星定位导航系统的建设与试运行,北斗系统将逐步成为可以和GPS系统相媲美的GNSS
“4MAT”(Mode Application Techniques)教学模式是美国麦卡锡博士于上个世纪七十年代提出的一种动态循环教学模式。它有效地综合了脑科学研究成果,在科尔伯学习风格研究的基
现代主义诗人T.S.艾略特虽出生于美国,但由于他青年时期即定居英国,后又加入英国国籍和英国国教,因此常被视为是一位英国诗人或欧洲诗人。不过,在近年来的艾略特批评中,艾略
农村居民是我国无偿献血人群中巨大的潜在市场,然而从整体来看,农村无偿献血的推广和普及工作十分薄弱,文章回顾了《中华人民共和国献血法》实施以来无偿献血在中国农村开展
<正>哺乳动物脊髓损伤后,部分脊髓神经功能可自行恢复,如大鼠中胸脊髓半切后,损伤区域下方对侧的下行神经纤维可交叉到半切侧,半切侧下肢运动功能将在伤后数日到数周出现改善
为了总结全国中医药特色社区卫生服务示范区创建活动所积累的好的经验和创新做法,并从中提炼社区中医药服务工作规律性的实践经验。文章阐述了通过《社区中医药服务工作指南