面向微博评论的观点挖掘系统的设计与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:din6688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着网络技术的飞速发展和计算机的普及,互联网已经成为人们发布信息和表达观点的重要媒介。作为新兴社交媒体的代表,微博为社会舆论积聚和传播提供了空前的便捷空间,用户可以在微博上浏览自己感兴趣的信息,发表自己的看法;也可以在微博上发布内容供别人浏览。作为庞大的社交网络平台,微博中的热门话题会受到广大用户的关注和评论,而关于热门话题的评论反映了广大用户对于该话题的态度和观点,因此针对热点话题下的评论进行观点分析和挖掘,对于全面掌握舆论动态、了解民意具有重要的现实意义。目前,虽然基于微博的观点挖掘已经得到了学者的广泛重视与研究,但是如何准确的、有效的对微博中的短文本评论数据做观点挖掘仍需进一步的研究与探索。由于微博的公开性、匿名性、方便性等特点,微博平台成了垃圾评论滋生和传播的土壤,热点话题下的评论数据难免有与热点话题毫无关系的垃圾数据,其中含有情感倾向性的垃圾数据严重影响观点挖掘的准确性。因此,在挖掘观点之前,本文提出了垃圾数据识别的方法,去除评论中无关数据,可以有效的提高热点话题下评论用户观点分类的准确性。本文首先分析了微博平台涉及的相关技术,通过OAuth协议连接到微博平台,得到受保护资源拥有者的访问权限,基于微博爬虫二次开发获取微博数据,并将其存放在MySql数据库中。接着分析微博数据中不同的垃圾数据形式,提出不同的垃圾数据识别的方法,主要包括显性垃圾数据识别和隐形垃圾数据识别,然后设计并实现了基于支持向量机(Support Vector Machine,SVM)观点分类模型,对垃圾预处理后的评论数据做情感倾向性分类。最后,本文设计并实现原型系统,对实验结果进行分析,并以表格的形式展示结果。
其他文献
多少你我他共有一片蓝天 岁月的风霜雪雨在所难免 都是兄弟姐妹总在相互地挂牵 真爱就像那阳光 渗透进彼此的心间
期刊
求积是微积分学中两个基本问题之一,而计算定积分又是求积问题中的最基本又最重要的问题,它涉及许多实际问题的计算,下面对这个问题作一个详细的讨论.
冶金企业在煤气报警方面,以往因为技术发展相对比较落后,基本只有两种方式。其一,工人手拿报警仪轮班进行现场巡查;其二,将独立煤气报警仪安装到现场,员工路过的区域,煤气泄
近年来,不论是新闻主管部门,还是新闻行业协会,都高度重视虚假新闻的治理。在一起起公开通报的案例中,相关责任人被撤职的有之,被辞退的有之,被列入不良从业行为记录的有之,但虚假新
报纸
天瑞集团始创于1982年,经过三十余年的发展,已成为集文化旅游、制造业、互联网物流为主体的股份制企业集团。近年来,天瑞集团累计投入2.3亿元,建立了适应集团发展需要的一体
报纸
【正】《动态》:5月7日乐视网正式发布"超级电视",这股你重点推荐过,消息一出果然是连续涨停。孔铭:乐视网太会择日了,选择在移动互联网大会在京召开的这天来开新品发布会,恰
新教育实验发起人朱永新教授说:“一所理想的学校应该有一个面向所有学生的课程体系。”日照市金海岸小学是2008年市政府为民办实事重点项目。建校之初,学校就秉承“为每个学生
期刊
5G及其链接和衍生的众多新科技让生活方式到商业模式,都面临再次被颠覆的可能。技术的日新月异,移动互联网应用的繁荣,创新浪潮的蓬勃发展,将对财产保险行业,特别是中小产险企业带
报纸
本文针对城建档案的文化属性与开发利用的相关内容,作了简单的论述.城建档案作为城市发展建设的重要依据,有着极高的应用价值.从城建档案开发与利用实际情况来看,还存在着档
奥尔堡PBL模式产生于奥尔堡大学建立之初,经过30多年的发展,已经成为基于问题学习模式的典型代表之一,引起世界各国的广泛关注。$$丹麦奥尔堡大学(Aalborg University,简称AAU)是19
学位