微博分析研究综述

来源 :河北科技大学学报 | 被引量 : 0次 | 上传用户:hellomfc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。
其他文献
介绍铝带拉伸弯曲矫直机组电气控制系统的系统组成、控制方法、程序设计思想及实际应用效果.
目前,休闲农业与乡村旅游成为旅游中的热门支点,不仅缓和了城市居民的压力,还增加了农村的就业机会,优化了农村产业结构,对于新农村乡村建设和文化建设都有着重大的意义。从
由于建筑工程项目“一次性”和“临时性”的特点,建筑工程行业集成化较低,企业间不信任、敌对的竞争关系普遍存在。为了保证利益最大化和风险最小化,任何一个企业都试图将风
目前传统的审计课堂教学普遍偏重对审计理论的讲授,缺乏对学生解决实际问题能力的培养,难以满足培养高素质审计人才的需要,审计教育改革也就成为教育界关注的焦点。本文以审
本文首先给出了向量组的秩的一般教学思路,然后讨论了在教学过程中出现的问题,最后给出了解决这个问题的方法.
内蒙古地区依托自身的优势资源发展生态草原旅游,推动了内蒙古地区经济的发展,但在开发过程中还存在许多问题,制约了该地区生态草原旅游的可持续发展。着重分析了内蒙古地区
为了提高云计算环境下的著作权保护水平,完善著作权保护评价体系,针对云计算环境下的著作权保护评价无法量化的问题,分析了著作权保护评价流程,并综合考虑平台环境、信息资源
以研究河北休闲观光农业旅游的开发现状为基础,从中分析出其长期发展存在的问题;并进一步以京津冀一体化为发展背景,发现河北休闲观光农业旅游具巨大的开发潜力,对其分析研究
随着计算机、网络通讯技术的发展和世界经济一体化、全球化进程的加快,信息技术越来越广泛地应用到商贸领域,电子商务在商贸活动中占据着重要的地位。本文试图通过对数字产品
针对农民与"三农"专业人员能及时方便互通的需求,设计以移动互联网的微博、飞信等为载体的快速信息交互平台模型,该平台模型降低了农民信息交流的门槛,只需要手机即可,简捷快