【摘 要】
:
微博客是继博客后迅速发展起来的一种新的社交网络形式,在信息传媒领域形成了很大的影响力。对于传统的社交网络形式,数据的获取与分析技术已日趋成熟,但对于微博网络数据的
论文部分内容阅读
微博客是继博客后迅速发展起来的一种新的社交网络形式,在信息传媒领域形成了很大的影响力。对于传统的社交网络形式,数据的获取与分析技术已日趋成熟,但对于微博网络数据的获取及微博网络特性的研究,还不够完善。本文研究了微博的特点及作用,微博数据获取的两种技术,以新浪微博为例,设计并实现了微博数据获取与分析系统,仿真并分析了微博网络的网络特性。本文主要的工作目的是在获取微博数据的基础上,分析微博数据,由此得出微博网络的特性。具体的工作如下:1、研究了使用网络页面爬虫获取数据的相关技术,包括通用网络爬虫,聚焦网络爬虫,网页预处理,文本分类等的基本原理和工作流程。2、深入研究了利用微博系统的SDK获取数据的工作流程,该技术通过调用微博平台提供的API来获取用户数据,调用API需通过用户身份的鉴权,目前主要用到的是OAuth鉴权,该方法步骤简单,抓取数据的准确度和效率高,本文应用该方法获取微博数据。3、从简化认证步骤,提高获取效率,避免重复爬取等方面考虑,对SDK程序进行了改进,经多次实验证明经过改进的程序能长时有效的获取微博数据,此方法获取的微博数据作为研究微博网络特性的数据集。4、设计了微博数据获取和分析系统的总体框架,系统的数据库,功能模块和界面,实现了微博的数据获取和分析的基本功能,借助于该系统可对微博网络做更深入的研究。5、对微博的网络拓扑,节点的入度分布,出度分布等进行了分析,通过分析得出微博网络具有小世界特性,无标度和高聚类特性。
其他文献
未来社会,移动数据将会呈现爆炸式增长,新应用场景的诞生,各种新型业务需求的出现以及移动设备,物联网设备的层出不穷,第五代移动通信系统就此出现。5G将会如4G一般充斥在生
近年来社交网络服务发展蓬勃,在全球拥有大量用户,社交网站已成为影响力巨大的信息平台。掌握社交网络中用户的行为、特征以及信息传播规律,不仅能够帮助企业根据用户行为特征提
早在上个世纪50年代末,美国军方就开始了子午仪卫星定位系统的研究工作。为获得更高的定位精度,满足美国军方及民用的迫切需要,美国海军研究实验室(NRL)在上个世纪60年代末逐
21世纪是以网络为核心的信息时代,网络已经成为信息社会的命脉和全球经济发展的重要基础。Android是最新的手机操作平台,从它推出至今一直是程序员热衷开发的对象。而将Android
计算机视觉是一门研究如何利用计算机实现人类视觉功能的科学,更确切地说,就是指利用照相机和计算机代替人眼,完成对客观三维场景的感知、识别和理解。双目立体视觉是计算机视觉
人机交互(Human Computer Interaction,HCI)技术为人与计算机之间信息沟通提供了一个良好便捷的途径,因而成为了目前计算机领域的一个研究热点。基于视觉的手势识别(Hand Gestu
最近几年,随着3G网络的发展和手机终端的普及,移动互联网拥有了强劲的发展势头。随着移动互联网的快速发展,移动视频监控也开始进入人们的视野。移动视频监控不仅具有传统监
图像插值在图像处理领域发挥着重要作用,它被广泛的应用于各种领域中。传统插值算法模型简单,计算量小。它们之间的区别在于映射点周围像素序列的取法不同。线性算法对于图像
大规模MIMO(Multiple-Input Multiple-Output,MIMO)技术在基站端配置大规模天线阵列(通常为几十根或者数百根天线),通过增加空间自由度为通信系统获取复用增益和分集增益,不仅能使系