论文部分内容阅读
iPhonel的诞生从很大程度上促进了传统社交网络的移动化趋势,现如今移动社交网络已经成为人类日常生活中必不可少的一部分。Twitter和Path等高质量的移动社交网络能够在短期内积累大量用户,而Facebook、人人等大型传统社交网络服务也在加快移动设备的部署。我国最大的移动社交网络是新浪微博,截至2012年6月已经积累了3.5亿用户,其中超过60%的用户使用移动设备进行登陆。由于移动社交网络与复杂网络模型的相似性,可以将移动社交网络用户作为节点,用户与其他用户之间的关系作为该节点的有向弧,构造复杂网络模型。本文以新浪微博作为研究对象,克服网络爬虫局限性,依据新浪微博开放平台API接口限制,构造算法,在保证内存分配的情况下减少对API的调用,共收集了2999个用户节点、232623条连边的样本,构造模型并对其从三个方面进行了研究:在复杂网络结构及特性方面,本文通过计算发现样本网络的平均入度达到了77.57,而最大直径为6,验证了六度分离理论在新浪微博用户网络中是成立的。本文发现该样本网络的入度分布服从幂率分布形成了一个无标度网络;出度分布服从指数分布形成了一个ER随机图。在新浪微博与Twitter的比较中发现新浪微博的网络密度和节点重要性控制都不如Twitter。在复杂网络鲁棒性方面,通常的研究方法是针对复杂网络进行结构上的随机故障与蓄意攻击的模拟,此外,本文还进行了一种更符合实际情况的蓄意性随机攻击模拟。蓄意性随机攻击模拟要求在进行攻击时,依概率损毁重要节点,改变节点状态,使之成为普通节点,对普通节点则直接进行删除。蓄意性随机攻击更适合新浪微博网络中用户遭受攻击侯的实际情况。模拟最终发现新浪微博网络具有出人意料的鲁棒性。在复杂网络的用户群体发现方面,本文介绍了社团结构的定义以及划分社团结构的两种方法——谱系聚类算法以及GN算法。本文采用谱系聚类方法进行了节点聚类,并首次绘制出了新浪微博的两种网络结构图,在研究中并未发现明显的社团结构。本文最后,对移动社交网络数据挖掘提出了一些建设性意见供参考。