论文部分内容阅读
随着科学技术的发展,移动通信已经成为人们日常生活中必不可少的交互方式之一。运营商作为移动通话服务的提供者,积累了大量的用户通话数据记录。根据用户通话数据记录,可以构建移动通话网络,形象的描述移动通话主体,以及主体之间的交互关系。类是网络中普遍存在的结构性质,反映了网络中节点的群体性行为。通过聚类可有效识别具有相同性质的节点,深入理解节点的行为模式。网络中节点的重要性程度是不一样的,重要节点一般有很大的影响力,或者居于网络信息传输的关键位置,重要节点的识别有助于发现信息传播模式,实现信息的加速扩散。基于图挖掘的网络中节点聚类和识别一直以来都是大规模网络数据分析中重要的研究课题之一,众多研究者已经做了大量的研究工作。目前有关移动通话网络的研究主要集中在移动通话网络的统计分析上。本文采用图挖掘技术,运用介数的思想设计实现了移动通话网络中节点的聚类和识别研究。论文的研究内容主要包括以下几个方面:1.对基于边的介数无向图聚类算法加以改进,成功将算法扩展至有向加权移动通话图的聚类情境中,可有效处理边的方向性和权值诱发的新问题;2.对割点连接不同类的情况,提出了有向加权移动通话图割点分裂方法,可有效发现割点连接的不同类;3.根据聚类产生结果,设计实现了类内部核心节点和信息传播路径关键节点的识别;4.基于重要节点识别,给出了移动通话图中基于信息流模式的节点类的挖掘方法。本文利用MIT人类动力学实验室所收集的SocialEvolution和Friends and Family两个数据集验证算法的正确性和效率。论文的研究成果对运营商精确划分用户类别,设计面向特定用户类的激励机制,以及结合推荐系统相关技术进行业务推广有一定的借鉴意义。