论文部分内容阅读
随着人们通过移动网络的交往越加频繁,电信运营商积累了越来越多的个人信息以及用户行为数据,这些数据具有非常大的价值。如何对这些数据进行分析,使用这些数据建立模型,从而辅助运营,并为用户提供更好的服务,是一个非常有意义研究课题。本文从个体和群体两个角度进行分析研究。从个体角度出发,在辅助运营方面本文以用户特征为基础,以未产生过通话行为的新用户为研究对象,对其进行价值预测。由于引入分位点,对客户类别的标注不再根据经验指定具体的边界值,而是采用相对的概念进行类别划分,所得的结果也是客户的相对价值。同样从个体角度出发,在为用户提供服务方面以行为特征和用户信息为基础,以已产生过通话行为的用户为研究对象,对其进行有针对性的好友推荐。推荐算法中基于云计算来实现二度好友熟悉度的计算,通过好友特征间接描述用户偏好。除了从个体角度对用户信息及通话网络进行分析,本文同样从社团特征和社团演化这两个群体角度进行了分析研究。在从个体角度进行研究时,不论是新用户还是已产生通话行为的用户,研究对象都是单独的用户,而从群体角度进行研究时,研究对象是多个用户,群体内部成员之间具有较多的联系,我们用社团来定义这个群体。从群体间通话行为网络的拓扑结构出发,本文在电信社团特征描述中提出一种基于统计归一化的社团结构描述方式,并存储在以BigTable为框架的一个存储结构中,一次计算,多次使用。在实证研究部分,从社团整体长途通话,社团整体对外通话,社团整体通话次数分布等多角度分析电信社团的特征,从而提供一个对社团研究的不同思路。从群体角度研究时,除了以拓扑结构这种静态方式研究,同时研究其在时间轴上的动态特性,即社团演化。对于基于云计算的电信社团演化,实现了高效的社团演化并行算法,并提出社团演化信息数据结构来支持演化路径追踪。