论文部分内容阅读
随着移动通讯技术的迅猛发展和网络信息技术的发展,电话语音文字、视频通讯、网页文字语音等通讯模式迅速崛起并产生了海量多维度、异构数据,该类数据从不同侧面反映了人们的活动/消费特征,但数据的海量、异构等特性给研究人类活动规律带来很大的困难。针对这些困难,本文采用信息可视化的方法,从以下三个方面论述了基于移动通讯数据的用户活动可视分析工作:(1)基于移动通话数据的用户行为挖掘包含面向群体和个体两方面:针对群体性的人均消费分布挖掘,利用巴莱多定律和聚类算法K-means进行用户粗分和细分,并基于位置信息采用地理热力图挖掘城市居民消费水平、群体活动区域特征等;针对群体时间活动规律,采用主成分分析和多粒度时序热力图,完成群体活动时间规律和可能事件的挖掘;针对个体活动轨迹,完成动态轨迹分析,并提出了一种基于地理位置的个体活动模型构建及优化;针对个体社交关系,基于社交紧密度和力导模型构建了概率社交网络。针对以上网络图中存在的概率范围设置不确定问题,提出了一种基于自定义概率节点的改进方法,最后通过地图服务进行用户活动分析和社交关系分析并验证,实验证明该方法能有效识别用户社交关系。(2)移动通话用户行为可视分析设计中,针对数据的时间和空间属性,采用空间拓展和颜色映射等方式设计了时序热力图;针对不同个体活动轨迹数据在空间上或集中或分散,设计了一种基于地点信息增强的时空对比可视分析;针对分析任务的多样性设计了基于多视图协同交互的可视分析;针对数据维度信息复杂、规模庞大等特征,设计了基于时空的多粒度数据过滤方法。(3)基于Django框架的移动通话数据用户行为可视分析系统,针对分析任务的多样性开发了群体和个体的移动通话数据用户行为可视分析子模块,并以电信5个月20562730条记录为例,挖掘群体移动通话用户的时间活动规律、城市人均消费分布、城市消费水平、消费群体活动地域特征等;挖掘个体通话用户行为的活动轨迹、活动模型及优化、活动范围、活动位置、活动区域概率以及个体社交关系网络等,验证了本系统的有效性、实用性等。