基于蜂窝网络数据业务的用户聚类研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zldingkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着移动互联网的发展,蜂窝网络中的数据量呈爆炸式增长,电信运营商的话音等传统业务的收入不断萎缩,其自身产品的用户粘度也不断下降。如何利用蜂窝网络中的海量用户数据挖掘出有价值的用户行为模式,建立恰当的用户行为特征模型以优化用户的产品体验并提高营销的准确度,成为了近年来研究的热点。而聚类技术作为一种无监督学习算法,非常适合于探索数据中隐藏的模式。本文基于从运营商采集得到的海量蜂窝网络业务数据,分别从时间维度和空间维度开展了用户聚类的研究。论文的主要工作包括:一、重度用户的提取。本文通过绘制用户流量的劳伦兹曲线发现了用户的流量使用分布得非常不均衡,21.2%左右的重度用户消费了81.85%的流量;接着本文提取了部分对蜂窝网络有重要影响的重度用户进行研究,从流量使用、活跃时长、业务种类数、移动性这四个方面与普通用户进行了对比,结果表明,重度用户在流量使用、活跃时长和业务种类数方面都超过普通用户,而在移动性方面与普通用户没有明显差异。二、时间维度的用户聚类,发掘重度用户的流量使用模式。本文研究了时间维度的用户聚类和能够表征用户对不同时段偏好的特征向量。特征向量的创建过程为:将一天24小时按照生活规律分成5个时段,计算每个时段占全天的流量比值,除以该时段的小时数,构成用户的特征向量。接下来选择K均值算法进行聚类,并根据三种评估指标得出最佳聚类簇数K为4,这4类用户分别偏好在睡前、休闲、上班、通勤/用餐这四个时间段使用更多的流量,为运营商进行网络优化、精确营销等提供参考依据。结果表明,在时间维度上使用本文提出的具体聚类流程和创建特征向量的方案可以有效挖掘出不同用户的流量使用模式。三、空间维度的用户群组聚类,发现具有潜在高价值的用户群组。本文研究了空间维度的用户群组的聚类和能够表征用户群组价值高低的特征向量。用户群组的划分方式为:重要基站(用户在一段时间内使用流量最多的基站)相同的用户划分为一组。用户群组特征向量的创建方式为:把群组中每个用户的三个连续属性——数据流量、移动性(访问基站个数)、业务种类数进行离散化,根据离散化结果将每个用户投射到三维空间中的一个子空间中,用群组中落在每个子空间的用户比例作为该群组的特征向量。经过评估发现无法得到最佳结果。在排除了聚类算法选择不当的原因后,重新创建特征向量,仅使用数据流量和移动性(访问基站个数)两个维度,并提取热点基站进行研究,聚类结果评估发现最佳聚类簇数K为3或4,分析聚类结果时发现了具有潜在高价值用户的用户群组。结果表明,在空间维度上使用本文提出的具体聚类流程和创建特征向量的方案可以有效挖掘出具有潜在高价值用户的用户群体。
其他文献
随着广宿主载体系统的发展,Tn5及其衍生载体已经广泛应用于革兰氏阴性细菌的分子遗传学研究。主要综述了Tn5转座突变技术在生防细菌生防机理研究、细菌必需基因的鉴定、病原
<正>近日《英国营养学期刊》发表了一项基于多类临床研究的科学综述,题为"开心果的营养属性与健康影响",通过分析100多项有关坚果摄入与健康的研究和临床试验,结果发现,在均
后发国家具有技术创新、制度创新、经验借鉴、精神动力、结构调整、人力资源等后发优势。后发国家的这种后发优势,实质上是指后发国家在工业化和现代化的进程中,具有向发达国
目的强调"寒热并用"法在治疗慢性胃肠病治疗中的作用。方法通过病案举例,介绍"寒热并用"法在慢性胃病中的应用,明确作者的观点。结果应用"寒热并用"法治疗慢性胃肠病疗效较佳
商业银行中间业务的顺利发展很大程度上取决于定价的合理性,本文对此进行了研究。本文首先分析了商业银行中间业务的定价特点及原则;然后研究了中间业务产品的定价目标;最后
矩阵的秩是矩阵的一个重要不变量。本文利用分块矩阵的特性,研究了几个特殊分块矩阵的秩,得到能写成[A B]和ACBA的0B的矩阵的秩与子块的秩的不等式以及等式成立的条件,同时
项目制教学特点之一就是课程不再局限于校内教室,而是打破学校与社会的屏障,将市场项目导入到课程中来。因此,需要为市场和学校搭建一座桥梁,设置一个项目制教学中心,为项目
反刍动物甲烷排放是大气中甲烷的主要排放源之一,本文简述了国内外反刍动物甲烷排放总量研究概况,及甲烷排放研究尚存在的问题和初步结论。
我国企业内部审计建制上的政府行为 ,导致内部审计地位不明 ,职责不清 ,发展后劲不足 ,与企业管理要求相悖。因此 ,我们应据现代企业的要求 ,给其以合理的定位。首先 ,应明确
就目前国内外对公路桥梁荷载横向分布系数的研究现状作了一个较全面的综述。国内从常用的三大理论计算法出发,讨论偏心压力法、修正偏心压力、弹性支承连续梁法、广义梁格法