移动通信网中的用户聚类与KQI分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yindiend
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的基于关键性能指标(KPI:Key Performance Indicator)和用户投诉的体验运维方式已暴露诸多弊端,如:发现问题具有被动性、局限性,解决问题精细化程度不足等。对于电信运营商来说,探索面向智能化运维的精细化客户体验管理是当前及未来的重要研究领域。面向客户体验生命周期中体验前、中、后三大环节,智能化的客户体验管理应具备如下能力:在业务发生前进行个性化用户偏好需求分析与预判,制定事前预防策略;在业务发生过程中快速发现体验问题、定位/定界问题并动态实时调整;在业务结束后基于历史数据学习进一步迭代优化网络,最终形成智能运维的闭环。本文的研究问题聚焦在体验前用户的个性化偏好行为建模、体验中的准确监测体验问题和定界问题的相关策略。得益于大数据技术的快速发展,电信运营商逐步具备了海量用户数据采集、存储和计算的条件和能力,上述问题得以广泛研究,但仍存在诸多挑战,如:数据规模巨大,体验管理复杂度极高;数据质量不高,体验信息难以准确刻画;体验异常成因复杂。针对上述挑战,本文具体研究内容包括:(1)移动用户的业务行为偏好建模,该研究针对大规模用户的精细化体验管理面临的实现复杂度超高的问题,提出了基于于聚类的用户行为偏好建模方式,平衡精细化的度和体验管理的复杂度。针对Kmeans聚类方法存在的聚类速度慢问题,提出的AFKmc2+两阶段聚类算法:首先利用自组织映射思想将原始数据映射为数据原型,然后借助马尔科夫蒙特卡洛(MCMC:Markov Chain Monte Carlo)采样理论快速、合理选择原型初始聚类中心,最终利用Kmeans完成快速聚类。针对基于双侧正交约束的非负矩阵分解(tNMF:Tri-Non-negative Matrix Factorization)的双向聚类算法存在聚类个数事先未知、频繁大矩阵相乘及硬聚类策略导致聚类效果差问题,提出的H-tNMF算法:借助密度聚类思想实现聚类维度可伸缩,减少频繁大矩阵相乘操作;引入分裂层次聚类思想自动确定聚类个数;定义双向簇紧致度概念,实现子簇维度共享软聚类,避免错误累积。利用公开数据集以及现网用户数据集验证所提算法性能,实验结果证明:相比于AFKmc2算法,AFKmc2+在具有更快的聚类速度的同时具有相接近的聚类精度;相比于tNMF算法,H-tNMF在相同聚类数目下具有更好的聚类效果,且支持软聚类。(2)网络侧视频点播业务卡顿识别,该研究针对采集条件制约导致的视频传输状态数据质量不高问题,提出基于特征构造结合黑箱策略的卡顿建模方法,方法克服数据中存在的偏差,可以准确识别出视频卡顿、长卡顿和多次卡顿。通过分析导致现有卡顿识别方法准确率低的"时间漂移"现象,提出一种不进行视频重建,而只关注如何构建网络侧视频数据流和终端侧视频卡顿间的映射关系的黑箱策略。通过剖析视频卡顿机理,提出一种基于网络状态局部极差值的缓冲区剩余数据量估计方法(Freeze Divine)用于映射关系学习。所提方法将现有卡顿识别方案中的"重构+硬判决"的识别思路转变为"估计+数据驱动下的软判决"。通过构造现网视频卡顿数据集验证所提算法性能,实验结果证明:所提方法的卡顿识别准确率比现有方法高20%;Freeze Divine所提去的卡顿相关特征较其他特征与视频卡顿的相关性更强。(3)网络侧 HTTP 业务响应延迟(spRTT:Service Provider Round Trip Time)异常根因定界,该研究针对端到端业务体验异常成因不单一问题,提出基于多元线性回归的分治场景建模方法(DC-CoMo:Divide and Conquer based Context Modeling)和基于相对摘的贪婪搜索树构建方法(ReasonTree),高效标定异常,准确定界异常根因。提出DC-CoMo算法:利用层次维度聚合思想降低spRTT时序稀疏性;利用分治思想进行海量spRTT时序建模,权衡spRTT场景模型的复杂度和准确度;建模采用多元线性回归方法,综合考虑异常点及场景对spRTT的综合影响。针对现有业务KQI异常定界方法难以同时定界小范围异常根因、多维异常根因和多类型并存的异常根因问题,提出ReasonTree算法:算法首先利用相对熵量化场景属性对异常的区分度,定界小范围异常;通过构建搜索树的方式计算不同场景属性组合的异常得分,定界多维异常;利用贪婪迭代策略,识别异常主导原因并过滤对应数据,定界多类型并存异常;ReasonTree不基于历史定界结果,能够发现新的异常根因。利用现网HTTP业务spRTT数据集及人工注入异常数据集验证所提算法性能,实验结果表明:对于人工注入的三种异常根因,所提ReasonTree方法均具有超过95%的异常根因定界准确率;结合ReasonTree算法,DC-CoMo算法利用少量模型便可定界传统逐一建模算法约93%的异常根因。本文以自主研发的xDR-Pro和KQI-Doctor平台为基础,以现网多点实测的用户业务数据为支撑,通过对现有聚类、分类和异常检测等算法的使用和改进,研究了面向智能运维的精细化客户体验管理中的移动用户偏好建模、网络侧视频点播业务卡顿识别以及SP响应延迟异常定界问题。所提方法和策略为面向智能运维的精细化客户体验管理提供新思路。
其他文献
人才是企业的重要资源,未来的市场竞争中更多的是人才之间的竞争,由此可见企业要想得到更远的发展,必须要具备吸引人才、留住人才的能力.但是目前很多企业在人才管理过程中,
期刊
<正>国家电投是我国五大发电集团之一,是以电为核心、一体化发展的综合性能源集团。2016年年末电力总装机容量1.17亿千瓦,包括火电、水电、核电、太阳能发电、风电,在全部电
通过对图像颜色的低级物理特征、HSV色彩空间的分析,根据H颜色通道量化区域分界处附近颜色存在的渐变性和混杂性,提出了基于H颜色通道的模糊量化算法.在H颜色通道加入符合人类视
随着新型无线接入和组网技术的不断涌现,无线网络在网络覆盖、网络容量、传输速率、服务质量等方面都得到了迅猛发展,正朝着接入方式多样化、数据传输高速化、普遍移动性和全
大学是学生养成教育的一个重要阶段,要引导学生看曾国藩的书,学习其思想和言行,感悟其行之有效的读书态度和方法,修炼好“内功和外功”,并且让这些“功夫”受益终生。
杭州市高新技术开发区(滨江)的定位是"高科技、多功能、园林化"的城区,科技城文化之一就是"生态、自然".围绕着建设生态型的科技城,我区充分发挥两区管理体制调整后的优势,调
采用密度泛函DFT中的B3LYP计算方法对乙二胺-Pt(Ⅱ)配合物催化烯烃聚合的反应机理进行了研究.计算结果表明,链初始反应是乙烯与活性催化剂Pt(CHNH)2CH3^+配位,然后越过115.31kJ&#183;m
财会标准与税收法规之间的关系 在整体上看,财会与税收是两个分别发展的经济概念,二者的过程和目标都略有差异,所以在财会与税收同时运作时,二者的共同信息将会对财会标准与
期刊
在言语交际中,发话人发出的信息有真也有假,受话人的主观能动性在分析判断话语信息真假时起着重要作用。说话的艺术在于,充分利用受话人的主观能动性,并控制其发展发向;根据