基于宽度&深度学习的离网预测模型

来源 :苏州大学 | 被引量 : 0次 | 上传用户:awander
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着4G网络的普及以及互联网的快速发展,电信运营商联合其他公司推出了各种各样的优惠活动吸引用户。这些活动在吸引越来越多新用户入网的同时也导致了老用户加速离网,这种加速离网的现象已经引起了业界的广泛重视。如何在用户离网之前准确预测出用户的离网倾向,从而采取一系列措施挽留用户,减少运营商损失,成为了一个研究的热点。针对电信用户的离网预测问题,业界实验了一系列的机器学习算法。由于近期深度学习技术的快速发展,越来越多的研究开始在离网预测任务中尝试各种神经网络模型。针对现有的基于神经网络的离网预测模型存在的一些问题,本文在电信运营商提供的真实用户数据上,设计构造了一种基于宽度&深度学习的神经网络框架用于离网预测。本文的工作主要有以下三个内容:1)本文提出一种基于宽度&深度学习的离网预测模型框架。加入了交叉积转换的线性模型可以有效的记忆特征间的共现关系,而神经网络则可以自动生成大量复杂的特征组合,具有更好的泛化能力。然而当神经网络的输入包含离散型特征时,可能会存在过度泛化的问题。我们在离网预测任务上借鉴宽度&深度学习的思想,线性模型作为宽度模型,神经网络作为深度模型,将两部分模型组合起来共同训练,从而将两者的优势结合。实验证明,加入了线性模型的神经网络比不加入线性模型的神经网络在PR-AUC上最高可提升5.39%。2)目前应用于离网预测任务的神经网络模型层数都比较浅,当数据量较小时可以比较好的拟合数据。然而随着数据量的增加,仍然使用浅层模型就会导致比较严重的欠拟合问题。本文使用一种较深层的卷积神经网络结构,并在卷积层中尝试加入短连接或门机制来充分拟合大量数据。本文使用的深层的神经网络与作为baseline的浅层网络相比,在PR-AUC上最高可提升72.33%。3)现有的大数据驱动的离网预测模型通常只选择一种时间粒度聚合时序特征,然后在静态特征和聚合的时序特征上探索各种机器学习算法的效果。这样的方法只考虑了模型对分类性能的影响,没有充分考虑数据的作用。本文尝试特征级融合和决策级融合两种方式来同时利用月和日两种时间粒度聚合的特征,在聚合的特征上做一系列的模型训练和模型融合,来进一步提高模型的性能。实验证明,同时进行特征级融合和决策级融合的方法在PR-AUC上最多可以比不进行任何融合的模型提升21.94%。
其他文献
在经济全球化的浪潮中,品牌已成为唯一快速获取利润和发展的基础。一个城市拥有了品牌,就意味着能够吸引更多的外来投资,招来更多的人才。提高城市的竞争力。本文立足于实现我国
建国后中国共产党在对资本主义工商业改造的过程中形成了一系列策略思想.从而使之在社会主义历史上第一次有效地实现了对资产阶级的和平赎买.避免了在生产关系大变革时期通常难
<正>目的Landau-Kleffner综合征(LKS),也称获得性癫痫性失语(AEA),是一种罕见的以认知障碍为主的儿童期癫痫性脑病,长程随访报道不多;本文报告随访9年的1例LKS伴反复睡眠中癫
会议
个别前牙反[牙合]临床上较为常见,打开锁结是矫治的重要环节,尤其是反覆合较深的患者。以往正畸临床多采用活动式[牙合]垫支开咬合锁结,配合固定矫治器治疗个别牙反[牙合],活动式
在相对温和的密闭水相环境中对废印刷线路板中非金属粉末的超声微波协同降解进行了研究。考察了单水热,单微波、单超声及微波超声协同作用下,温度、时间对非金属降解特性的影
蜂窝夹层复合材料是一种重量轻、强度大的高性能复合材料,目前在各行业已得到了广泛的应用。文中应用数值模拟技术对蜂窝结构极限承载力理论进行了验证,并研究了夹层与盖板在
针对目前编队反潜作战仿真领域中模型利用效率和可重用性较低的现状,提出并建立了基于组件技术的编队反潜仿真模型体系结构,依据编队反潜作战实际物理过程对编队反潜作战仿真
随着我国经济的快速发展,交通运输行业也取得了巨大的进步。道路桥梁工程作为交通运输的主要施工内容之一,在分担交通运输压力方面做出了重大贡献。而道路桥梁工程经常会运用
目的研究分析采用放射介入下动脉栓塞方式治疗动脉源性胃出血的效果,以有效指导临床实践。方法 108例动脉源性胃出血患者随机分成对照组和观察组,各54例。对照组临床期间给予
2008年中国健康保险业务规模实现了飞速增长。其中长期护理保险的表现尤其出色,带动了经营该业务的保险公司保费规模剧增,市场份额加大,市场排名大跳跃。但是,我国的长期护理