基于大数据的用户特征及活跃度分析

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:liongliong549
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网应用到各行各业,用户在使用各种不同业务的同时产生并积累了大量的历史数据。海量用户数据中蕴藏着丰富的信息,已经成为计算机时代最宝贵的资源。应运而生的数据挖掘技术和云计算技术旨在挖掘用户大数据中蕴含的价值。用户数据中包含用户行为特征,而用户行为通常和多种社会因素和技术参数相关,这些会影响不同场景下用户的角色及特征规律。衡量用户行为的一个很重要的准则是用户活动水平(活跃程度)。本文基于大数据背景,探讨了用户特征,给出了一种基于模糊决策树和回声状态网络算法的用户活跃度预测方案并进行仿真分析,同时对其未来应用发展进行了展望,具体包括以下几个方面:首先,本文介绍了论文的背景并给出相关理论基础知识,包括:结合现有的数据挖掘技术,调研了用户特征及活跃度分析的现状;总结了神经网络和决策树应用于预测的关键技术;讨论了时间序列和公理化模糊集理论。其次,对移动互联网中用户数据特征进行分析,找出存在的一般性规律。再次,为适应用户多维模糊属性的特点,我们将模糊集合理论应用于模糊决策树,并采用模糊决策树生成规则作为神经网络输入层到隐含层的权值,并应用到小波最小复杂度回声状态网络中,生成基于AFS决策树初始化神经网络输入权值的语义算法(SDESN,Semantic Driven Echo State Networks)。该算法继承了小波最小复杂度回声状态网络的结构简单、预测精度高等特点,同时利用模糊决策树进行分类预测时考虑了区间值数据和多值多标签数据中的所有特征,得到模糊概念,克服了二值分类的尖锐性,能够给出介于二值之间软化的中间类别。另外,我们还对SDESN算法进行了性能仿真并对移动互联网的用户活跃度进行预测,在早期阶段跟踪潜在流失客户并为企业决策提供视角。最后,讨论在大数据背景下用户特征及活跃度分析在未来网络中扮演的角色,并给出基于SDESN算法在其中的应用视角。
其他文献
<正>一、前言 福建地处我国东南,属亚热带季风气候,水热资源丰富,又境内多山,地形复杂,生态环境多样,适宜各种类型竹类植物的生长,所以福建竹类物种资源为我国最丰富的省份之
提出了一种基于电压崩溃指数的极限传输容量计算模型和实用化算法。该方法与传统连续性方法相比具有如下四个特点:以原始牛顿法为潮流计算核心,不会出现连续潮流扩展雅可比矩
本文详细地论述了不良货款的成因、类型、控制对策和注意事项。
旅游业能够促进经济的发展,国际旅游更能带来外汇收入,提高海南形象与国际知名度。因此,建设国际旅游岛既具有经济效益也具有社会效益。本文以海南省为例,对其建设国际旅游岛
随着经济全球化的不断发展,越来越多的企业将跨国并购作为"走出去"的重要途径,以期在海外市场寻找新的机会。本文选取光明乳业并购新莱特乳业这一案例,采用事件研究法对其并
后人总是将苏轼、苏辙兄弟二人相提并论,认为他们在各个方面都较相同。本文通过对他们在交游方面异同的考辨,试图揭示兄弟二人思想中的不同之处,以期能够对北宋中后期的政局
学校课程建设是凸显学校特色、推进学校整体改进的有效策略,但学校课程建设只有转化为教师的教与学生的学的教学行为,才能真正实现其预期的设想。因此,从教学论的视角审视、
<正>档案是一种具有资政襄政、服务经济社会发展的社会资源。无论价值多高的档案信息,如果不按特定媒体的传播宗旨和编纂原则去创造,都难以使其纳入信息的传播渠道,其所固有
<正> 制取高锰酸钾时,在锰酸钾电解氧化阶段和在一定的条件下,会出现高锰酸盐结晶在阳极表面而纯化的现象,因而引起电解过程速度和电流效率急剧下降。有可能防止钝化的方法之
目的探讨TLR4、TNF-α在口腔扁平苔藓(OLP)发病中的可能作用。方法采用免疫组化法检测OLP组与正常对照组口腔黏膜蜡块标本中TLR4、TNF-a的表达;采用q RT-PCR法检测TLR4的基因表